KR20020019991A - 이미지 데이터 베이스 자료 구축과 검색 시스템 - Google Patents

이미지 데이터 베이스 자료 구축과 검색 시스템 Download PDF

Info

Publication number
KR20020019991A
KR20020019991A KR1020000052781A KR20000052781A KR20020019991A KR 20020019991 A KR20020019991 A KR 20020019991A KR 1020000052781 A KR1020000052781 A KR 1020000052781A KR 20000052781 A KR20000052781 A KR 20000052781A KR 20020019991 A KR20020019991 A KR 20020019991A
Authority
KR
South Korea
Prior art keywords
image
index
word
user
text
Prior art date
Application number
KR1020000052781A
Other languages
English (en)
Inventor
황유동
Original Assignee
임성진
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 임성진 filed Critical 임성진
Priority to KR1020000052781A priority Critical patent/KR20020019991A/ko
Publication of KR20020019991A publication Critical patent/KR20020019991A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 임의의 자료에 대한 데이터 베이스 자료 구축과 그에 관련한 검색시스템에 관한 것으로 특히, 텍스트 형태의 자료 구축이 아닌 이미지 타입의 자료에 대해 그래픽 코드 부여 방식을 이용하여 사용자가 편리하게 자신의 데이터 베이스를 구축하고 자기 개인의 모든 자료를 원본 그대로 컴퓨터에 저장해 놓고 필요할 때 자유롭게 검색, 편집 혹은 프린터로 출력하여 사용할 수 있도록 하기 위한 이미지 데이터 베이스 자료 구축과 검색시스템에 관한 것으로 종래의 모든 검색 시스템들이 결과적으로 컴퓨터가 인식할 수 있는 텍스트 형식의 자료에 국한되기 때문에 실제적으로 현존하는 많은 문서 혹은 이미지들에 대한 데이터 베이스를 구축하기 위해서는 매우 고가의 용역을 통해서 많은 시간과 비용을 들여야만 하기 때문에 개인이나 소규모의 영업장 등에서는 가히 엄두를 내지 못하고 있으며 이로 인해 실제 많은 가치있는 정보들이 사장되는 문제점을 해소할 수 있다.

Description

이미지 데이터 베이스 자료 구축과 검색 시스템{System for retrieving and structuring image data}
본 발명은 임의의 자료에 대한 데이터 베이스 자료 구축과 그에 관련한 검색시스템에 관한 것으로 특히, 텍스트 형태의 자료 구축이 아닌 이미지 타입의 자료에 대해 그래픽 코드 부여 방식을 이용하여 사용자가 편리하게 자신의 데이터 베이스를 구축하고 자기 개인의 모든 자료를 원본 그대로 컴퓨터에 저장해 놓고 필요할 때 자유롭게 검색, 편집 혹은 프린터로 출력하여 사용할 수 있도록 하기 위한 이미지 데이터 베이스 자료 구축과 검색시스템에 관한 것이다.
일반적으로, 컴퓨터 시스템의 발전과 더불어 정보의 저장형식이 서적이나 마이크로 필름 등의 형태에서 CD 롬이나 LD등의 디지털 적인 저장매체의 형태로 전환되고 있다. 상술한 바와 같은 디지털 저장매체들의 장점은 대용량의 활자 데이터나영상 및 음향에 대한 데이터가 저장되면서도 매우 콤펙트(compact)한 저장매체의 부피를 유지할 수 있다는 장점을 가지고 있다.
또한, 통신분야의 발전에 힘입어 어떤 특정인이 소장하고 있는 정보의 범위는 줄어들고 불특정 다수의 사람들과 공유하는 경우가 늘어나고 있다. 즉, 매우 특정한 정보(개인적 사생활, 연구, 국가기밀, 회사기밀 등등)를 제외하고는 통신망에 연결된 가입자간에 서버측에서 저장되어 있는 정보들을 공유하게 되는 것이다.
따라서, 대용량의 정보를 검색하거나 저장하기 위한 특정의 방식들이 제안되고 있으며, 이들의 통일안이 제안되고 있다. 그러므로, 데이터가 특정인에게 정보로서 가치를 발휘하기 위해서는 빠른 검색이 필요하며, 더불어 빠른 검색이 이루어질 수 있도록 데이터의 저장방식에 따른 물리 계층적인 구조가 저장되어 있는 데이터의 양식에 따라 합리적으로 설정되어 있어야한다.
그에 따라, 근래까지 제안된 방식중에 가장 대표적이라 할 수 있는 방식이 색인어(정의되어 있는 주제어나 핵심어 또는 문장중 사용자가 정의한 단어)를 이용한 방식이며, 이러한 색인어를 검색하는 모듈이 정보 검색기라는 것으로, 상기 정보검색기는 유용한 문서의 주제어나 핵심어(즉 키워드)를 검색을 위한 특정 머쉰(mashine)을 사용하여 자동으로 찾아내는 색인과 사용자의 요구 즉, 질의에 적합한 문서를 찾아내는 검색으로 구분되어 진다.
이때, 색인에서 문서의 키워드를 찾아내어진 용어를 색인어라고 하는데, 이러한 색인어를 자동으로 추출하는 방법은 크게두 부류로 나타낼 수 있다.
첫 번째 분류는 어구의 출현빈도를 고려하는 통계적인 방식이다. 여기에는 단순 빈도에 의한 추출법(Luhn의 모델), 확률을 이용하는 방법(2 Poisson 모델), 분산을 이용하는 방법(Dennis-Salton 모델), 문서를 n차원(n개의 색인어)의 벡터로표현하는 벡터공간모델(Vector Space Model) 등을 들 수 있다.
또한, 두 번째 분류는 1984년 일본에서 자동색인부에 관한 동향에 대한 보고형식문인 제교정행에 나타나 있는 바와 같이, 언어정보를 이용하여 문서의 의미를 바탕으로 하여 색인어를 추출하려는 방식이다.
그러나, 상술한 바와 같은 키워드를 추출하는 방식에서의 통계적인 방법이나 언어정보를 이용하는 방법 모두 다 완벽하게그 문서가 가지는 식별력을 나타내지 못한다. 뿐만 아니라, 적절한 용어를 제외시킬 수 있어서 사용자의 질의에 대해 적합한 문서를 검색하기에는 미흡한 점이 있다.
상술한 바와 같은 내용에 대한 상세한 내용은 다음의 참고문헌을 참조하면 상세히 알 수 있을 것이므로 자세한 설명은 생략한다(참조문헌: Joel L. Fagan, Automatic Phrase Indexing for Document Retrieval: An Example of Syntaticand Non-Syntatic Methods, ACM, 1987, pp.91-101).
더욱이, 기본적으로 키워드를 추출하는 방식에서의 통계 및 확률방식에서는 긴 문서에 대해 적합하지 않다. 그러한 원인으로는 긴 문서의 경우, 문서 내에 있는 여러 가지 주제들에 대해서 모두 다 적합한 색인어를 추출하기에는 적합하지 않기 때문이다. 그러므로 이와 같은 방식의 정보 검색 시스템들은 주로 요약문이나신문 기사등과 같은 주제가 일정하면서 짧은 문서에 대해서만 처리하여 왔으며, 상술한 바와 같은 내용에 대한 상세한 내용은 다음의 참고문헌을 참조하면 상세히 알 수 있을 것이므로 자세한 설명은 생략한다(참조문헌: G. Salton, J. Allen and Chris Bukkely, Approach toPassage Retrieval in Full Text Information System, SIGIR'93, 1993, pp.49-58).
따라서, 상술한 바와 같은 문제점을 극복하기 위해서는 긴 문서에 대한 처리를 강구하여야만 하였으며, 여러 가지의 키워드를 색인어로 하는 시스템에서의 문제점에 의해 문서의 전문을 색인하여 검색을 하는 시스템에 대한 필요성을 느끼게 되었다. 그러나, 상기와 같은 요구는 전문 정보 검색을 할 경우에 색인어에 대한 과다에 의해서 발생하는 저장 용량의 증가와 질의 처리시 생기는 검색공간이 너무 커지는데 대하여 성능의 감소에 대한 문제점을 가지고 있다.
상술한 바와 같은 성능의 감소에 대한 문제점을 해소하기 위한 대표적인 방식이 저장하게 되는 문서 데이터베이스(Text Database)를 압축(Compression)하는 방식으로, 상술한 바와 같은 내용에 대한 상세한 내용은 다음의 참고문헌을 참조하면 상세히 알 수 있을 것이므로 자세한 설명은 생략한다.
참조문서
1. Justin Zobel, Alistair Moffat, Ron Sacks-Davis, An Efficient Indexing Technique for Full-TextDatabase System, Proceeding of the-18th VLDB Conference Vancouver, British Columbia, 1992, pp.352-362 .
2. Gordon Linoff and Craig Stanfill, Compression of Indexes withFull Positional Information in VeryLarge Text Database, SIGIR'93, 1993, pp.88-95 .
3. Y. Choueka, A.S. Fraenkel, S.T. Klein, Compression of Concordances of Concordances in Full-TextRetriever System, ACM, 1988, pp.597-613 .
따라서, 문서에 포함된 모든 단어에 대해서 색인을 하고, 색인에 의해 저장된 문서 하부 구조로부터 사용자의 요구에 대하여 검색하는 정보 검색 모델이 제안되어지는데, 이를 전문 정보 검색이라 칭한다. 또한, 전문 정보 검색 시스템은 전문서의 정보를 손실 없이 가진다는 장점을 특징으로 한다. 이로 인하여 새로운 기법과 기존의 방법에 대하여 적용 가능하다는 장점을 부가적으로 가진다.
반면에, 사용자의 질의에 대한 처리는 기존의 방법과는 약간 다르게 된다. 주로 현재의 전문 정보 검색 시스템들은 사용자의 질의에 나타나는 용어(Term)에 정확하게 일치하는 용어를 가진 문서만을 사용자에게 보여준다. 이러한 방법을 사용하는 이유는 기존의 색인어가 가지는 문서 내에서의 가중치를 추출하는 방법과 문서 순위(Document Ranking)에 대한 어려움 때문이다. 그 이유는 전문을 색인하는 문서에서는 문서의 크기가 커서 한 문서내에 주제가 여러 가지를 가질 수 있기 때문이다.
따라서, 문서 내에서 논리적인 단위로 다르게 색인하여 기존의 방법과 같이 문서내에서 어느 부분이 가장 일치되었는가를 보여주기도 한다. 또한, 전문 정보 검색은 인용문을 검색하는 시스템에서 사용된다.
그러나, 상술한 방식들은 모두 텍스트 형식의 자료의 데이터 베이스 구축 및 그에 따른 검색방식이다. 즉, 컴퓨터에 어떤 자료를 입력시키기 위한 방법으로는 키보드를 이용해서 손으로 타자기처럼 입력하는 방법이 있으나 이는 많은 문서를 입력시키기에는 너무 많은 노력과 시간이 걸리며 더욱 그림은 곤란하게 된다.
상술한 곤란한 점을 극복하기 위해 스캐너라는 제품이 개발되어 스캐너를 컴퓨터에 연결하고 일반의 복사기로 문서나 그림을 복사하는 것과 같은 방법으로 컴퓨터에 자료를 입력시키는 방법이 있다. 하지만 스캐너로 자료를 입력시키게 되면 컴퓨터가 입력된 자료를 글자나 그림 모두 그림으로만 인식하게 된다.
결과적으로 컴퓨터가 모든 자료를 그림으로만 인식하게되면 너무 많은 저장용량을 차지하게 되어 매우 곤란하지만 이는 자료를 압축하는 기술이 개발되어 별로 큰 문제가 없이 해결 할 수 있게 되었다.
하지만 컴퓨터가 모두 자료를 그림으로만 인식하게 되어 자기가 찾고자하는 부분을 바로 간단히 찾을 수 있는 방법 즉 검색이 아주 어렵게되어 이 문제가 아주 곤란하게 된다.
따라서, 상술한 모든 검색 시스템들이 결과적으로 컴퓨터가 인식할 수 있는 텍스트 형식의 자료에 국한되기 때문에 실제적으로 현존하는 많은 문서 혹은 이미지들에 대한 데이터 베이스를 구축하기 위해서는 매우 고가의 용역을 통해서 많은 시간과 비용을 들여야만 하기 때문에 개인이나 소규모의 영업장 등에서는 가히 엄두를 내지 못하고 있으며 이로 인해 실제 많은 가치있는 정보들이 사장되는 경우가 문제점으로 제시되고 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은 임의의 자료에 대한 데이터 베이스 자료 구축과 그에 관련한 검색시스템에 관한 것으로 특히, 텍스트 형태의 자료 구축이 아닌 이미지 타입의 자료에 대해 그래픽 코드 부여 방식을 이용하여 사용자가 편리하게 자신의 데이터 베이스를 구축하고 자기 개인의 모든 자료를 원본 그대로 컴퓨터에 저장해 놓고 필요할 때 자유롭게 검색, 편집 혹은 프린터로 출력하여 사용할 수 있도록 하기 위한 이미지 데이터 베이스 자료 구축과 검색시스템을 제공하는 데 있다.
도 1은 본 발명에 따른 이미지 색인과정의 개략적인 개념 순서도.
도 2는 본 발명에 따른 이미지 색인 검색과정의 개략적인 개념 순서도.
도 3은 본 발명을 실행시키기 위한 프로그램 모듈의 구성 예시도.
도 4a와 도 4b는 본 발명이 적용되는 이미지의 예시도.
도 5내지 도 9는 본 발명에 따른 상세 동작 순서도.
상기 목적을 달성하기 위한 본 발명에 따른 이미지 데이터 베이스 자료 구축과 검색 시스템의 특징은, 사용자가 이미지 처리되는 문서의 추후 검색을 위한 색인어의 입력을 요청한 경우 사용자가 입력시키는 색인어를 특정한 바코드 형식 혹은 픽셀(pixel) 형태의 이미지로 변환시키는 색인어 이미지 변환부와; 스케너를 이용하여 스케닝하면 스케닝 되어진 이미지의 전체 영역중 사용자가 선택한 임의의 위치에 상기 색인어 이미지 변환부를 통해 변환되어진 색인어 이미지를 오버랩시켜 새로운 하나의 이미지를 생성시키는 이미지 합성부와; 상기 이미지 합성부에서 이미지의 합성을 하면서 저장하기 위해 기록하는 파일명칭과 상기 색인어 이미지 변환부를 통해 변환되는 색인어들을 입력받아 대응시켜 목록데이터를 생성시키는 색인 목록부와; 사용자가 이미지 처리되어진 이미지 파일중에서 특정한 이미지만을 검색하고자 하는 경우 그에 따른 검색어를 입력받아 상기 색인 목록부에 기록되어있는 색인 목록을 통해 해당 검색어를 포함하고 있는 이미지 파일의 명칭을 검출하는 검색어 처리부와; 상기 검색어 처리부를 통해 검출되어진 이미지 파일들을 액세스하여 이미지 영상을 기억하고 영상 이미지 스케닝 기법에 따라 오버랩되어진 색인어 이미지를 추출하는 색인 이미지 추출부와; 상기 색인 이미지 추출부에서 추출되어진 색인 이미지를 텍스트 형태로 변환하는 이미지 텍스트 변환부; 및 상기 이미지 텍스트 변환부를 통해 변환되어진 텍스트를 기준으로 사용자가 입력시킨 검색어와 동일성여부를 판별하고 동일하다고 판단되는 경우에 한하여 해당 텍스트에 포함되어 있는 좌표값에 따른 이미지 영역을 포토샵 기법에 의해 추출한 후 디스플레이하는 이미지 영역 검출부를 포함하는 데 있다.
본 발명의 상술한 목적과 여러 가지 장점은 이 기술 분야에 숙련된 사람들에 의해 첨부된 도면을 참조하여 후술되는 발명의 바람직한 실시 예로부터 더욱 명확하게 될 것이다.
우선, 본 발명에서 적용되는 기술적 사상을 첨부한 도 1과 도 2를 참조하여 간략히 살펴보면, 첨부한 도 1은 본 발명에 따른 이미지 색인과정의 개략적인 개념 순서도이며, 도 2는 본 발명에 따른 이미지 색인 검색과정의 개략적인 개념 순서도이다.
도 1에 도시되어 있는 순서에 입각하여 그 이미지 색인과정의 동작을 살펴보면, 사용자는 스케너를 이용하여 저장하고자 하는 문서를 스텝 S11의 과정을 통해 이미지 데이터로 생성시킨다. 이러한 과정을 수행하면서 해당 문서의 주요 부분에 대해 이미지 검색을 수행할 수 있도록 하기 위한 색인어를 스텝 S12의 과정을 통해설정한다.
이때, 일반적으로 컴퓨터는 스캐닝되어진 문서를 하나의 이미지로만 인식하기 때문에 설정된 색인어와 그 색인어를 이용한 검색을 수행하는데 있어 판단의 근거를 제시할 수 없기 때문에 설정된 색인어 역시 바코드 형식 혹은 픽셀(pixel)형태의 이미지로 스텝 S13의 과정을 통해 변환시키고 이때 변환되는 색인어 이미지내에는 전체 이미지 영역중 본 색인어 이미지와 대응하는 이미지의 영역이 좌표값의 형태로 함께 저장된다.
이후, 스텝 S13의 과정을 통해 이미지로 변환되어진 색인어를 원래 상기 스텝 S11의 과정을 통해 이미지 데이터로 변환되어진 문서의 임의의 위치에 오버랩시켜 새로운 이미지 파일로 저장되어진다.
이러한 경우를 본 발명에서는 그래픽코드 부여방식이라고 하며 G.C.S(Graphic Code System)로 약칭한다.
상술한 바와 같이 자료로 저장된 이미지 파일은 컴퓨터 내부의 저장수단에 저장되고, 추후 사용자가 요청하는 경우 액세스 되는 것이다.
이하에서는 첨부한 도 2에 도시되어 있는 순서에 입각하여 그 이미지 색인 검색과정의 동작을 살펴보기로 한다. 사용자가 스텝 S21의 과정을 통해 자신이 찾고자 하는 이미지를 검색하기 위한 검색어를 입력시키면, 컴퓨터는 자신의 저장수단내에 저장되어 있는 모든 이미지 자료를 액세스(S22)한 후에 순차적으로 이미지 스케닝(S23)을 수행하게 된다.
이때, 스텝 S23의 과정을 통해 이미지 스케닝을 수행하는 가운데 이미지 파일에서 색인어 이미지 즉, 상기 스텝 S13의 과정을 통해 생성되어진 바코드 형식 혹은 픽셀(pixel) 형태의 이미지를 검출하게되면 이를 번역하여 사용자가 입력시킨 검색어와 동일한가를 비교판단하게 된다.
이상의 과정은 사용자가 입력시킨 검색어와 동일한 색인어가 검출될 때까지 지속되며, 동일하다고 판단되는 색인어 이미지가 검출되는 경우 해당 색인어 이미지 내부에 포함되어 있는 좌표값으로 이루어진 영역 데이터에 대응하는 이미지만을 전체 이미지에서 추출(S26)한다.
상기 스텝 S26에서 추출된 이미지는 포토샵 등과 같은 이미지 편집 기능에 의해 스텝 S27의 과정에서 디스플레이되어 사용자는 이미지 파일중 자신이 검색하고자 하는 부분의 이미지 데이터를 확인할 수 있는 것이다.
상술한 이미지 색인어 생성 및 추출과정은 본 발명의 개념을 설명하기 위한 것이며 추출과정은 첨부한 도 2에 도시되어 있는 바와 같이 이미지 스캐닝 방식이 아니라 목록형식의 데이터베이스를 따로 구축하고, 구축된 데이터 베이스 목록에서 미리 해당하는 이미지 파일의 위치 및 저장명을 검색한 후 해당하는 이미지 파일만을 검색하는 것이 보다 효과적이라 할 수 있다.
첨부한 도 3은 본 발명을 실행시키기 위한 프로그램 모듈의 구성 예시도로서, 그 구성 및 동작을 첨부한 도 4a와 도 4b를 참조하여 살펴보면, 특정한 문서 를 스캐너를 이용하여 스캐닝하면 스캐닝 되어진 이미지(첨부한 도 4a 참조)를 임시 저장하는 원문 이미지 임시 저장부(100)와, 사용자가 이미지 처리되는 문서의 추후 검색을 위한 색인어의 입력을 요청한 경우 사용자가 입력시키는 색인어를 특정한 바코드 형식 혹은 픽셀(pixel) 형태의 이미지로 변환시키는 색인어 이미지 변환부(110)와, 상기 원문 이미지 임시 저장부(100)에 저장되어 있는 이미지의 영역중 사용자가 선택한 임의의 위치에 상기 색인어 이미지 변환부(110)를 통해 변환되어진 바코드 형식 혹은 픽셀(pixel) 형태의 색인어 이미지를 오버랩시켜 새로운 하나의 이미지(첨부한 도 4b 참조)를 생성시키는 이미지 합성부(120)와, 상기 이미지 합성부(120)에서 합성되어진 이미지 파일들을 저장하는 이미지 저장부(130)와, 상기 이미지 합성부(120)에서 이미지의 합성을 하면서 저장하기 위해 기록하는 파일명칭과 상기 색인어 이미지 변환부(110)를 통해 변환되는 색인어들을 입력받아 대응시켜 목록데이터를 생성시키는 색인 목록부(140)와, 사용자가 이미지 처리되어진 이미지 파일중에서 특정한 이미지만을 검색하고자 하는 경우 그에 따른 검색어를 입력받아 상기 색인 목록부(140)에 기록되어 있는 색인 목록을 통해 해당 검색어를 포함하고 있는 이미지 파일의 명칭을 검출하는 검색어 처리부(150)와, 상기 검색어 처리부(150)를 통해 검출되어진 이미지 파일들을 액세스하여 이미지 영상을 기억하는 이미지 액세스부(160)와, 상기 이미지 액세스부(160)에서 액세스한 이미지 파일을 영상 이미지 스캐닝 기법에 따라 스캐닝하여 오버랩되어진 색인어 이미지를 추출하는 색인 이미지 추출부(170)와, 상기 색인 이미지 추출부(170)에서 추출되어진 색인 이미지를 텍스트 형태로 변환하는 이미지 텍스트 변환부(180), 및 상기 이미지 텍스트 변환부(180)를 통해 변환되어진 텍스트를 기준으로 사용자가 입력시킨 검색어와 동일성여부를 판별하고 동일하다고 판단되는 경우에 한하여 해당 텍스트에 포함되어 있는 좌표값에 따른 이미지 영역을 포토샵 기법에 의해 추출한 후 모니터측에 디스플레이하는 이미지 영역 검출부(190)로 구성된다.
상술한 바와 같이 구성되는 본 발명에 따른 프로그램 모듈의 구성을 기준으로 그 동작을 살펴보면, 사용자는 스캐너를 이용하여 저장하고자 하는 문서(첨부한 도 4a 참조)를 스캐닝하면 이는 원문이미지 임시저장부(100)에 기록되어진다.
이때, 사용자가 이미지 처리되는 문서의 추후 검색을 위한 색인어의 입력을 요청한 경우 색인어 이미지 변환부(110)에서는 사용자가 입력시키는 색인어를 특정한 바코드 형식 혹은 픽셀(pixel) 형태의 이미지로 변환시키게 되는데, 예를 들어 "표제"와 "호텔전경"이라는 색인어를 선택했다고 가정하고 이 부분은 픽셀(pixel) 형태의 이미지로 변환되었다고 가정한다.
이후, 이미지 합성부(120)에서는 상기 원문 이미지 임시 저장부(100)에 저장되어 있는 이미지의 영역중 사용자가 선택한 임의의 위치에 상기 색인어 이미지 변환부(110)를 통해 변환되어진 픽셀(pixel) 형태의 색인어 이미지를 오버랩시켜 새로운 하나의 이미지(첨부한 도 4b 참조)를 생성시키게 된다.
이때, 첨부한 도 4b에서 참조번호 A로 표시되는 영역이 "표제" 라는 색인어를 픽셀(pixel) 형태의 색인어 이미지로 변환하여 오버랩시킨 것이며, 첨부한 도 4b에서 참조번호 B로 표시되는 영역이 "호텔전경"라는 색인어를 픽셀(pixel) 형태의 색인어 이미지로 변환하여 오버랩시킨 것이다.
또한, 상기 참조번호 A와 B로 표시되는 색인어 이미지내에는 전체 이미지 영역중 본 색인어 이미지와 대응하는 이미지의 영역이 좌표값의 형태로 함께 저장된다.
따라서, 첨부한 도 4b로 이미지 합성된 이미지 파일을 이미지 저장부(130)에 저장하되, 색인 목록부(140)에는 상기 이미지 합성부(120)에서 이미지의 합성을 하면서 상기 이미지 저장부(130)에 저장하기 위해 기록하는 파일명칭과 상기 색인어 이미지 변환부(110)를 통해 변환되는 색인어 (여기서는 표제와 호텔전경)들을 입력받아 대응시켜 목록데이터를 형성시킨다.
상술한 과정을 통해 이미지 처리되는 자료들이 축적되게되는데, 만약 사용자가 임의의 이미지를 검색하고자 하는 경우 키보드를 통해 검색어를 입력시키면, 검색어 처리부(150)에서는 상기 색인 목록부(140)에 기록되어 있는 색인 목록을 통해 해당 검색어에 대응하는 색인이 존재하였는가를 판단하게 된다.
이때, 만약 사용자의 검색어가 "호텔전경" 이였다고 가정하면, 상기 검색어 처리부(150)에서는 호텔전경이라는 색인어가 존재하는 가를 검색하고 존재하는 경우 그에 대응하는 이미지 파일을 액세스하도록 이미지 액세스부(160)를 제어한다.
상기 이미지 액세스부(160)는 상기 검색어 처리부(150)를 통해 첨부한 도 4b에 도시되어 있는 바와 같은 이미지를 액세스하여 이미지 영상을 기억하고, 색인 이미지 추출부(170)에서는 상기 이미지 액세스부(160)에서 액세스한 이미지 파일을 영상 이미지 스케닝 기법에 따라 스케닝하여 오버랩되어진 참조번호 A와 B로 표시되는 색인어 이미지를 추출하게 되는 것이다.
이후, 이미지 텍스트 변환부(180)에서는 상기 색인 이미지 추출부(170)에서 추출되어진 색인 이미지를 텍스트 형태로 변환하고, 이미지 영역 검출부(190)에서는 상기 이미지 텍스트 변환부(180)를 통해 변환되어진 텍스트를 기준으로 사용자가 입력시킨 검색어와 동일성여부를 판별하고 동일하다고 판단되는 경우에 한하여 해당 텍스트에 포함되어 있는 좌표값에 따른 이미지 영역을 포토샵 기법에 의해 추출한 후 모니터측에 디스플레이하게 되는 것이다.
상술한 동작을 보다 상세히 풀어놓은 것이 첨부한 도 5내지 도 9에 도시되어 있는 동작 순서도이다.
이상의 설명에서 본 발명은 특정의 실시예와 관련하여 도시 및 설명하였지만, 특허청구범위에 의해 나타난 발명의 사상 및 영역으로부터 벗어나지 않는 한도 내에서 다양한 개조 및 변화가 가능하다는 것을 당업계에서 통상의 지식을 가진 자라면 누구나 쉽게 알 수 있을 것이다.
이상 설명한 바와 같이 본 발명에 따를 이미지 데이터 베이스 자료 구축과 검색 시스템을 제공하면, 종래의 모든 검색 시스템들이 결과적으로 컴퓨터가 인식할 수 있는 텍스트 형식의 자료에 국한되기 때문에 실제적으로 현존하는 많은 문서 혹은 이미지들에 대한 데이터 베이스를 구축하기 위해서는 매우 고가의 용역을 통해서 많은 시간과 비용을 들여야만 하기 때문에 개인이나 소규모의 영업장 등에서는 가히 엄두를 내지 못하고 있으며 이로 인해 실제 많은 가치있는 정보들이 사장되는 문제점을 해소할 수 있다.

Claims (1)

  1. 사용자가 이미지 처리되는 문서의 추후 검색을 위한 색인어의 입력을 요청한 경우 사용자가 입력시키는 색인어를 특정한 바코드 형식 혹은 픽셀(pixel) 형태의 이미지로 변환시키는 색인어 이미지 변환부와;
    스케너를 이용하여 스케닝하면 스케닝 되어진 이미지의 전체 영역중 사용자가 선택한 임의의 위치에 상기 색인어 이미지 변환부를 통해 변환되어진 색인어 이미지를 오버랩시켜 새로운 하나의 이미지를 생성시키는 이미지 합성부와;
    상기 이미지 합성부에서 이미지의 합성을 하면서 저장하기 위해 기록하는 파일명칭과 상기 색인어 이미지 변환부를 통해 변환되는 색인어들을 입력받아 대응시켜 목록데이터를 생성시키는 색인 목록부와;
    사용자가 이미지 처리되어진 이미지 파일중에서 특정한 이미지만을 검색하고자 하는 경우 그에 따른 검색어를 입력받아 상기 색인 목록부에 기록되어 있는 색인 목록을 통해 해당 검색어를 포함하고 있는 이미지 파일의 명칭을 검출하는 검색어 처리부와;
    상기 검색어 처리부를 통해 검출되어진 이미지 파일들을 액세스하여 이미지 영상을 기억하고 영상 이미지 스케닝 기법에 따라 오버랩되어진 색인어 이미지를 추출하는 색인 이미지 추출부와;
    상기 색인 이미지 추출부에서 추출되어진 색인 이미지를 텍스트 형태로 변환하는 이미지 텍스트 변환부; 및
    상기 이미지 텍스트 변환부를 통해 변환되어진 텍스트를 기준으로 사용자가 입력시킨 검색어와 동일성여부를 판별하고 동일하다고 판단되는 경우에 한하여 해당 텍스트에 포함되어 있는 좌표값에 따른 이미지 영역을 포토샵 기법에 의해 추출한 후 디스플레이하는 이미지 영역 검출부를 포함하는 것을 특징으로 하는 이미지 데이터 베이스 자료 구축과 검색 시스템.
KR1020000052781A 2000-09-06 2000-09-06 이미지 데이터 베이스 자료 구축과 검색 시스템 KR20020019991A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000052781A KR20020019991A (ko) 2000-09-06 2000-09-06 이미지 데이터 베이스 자료 구축과 검색 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000052781A KR20020019991A (ko) 2000-09-06 2000-09-06 이미지 데이터 베이스 자료 구축과 검색 시스템

Publications (1)

Publication Number Publication Date
KR20020019991A true KR20020019991A (ko) 2002-03-14

Family

ID=19687745

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000052781A KR20020019991A (ko) 2000-09-06 2000-09-06 이미지 데이터 베이스 자료 구축과 검색 시스템

Country Status (1)

Country Link
KR (1) KR20020019991A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100426340B1 (ko) * 2000-11-10 2004-04-08 주식회사 한국인식기술 문서관리시스템 및 그 방법
CN101841613A (zh) * 2009-03-18 2010-09-22 富士施乐株式会社 文档处理系统、检索装置、信息检索方法及文档处理方法
US11961217B2 (en) 2020-12-29 2024-04-16 Pusan National University Industry—University Cooperation Foundation Device and method for storing image data for surface defect detection scanner

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100426340B1 (ko) * 2000-11-10 2004-04-08 주식회사 한국인식기술 문서관리시스템 및 그 방법
CN101841613A (zh) * 2009-03-18 2010-09-22 富士施乐株式会社 文档处理系统、检索装置、信息检索方法及文档处理方法
AU2009212993B2 (en) * 2009-03-18 2011-03-17 Fujifilm Business Innovation Corp. Document processing system, search apparatus, information searching method, document processing method and program
CN101841613B (zh) * 2009-03-18 2014-03-12 富士施乐株式会社 文档处理系统、检索装置、信息检索方法及文档处理方法
US11961217B2 (en) 2020-12-29 2024-04-16 Pusan National University Industry—University Cooperation Foundation Device and method for storing image data for surface defect detection scanner

Similar Documents

Publication Publication Date Title
JP3936862B2 (ja) 推薦システム及び推薦方法
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
US10614366B1 (en) System and method for multimedia ranking and multi-modal image retrieval using probabilistic semantic models and expectation-maximization (EM) learning
US6772148B2 (en) Classification of information sources using graphic structures
US6169998B1 (en) Method of and a system for generating multiple-degreed database for images
Srihari et al. Intelligent indexing and semantic retrieval of multimodal documents
US20020002547A1 (en) Information retrieval apparatus and information retrieval method
CA2572116A1 (en) System and method for processing multi-modal communication within a workgroup
WO2003032199A2 (en) Classification of information sources using graph structures
Ang et al. LifeConcept: an interactive approach for multimodal lifelog retrieval through concept recommendation
TW200939143A (en) A data management system
KR101651963B1 (ko) 시공간 연관 정보 생성 방법, 이를 수행하는 시공간 연관 정보 생성 서버 및 이를 저장하는 기록매체
Lewis et al. Towards multimedia thesaurus support for media-based navigation
KR20020019991A (ko) 이미지 데이터 베이스 자료 구축과 검색 시스템
Vrochidis et al. A hybrid ontology and visual-based retrieval model for cultural heritage multimedia collections
JP2004151882A (ja) 情報出力制御方法、情報出力処理システム、プログラム
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
US20030187829A1 (en) Content retrieval apparatus and method
JP4480109B2 (ja) 画像管理装置および画像管理方法
KR100254803B1 (ko) 컴퓨터 시스템 상에서 한국어 전문 정보 검색을위한 시스템
JP3379985B2 (ja) 翻訳例文検索装置
Al-Hawamdeh et al. Compound document processing system
Croft NSF center for intelligent information retrieval
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
Bulcao-Neto et al. The use of latent semantic indexing to mitigate OCR effects of related document images

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Withdrawal due to no request for examination