KR20150031087A - 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치 - Google Patents

지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치 Download PDF

Info

Publication number
KR20150031087A
KR20150031087A KR20130110606A KR20130110606A KR20150031087A KR 20150031087 A KR20150031087 A KR 20150031087A KR 20130110606 A KR20130110606 A KR 20130110606A KR 20130110606 A KR20130110606 A KR 20130110606A KR 20150031087 A KR20150031087 A KR 20150031087A
Authority
KR
South Korea
Prior art keywords
document
knowledge structure
keyword
documents
similarity
Prior art date
Application number
KR20130110606A
Other languages
English (en)
Other versions
KR101538998B1 (ko
Inventor
이문용
정원철
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020130110606A priority Critical patent/KR101538998B1/ko
Priority to US14/045,707 priority patent/US20150081657A1/en
Publication of KR20150031087A publication Critical patent/KR20150031087A/ko
Application granted granted Critical
Publication of KR101538998B1 publication Critical patent/KR101538998B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion

Abstract

본 발명은 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치에 관한 것으로,
상기 검색 서비스 제공 방법은 사용자가 입력한 쿼리에 대응되는 문서를 검색 및 제공하는 단계; 상기 문서에 대응되는 지식 구조를 생성하여 추가 제공하는 단계; 상기 지식 구조에 포함된 다수의 키워드 중 하나가 선택되면, 상기 키워드를 포함하는 관련 문서들을 추가 검색하는 단계; 상기 관련 문서들의 지식 구조와 상기 문서의 지식 구조를 비교 분석하여 문서간 유사도를 계산하는 단계; 및 상기 유사도 계산 결과를 기반으로 문서 추천 동작 또는 문서 제공 동작을 수행하는 단계를 포함할 수 있다.

Description

지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치{METHOD AND APPARATUS FOR PROVIDING SEARCH SERVICE BASED ON KNOWLADGE SERVICE}
본 발명은 검색 서비스 제공 기술에 관한 것으로, 특히 정보 각각의 지식 구조를 파악한 후, 이를 기반으로 사용자가 필요로 하는 정보를 검색 및 제공할 수 있도록 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치에 관한 것이다.
지식사회 또는 정보사회라고 명명되는 현 사회에서는 지식적 업무의 능력이 사회 생산성의 큰 관건이며 이러한 업무 능력의 핵심이 되는 지식정보는 끊임없이 쏟아져 나와 제타바이트(Zeta Byte) 시대가 도래하였다.
이러한 시대의 변화 속에 사람들의 지식 정보에 대한 욕구는 더욱 복잡하고 다양해졌지만, 이전의 지식 정보 검색 방법은 주로 사용자가 제출한 쿼리(query)만을 기반으로 지식 정보를 검색할 뿐 이였다.
그러나 최근에 들어, 검색어간 연관 개념을 검색에 적용하는 연구가 이루어지기 시작하였으며, 그 결과 사용자가 제출한 쿼리(query)를 기반으로 검색어를 확장하는 쿼리 확장(Query extension)이 제안되었다.
쿼리 확장은 쿼리에 사용되는 검색어의 수를 유의어 사전(thesaurus)이나 외부 리소스(resource)를 사용하여 확장시키는 개념이나, 이는 확장되는 검색어 간의 관계를 고려하지 못하며, 확장되는 검색어 수도 제한되는 문제가 있다. 또한 쿼리 확장은 근본적으로 문서에 내포된 단어 간의 연관 관계를 반영하지 못하는 단점도 있다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 문서내 중요 키워드를 추출하여 그들 간의 관계를 지식 구조로 표현한 후, 이를 참고하여 사용자가 필요로 하는 정보를 검색 및 서비스할 수 있도록 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치를 제공하는데 있다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일 실시 예에 따른 지식 구조를 기반으로 한 검색 서비스 제공 방법은 사용자가 입력한 쿼리에 대응되는 문서를 검색 및 제공하는 단계; 상기 문서에 대응되는 지식 구조를 생성하여 추가 제공하는 단계; 상기 지식 구조에 포함된 다수의 키워드 중 하나가 선택되면, 상기 키워드를 포함하는 관련 문서들을 추가 검색하는 단계; 상기 관련 문서들의 지식 구조와 상기 문서의 지식 구조를 비교 분석하여 문서간 유사도를 계산하는 단계; 및 상기 유사도 계산 결과를 기반으로 문서 추천 동작 또는 문서 제공 동작을 수행하는 단계를 포함할 수 있다.
상기 문서간 유사도를 계산하는 단계는 상기 지식 구조에 포함된 다수의 키워드 중 하나가 선택되면, 상기 키워드를 포함하는 관련 문서들을 추가 검색하는 단계; 상기 관련 문서들 각각의 지식 구조를 파악한 후, 상기 지식 구조에 포함된 키워드를 추출하는 단계; 상기 관련 문서들을 제1 방향의 항목 정보로, 상기 추출된 키워드를 제1 방향에 수직되는 제2 방향의 항목 정보로 활용하여 2차원 구조의 문서간 키워드 유사도 매트릭스를 생성하는 단계; 및 상기 문서간 키워드 유사도 매트릭스를 해독하여 문서간 유사도를 계산하는 단계를 포함하는 것을 특징으로 한다.
상기 문서간 유사도를 계산하는 단계는 기 등록된 유사도 계산 알고리즘을 이용하는 것을 특징으로 한다.
그리고, 상기 지식 구조를 기반으로 한 검색 서비스 제공 방법은 상기 문서간 키워드 유사도 매트릭스를 생성하는 단계 이전에, 상기 관련 문서 검색 범위를 설정하는 단계를 더 포함하는 것을 특징으로 한다.
상기 관련 문서 검색 범위는 데이터베이스 또는 인터넷에 업로드된 모든 문서들을 포함하는 검색 범위, 사용자가 입력한 쿼리에 대응되는 문서들을 포함하는 검색 범위, 및 사용자에 의해 선택된 카테고리에 속하는 문서들을 포함하는 검색 범위 중 하나 인 것을 특징으로 한다.
상기 지식 구조는 상기 문서에 포함된 주요 키워드에 각각 대응되는 다수의 노드와, 노드간 의미의 근접성을 표시하는 다수의 링크로 표현되는 것을 특징으로 한다.
더하여, 상기 지식 구조를 기반으로 한 검색 서비스 제공 방법은 상기 키워드를 포함하는 관련 문서들을 추가 검색하는 단계에서의 키워드 선택은, 지식구조에 포함된 키워드 또는 상기 키워드와 연관된 추천 키워드 중 어느 하나를 선택할 수 있도록 한다.
그리고 상기 다른 키워드들을 추천하는 단계는 상기 최초 선택된 키워드에 대응되는 노드에 연결된 링크와 노드를 표시하기 위한 시각정보를 추가 표시하는 것을 특징으로 한다.
본 발명의 다른 실시 예에 따른 지식 구조를 기반으로 한 검색 서비스 제공 장치는 사용자에 의해 선택된 쿼리 또는 키워드에 대응되는 문서를 검색하는 검색 엔진; 상기 문서에 대응되는 지식 구조를 생성하는 지식 구조 관리부; 사용자가 상기 쿼리를 입력하면 상기 검색 엔진을 통해 상기 쿼리에 대응되는 문서들을 획득 및 표시하고, 상기 표시된 문서 중 하나가 선택되면 상기 선택된 문서의 지식 구조를 획득하여 표시하고, 상기 지식 구조에 포함된 키워드가 선택되면 상기 선택된 문서의 지식 구조와 가장 유사한 지식 구조를 가지는 문서를 검색하여 추천 또는 제공하는 제어부; 및 상기 선택된 문서에 대응되는 지식 구조를 생성하여 상기 제어부에 제공하는 지식 구조 관리부를 포함할 수 있다.
상기 제어부는 상기 지식 구조에 포함된 다수의 키워드 중 하나가 최초 선택되면, 상기 최초 선택된 키워드에 연관된 다른 키워드들을 추천하는 기능을 더 포함하는 것을 특징으로 한다.
본 발명에서는 기계적으로 만들어진 지식 구조를 통해 문서의 내용을 한눈에 파악할 수 있도록 하고, 이를 기반으로 정보 검색 동작이 수행될 수 있도록 함으로써 정보 검색의 정확성이 획기적으로 향상될 수 있도록 한다.
또한, 지식 구조내 키워드 관계를 통해 새로운 지식을 습득할 수 있으며, 더 나아가 관심 키워드를 통해 관련 지식의 확장도 보다 손쉽게 가능해지도록 한다.
도1은 지식 구조의 개념을 설명하기 위한 도면이다.
도2는 본 발명의 일 실시예에 따른 지식 구조 생성 방법을 도시한 도면이다.
도3은 도2의 지식 구조 생성 방법에 의해 생성된 지식 구조의 일예를 도시한 도면이다.
도4는 본 발명의 일 실시예에 따른 지식 구조를 기반으로 한 검색 서비스 제공 방법을 설명하기 위한 도면이다.
도5는 본 발명의 일 실시예에 따른 쿼리 입력 및 문서 선택 단계를 설명하기 위한 도면이다.
도6은 본 발명의 일 실시예에 따른 지식 구조 표시 방법의 예들을 도시한 도면이다.
도7은 본 발명의 일 실시예에 따른 문서 각각에 대응되는 지식 구조의 예들을 도시한 도면이다.
도8은 본 발명의 일 실시예에 따른 문서간 키워드 유사도 매트릭스의 예를도시한 도면이다.
도9은 본 발명의 일 실시예에 따른 문서 추천 또는 제공 예들을 도시한 도면이다.
도10은 본 발명의 다른 실시예에 따른 지식 구조를 기반으로 한 검색 서비스 제공 방법을 설명하기 위한 도면이다.
도11은 본 발명의 다른 실시예에 따른 키워드 추천 개념을 설명하기 위한 도면이다.
도12은 본 발명의 일 실시예에 따른 지식 구조를 기반으로 한 정보 검색 서비스를 제공하는 검색 서비스 제공 장치를 설명하기 위한 도면이다.
본 발명의 목적 및 효과, 그리고 그것들을 달성하기 위한 기술적 구성들은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다.
그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있다. 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명의 이해를 돕기 위해, 본 발명을 설명하기에 앞서 지식 구조의 개념에 대해 살펴보기로 한다.
지식 구조는 학습자가 어떤 문서나 매체를 통해 학습할 때 생성되는 핵심 개념들과 그들의 근접성에 기반한 연관 관계를 조직적으로 나타낸 모형으로서, 개념간에 연결된 선은 두 개념이 의미적으로 밀접한 관계가 있음을 나타낸다. 지식구조는 인지과학(Cognitive Science)에서는 인지 스키마(Cognitive Schema)라고 한다.
가령, 학습자가 도1에서와 같이"컴퓨터의 구성"이라는 문서를 학습했고, 해당 문서내의 핵심 개념들이 Computer, CPU, Cache Memory, Main Memory 그리고 Hard Disk가 있었다고 한다면, 해당 문서를 학습한 학습자의 머리 속에는 핵심 개념들이 그들의 연관 관계를 통해 상호 연결된 구조가 형성될 수 있으며, 이러한 조직적인 체계가 지식 구조가 될 수 있다.
이에 본 발명에서는 별도의 컴퓨팅 장치가 데이터베이스 또는 인터넷상에 업로드된 자료를 분석하여, 이에 대응되는 지식 구조를 자동 생성할 수 있도록 하고, 더 나아가 자료 각각에 대응되는 지식 구조를 기반으로 또 다른 자료를 추천 및 제공할 수 있도록 하고자 한다.
도2는 본 발명의 일 실시예에 따른 지식 구조 생성 방법을 도시한 도면이다.
도2을 참고하면, 본 발명의 지식 구조 생성 방법은 자료의 최소 구성 단위인 단일 문서로부터 지식구조를 추출하기 위한 것으로, 크게 단일 문서의 핵심 개념 추출 단계(S11), 핵심 개념 간의 연관관계 추출 단계(S12), 및 핵심 개념과 관계를 이용한 지식구조 생성 단계(S13) 등을 포함할 수 있다.
핵심 개념 추출 단계(S11)에서는, 단일 문서에 대한 형태소 분석을 하여 문서에 포함된 단어 중 명사만을 선별한 후, 단어 사용 빈도를 기반으로 주요 키워드, 즉 핵심 개념을 추출한다.
핵심 개념 간의 연관관계 추출 단계(S12)에서는, 단어 쌍의 공기정보(Co-occurrence)를 이용하여 문서의 핵심 개념간 연관관계를 추출한다.
본 발명에서는 공기정보를 두 개념이 같은 문장에서 동시 출현하는 빈도수인 문장 공기정보와 두 개념이 같은 문단에서 동시 출현하는 문단 공기정보로 세분화한 후, 단순 공기정보를 이용하여, 개념간 연관관계 유사도를 측정한다.
수학식 1은 문장 간 공기정보를 이용하여 구한 단어간 유사도(Sentence cooccurrences Similarity: SS)를, 수학식2는 문단간 공기정보를 이용하여 구한 단어간 유사도 (Paragraph co-occurrences Similarity: PS)를 구하기 위한 식이다.
[수학식 1]
Figure pat00001
[수학식 2]
Figure pat00002
이때, Ns와 Np는 각각, 문서에 나타난 순서에 따른 문장 번호, 문단 번호가 된다.
단어와 단어의 유사도는 각 문장 혹은 각 문단에서 동시 출현한 횟수를 총 더한 것을, 문서에서 나타난 각 문서, 문단 공기정보의 최대 값으로 나누어 0과 1사이의 값으로 정규화시킨다.
상기의 수학식으로 공기정보를 이용하여 쉽게 단어 간유사도를 측정할 수 있지만, 이 방법은 많이 출현한 단어일수록 다른 단어들과 유사관계가 높아지는 문제점을 갖는다. 이러한 문제점을 해결하기 위해 문서 군집화에 널리 쓰이는 코사인 유사도 측정 방법을 변형하여 사용한다.
문장1 문장2 문장3 문장N
Wi 3 0 1 1
Wj 2 1 0 2
표 1에서 처럼 각 문장에 출현하는 개념의 빈도수로 이루어진 ISV(Inverted Senteces Vetcor)를 생성한다.
[수학식3]
Figure pat00003
그 후 식 (3)를 이용하여 단일 문서로부터 각 개념간의 코사인 유사도(Sentence co-occurrences Cosine Similarity: SCS)를 측정할 수 있다.
표 1의 문장 번호를 문단 번호로 바꾸어 동일한 방식으로 개념간의 코사인 유사도(Paragraph cooccurrences Cosine Similarity: PSC)를 측정할 수 있으며, 위의 방식은 단어가 출현한 빈도수에 상관없이 동시 출현한 정도에 따라 유사도가 측정되므로 단일 문서 안에서의 개념 간 연관관계 측정에 적합하다.
지식구조 생성 단계(S13)에서는 먼저, 기존 인지심리학 분야의 지식구조 생성과정에서 주로 사용하는 방법과 동일하게, 수학식4를 이용하여 각 개념간 연관관계(Dij)를 7점 스케일로 변환한다(1:매우 관련 있음, 7:전혀 관련 없음)
[수학식4]
Figure pat00004
그리고 나서, 각 개념 간의 연관관계 정보로 이루어진 유사도 측정 테이블을 작성하고, 패스파인더(Pathfinder) 알고리즘, 7-scale score 등을 적용하여, 각 개념 간을 최단 거리로 연결하여 주는 지식구조를 자동 생성한다.
도3은 도2의 지식 구조 생성 방법에 의해 생성된 지식 구조의 일예를 도시한 도면이다.
도3을 참고하면 본 발명의 지식 구조는 다수의 노드와 다수의 링크로 표현될 수 있음을 알 수 있다.
다수의 노드 각각은 문서에 포함된 주요 키워드들 각각에 대응되며, 소정의 면적을 가지는 각종 도형(예를 들어, 원, 사각형 등)으로 표현될 수 있다. 그리고 키워드 발생 빈도에 비례하여 노드의 형태(즉, 노드 크기 또는 색상)을 변화시켜 줌으로써, 노드 형태만으로도 해당 키워드의 발생 빈도수를 손쉽게 파악할 수 있도록 한다.
다수의 링크 각각은 노드간 연관 관계를 나타내며, 이는 해당 링크로 연결된 키워드간의 관계(즉, 연관성, 관련성)에 따라 굵기, 색상, 종류 등이 다양하게 달라지는 선으로 표현될 수 있다.
도4는 본 발명의 일 실시예에 따른 지식 구조를 기반으로 한 검색 서비스 제공 방법을 설명하기 위한 도면이다.
도4를 참고하면, 본 발명의 정보 검색 방법은 크게 쿼리 입력 및 문서 선택 단계(S21), 지식 구조 생성 및 표시 단계(S22), 키워드 선택 단계(S23), 문서간 키워드 유사도 매트릭스 생성 단계(S24), 문서간 유사도 계산 단계(S25), 문서 제공 또는 추천 단계(S26) 등을 포함할 수 있다.
먼저, 쿼리 입력 및 문서 선택 단계(S21)가 되면, 도5에서와 같이 검색 서비스 제공 장치는 인터넷 사용자가 검색하고자 하는 쿼리를 입력할 수 있는 검색 창을 제공한다. 이에 검색창을 통해 쿼리가 입력되면, 이를 기반으로 검색 엔진의 데이터베이스에 있는 모든 문서(또는 인터넷에 업로드된 모든 문서)를 검색하여 해당 쿼리에 대응되는 문서들을 획득한 후 리스트화하여 표시한다.
이에 사용자가 해당 쿼리에 대응되는 문서들 중 관심 문서를 하나 선택하면, 검색 서비스 제공 장치는 팝업창을 띄우거나 새로운 웹 페이지를 열어 사용자가 선택한 문서의 상세 정보를 표시한다. 또한 팝업창 또는 새로운 웹 페이지의 소정 영역을 할당하여 사용자가 해당 문서의 지식 구조 열람을 요청할 수 있도록 하는 메뉴도 제공하도록 한다.
이에 사용자가 지식 구조 열람 메뉴를 선택하면 지식 구조 생성 및 표시 단계(S22)로 진입하고, 검색 서비스 제공 장치는 앞서 설명된 도2의 방법을 통해 해당 문서에 대응되는 지식 구조를 생성한다. 그리고 해당 문서에 대응되는 팝업창 또는 웹 페이지에 생성된 지식 구조를 추가 표시한다. 이때, 지식 구조는 도6의 (a)와 같이 별도의 팝업창을 통해 제공되거나, 도6의 (b)와 같이 웹 페이지 중 일부 영역을 할당받아 표시될 수 있을 것이다.
즉, 본 발명에서는 이 과정을 통해 해당 문서에 대응되는 지식 구조를 사용자에게 시각적으로 안내함과 동시에 사용자가 이를 통해 문서 추천 또는 제공에 필요한 키워드를 보다 용이하게 검색 및 선택할 수 있도록 한다.
키워드 선택 단계(S23)에서는, 사용자가 지식 구조에 포함된 다수의 키워드 중 하나를 관심 키워드로 선택하는지 모니터링하고, 만약 관심 키워드가 선택되면, 문서간 키워드 유사도 매트릭스 생성 단계(S24)로 진입하도록 한다.
문서간 키워드 유사도 매트릭스 생성 단계(S24)가 되면, 검색 서비스 제공 장치는 관심 키워드를 포함하는 관련 문서들을 추가 검색하고, 관련 문서들 각각의 지식 구조를 파악한다. 그리고 지식 구조에 포함된 키워드를 추출한 후, 관련 문서들은 제1 방향(예를 들어, 세로축)의 항목 정보로, 추출된 키워드는 제1 방향에 수직되는 제2 방향(예를 들어, 가로축)의 항목 정보로 이용하여 2차원 구조의 문서간 키워드 유사도 매트릭스를 생성하도록 한다.
예를 들어, 도7에 도시된 바와 같이 사용자가 문서 D1에 대응되는 지식 구조에 포함된 다수의 키워드 중에서 Data를 관심 키워드로 선택한다면, 검색 서비스 제공 장치는 문서 D2 내지 D5 중에서, Data라는 키워드를 가지는 문서 D3 내지 D5만을 획득하고, D2에는 해당 키워드가 없으므로 제외되고, D3내지 D5 각각의 지식 구조를 생성하도록 한다.
그리고 문서 D3 내지 D5의 지식 구조에 포함된 키워드를 모두 추출한 후, Data를 제외한 나머지 키워드는 세로축 항목으로, 검색된 문서는 가로축 항목으로 활용하여 도8에서와 같은 2차원 구조의 매트릭스를 생성한다.
이때, 세로축 항목과 가로축 항목이 교차하는 지점에 존재하는 "1"은 세로축 항목에 대응되는 키워드를 가로축 항목에 대응되는 문서가 포함하고 있음을, "0"은 세로축 항목에 대응되는 키워드를 가로축 항목에 대응되는 문서가 포함하지 못함을 의미한다. 즉, 문서 D1은 키워드 Internet을 가지고 있으므로 문서 D1과 키워드 Internet이 교차되는 지점의 값은 "1"이 되고, 문서 D1은 키워드 Text을 가지고 있지 않으므로 문서 D1과 키워드 Text이 교차되는 지점의 값은 "0"이 되게 된다.
또한, 관계의 연관성을 보다 상세하게 표시하고자 하는 경우에는 0 또는 1의 이진수가 아닌 N-scale(N은 3이상의 자연수)로 정규화 시킨 값을 반영할 수 있도록 한다. 즉, 매트릭스를 만들 때 없음/있음이 아니라 없음/있음(연관성정도)로 메트릭스를 만들 수도 있을 것이다.
문서간 유사도 계산 단계(S25)에서는, 코사인 유사도(cosine similarity), LSA(Latent Semantic Analysis) 등과 같은 각종 유사도 계산 알고리즘을 통해 단계 S24를 통해 생성된 문서간 키워드 유사도 매트릭스를 해독하여, 문서간 유사도 sim(A,B)를 계산하도록 한다.
만약, 코사인 유사도 알고리즘을 이용한다면, 문서간 유사도 sim(A,B)는 다음과 같이 계산될 수 있을 것이다.
[수학식1]
Figure pat00005
A,B는 비교 대상이 되는 두 개의 문서, i는 키워드를 의미한다.
그러면 D1,D3간 유사도는 " sim(D1,D3)= (1ㅧ1 + 1ㅧ1 + 1ㅧ0 + 1ㅧ0 + 0ㅧ1 + 0ㅧ1 + 0ㅧ1 + 0ㅧ1 + 0ㅧ0 + 0ㅧ0) /(((12 + 12 … + 02)(1/2)) ㅧ ((12+ 12 …+ 02 …)(1/2)))"에 의해 계산될 것이다. 이와 동일한 방식으로 문서 D1,D4간 유사도는 "0"으로, 문서 D1,D5간 유사도는 "0"으로 계산될 것이다.
문서 제공 또는 추천 단계(S26)에서는, 단계 S25를 통해 계산된 문서간 유사도를 참고하여 문서 제공 동작 또는 문서 추천 동작을 수행하도록 한다.
예를 들어, 문서 D1,D3 간 유사도(sim(D1,D3))는 0.4082483이고, 문서 D1,D4 간 유사도(sim(D1,D4))는 0, 문서 D1,D5 간 유사도(sim(D1,D5))는 0임을 참고하여, 검색 서비스 제공 장치는 도9의 (a)에서와 같이 사용자에게 문서 D3, D4, D5 순으로 관련 문서를 추천하거나, 도9의 (b)에서와 같이 유사도가 가장 높은 문서 D3만을 추천하거나, 도9의 (c)에서와 같이 유사도가 가장 높은 문서 D3만을 제공하거나, 도9의 (d)에서와 같이 유사도가 가장 높은 문서 D3의 상세 페이지를 즉시 불러와 제공하는 등의 다양한 동작을 수행할 수 있을 것이다.
이와 같이, 본 발명에서는 지식 구조를 통해 사용자가 관심 있어하는 문서의 내용이 일목요연하게 보여질 수 있도록 하고, 지식 구조를 통해 문서간 유사도를 계산할 수 있도록 함으로써, 보다 정확한 문서 추천 또는 제공 동작이 수행됨을 알 수 있다.
또한 본 발명에서는 사용자가 선택한 관심 키워드를 포함하는 관련 문서들을 검색함에 있어서, 그 검색 범위를 능동적으로 조정할 수도 있도록 한다. 즉, 검색 정밀도, 속도 및 효율성이 검색 서비스 제공 환경에 적합하도록 조정될 수 있도록 한다.
보다 구체적으로는, 본 발명에서는 관련 문서 검색 범위를 이하와 같이 다양화하고, 사용자 또는 시스템 관리자에 의해 하나의 관련 문서 검색 범위가 선택 및 이용될 수 있도록 한다.
먼저, 제1 범위화 방법은 데이터베이스에 저장 또는 인터넷에 업로드된 모든 문서들을 기반으로 키워드를 검색하도록 하는 방법으로, 이는 모든 문서를 기반으로 지식 구조 비교 동작을 하므로, 검색 정확성은 가장 높으나 검색 속도는 가장 느린 단점이 있다.
제2 범위화 방법은 모든 문서들을 비교하는 것이 아니라 처음 쿼리 범위에서만 키워드를 검색하도록 하는 방법으로, 사용자가 입력된 쿼리에 속하는 범위 내에서만 관련 문서를 검색하도록 하여, 정확성은 제1 범위화 방법에 비해 떨어지나 검색 속도는 제1 범위화 방법 보다 빨라지는 장점이 있다.
제3 범위화 방법은 미리 각 문서들을 계층 구조 또는 온톨로지(Ontology) 형태로 분류해 놓은 후, 사용자가 선택한 카테고리 안에서만 관련 문서를 검색하는 방법이다. 이는 제2 범위화방법과 같이 일정한 범위에서 검색하는 방법이지만, 미리 모든 문서들을 의미적 요소를 바탕으로 관련 카테고리에 넣어두고, 해당 문서의 카테고리 범주에서만 검색하는 방법으로써 시멘틱(Semantic) 검색 요소가 제2 범위화방법 보다 큰 특징을 가진다.
상기의 설명에서는 설명의 편이를 위해 관련 문서 검색 범위를 세 단계로 나누는 경우를 예로 들었지만, 실제 적용시에 보다 다양하게 조정될 수 있음은 물론 당연할 것이다.
도10은 본 발명의 다른 실시예에 따른 지식 구조를 기반으로 한 정보 검색 방법을 설명하기 위한 도면이다.
도10을 참고하면, 본 발명의 정보 검색 방법은 도4의 키워드 선택 단계(S23) 이후에 키워드 선택 단계(S23)를 통해 선택된 키워드에 관련된 키워드를 추천하는 단계(S30)가 추가로 수행되도록 함으로써, 사용자가 처음 선택한 키워드와 관계가 깊거나 또 다른 관심 키워드를 새로이 파악하여 검색할 수 있도록 한다.
즉, 본 발명의 다른 실시예서는 사용자가 키워드 선택 단계(S23)를 통해 지식 구조를 참조하여 하나의 관심 키워드를 선택하면, 관심 키워드에 연결된 링크, 노드를 도11에서와 같이 하이라이트 처리해줌으로써, 사용자가 현재 자신이 선택한 키워드와 관계가 있는 또 다른 키워드를 새로이 파악하여 검색할 수 있도록 한다.
그 결과, 사용자는 지식 구조에 존재하는 키워드 간의 관계를 보고 새로운 지식을 습득할 수 있게 되며, 더 나아가 새로운 관심 키워드를 통해 관련 지식의 확장도 보다 손쉽게 수행할 수 있게 된다.
그리고 도4에서 설명한 바와 같이 사용자가 새로이 선택한 관심 키워드를 기반으로 문서간 키워드 유사도 매트릭스 생성 단계(S24), 문서간 유사도 계산 단계(S25), 그리고 문서 제공 또는 추천 단계(S26)를 수행하도록 함으로써, 사용자가 새로이 선택한 관심 키워드에 관련된 문서를 추천 또는 제공받을 수 있도록 한다.
물론, 필요한 경우 사용자가 처음 관심 키워드에 대해 상기 단계들(S24~S26)을 수행하거나, 또는 처음 선택한 관심 키워드와 새로이 선택한 또 다른 관심 키워드 모두에 대해 상기 단계들(S24~S26)을 수행할 수도 있음은 당연할 것이다.
도12은 본 발명의 일 실시예에 따른 지식 구조를 기반으로 한 정보 검색 서비스를 제공하는 검색 서비스 제공 장치를 설명하기 위한 도면이다.
도12을 참고하면, 본 발명의 검색 서비스 제공 장치(10)는 사용자에 의해 선택된 쿼리 또는 키워드에 대응되는 문서를 검색하는 검색 엔진(11), 검색 엔진(11)에 의해 검색된 문서 중에서 사용자에 의해 선택된 문서에 대응되는 지식 구조를 생성하는 지식 구조 관리부(12), 검색 엔진(11), 지식 구조 관리부(12) 및 화면 구성부(14)를 동작 제어하여, 검색 서비스 제공 장치(10)에 접속한 사용자에게 앞서 설명된 지식 구조 기반의 정보 검색 서비스를 제공하는 제어부(13), 제어부(13)의 제어하에 쿼리 입력 페이지, 문서 검색 결과 페이지, 지식 구조 표시 페이지, 문서 추천 또는 제공 페이지 등을 다양하게 구성 및 제공할 수 있도록 하는 화면 구성부(14), 및 검색 서비스에 이용되는 각종 문서를 저장, 관리하는 데이터베이스(15) 등을 포함하여 구성될 수 있다.
이에 다수의 인터넷 사용자는 자신이 구비한 사용자 단말(21~2n)을 통해 검색 서비스 제공 장치(10)에 접속하여, 검색 서비스 제공 장치(10)이 제공하는 지식 구조를 기반으로 한 정보 검색 서비스를 다양하게 제공받을 수 있게 된다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
또한, 본 발명에 따른 지식 구조를 기반으로 한 검색 서비스 제공 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치, 하드 디스크, 플래시 드라이브 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

Claims (10)

  1. 사용자가 입력한 쿼리에 대응되는 문서를 검색 및 제공하는 단계;
    상기 문서에 대응되는 지식 구조를 생성하여 추가 제공하는 단계;
    상기 지식 구조에 포함된 다수의 키워드 중 하나가 선택되면, 상기 키워드를 포함하는 관련 문서들을 추가 검색하는 단계;
    상기 관련 문서들의 지식 구조와 상기 문서의 지식 구조를 비교 분석하여 문서간 유사도를 계산하는 단계; 및
    상기 유사도 계산 결과를 기반으로 문서 추천 동작 또는 문서 제공 동작을 수행하는 단계를 포함하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  2. 제1항에 있어서, 상기 문서간 유사도를 계산하는 단계는
    상기 지식 구조에 포함된 다수의 키워드 중 하나가 선택되면, 상기 키워드를 포함하는 관련 문서들을 추가 검색하는 단계;
    상기 관련 문서들 각각의 지식 구조를 파악한 후, 상기 지식 구조에 포함된 키워드를 추출하는 단계;
    상기 관련 문서들을 제1 방향의 항목 정보로, 상기 추출된 키워드를 제1 방향에 수직되는 제2 방향의 항목 정보로 활용하여 2차원 구조의 문서간 키워드 유사도 매트릭스를 생성하는 단계; 및
    상기 문서간 키워드 유사도 매트릭스를 해독하여 문서간 유사도를 계산하는 단계를 포함하는 것을 특징으로 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  3. 제2항에 있어서, 상기 문서간 유사도를 계산하는 단계는
    기 등록된 유사도 계산 알고리즘을 이용하는 것을 특징으로 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  4. 제1항에 있어서,
    상기 문서간 키워드 유사도 매트릭스를 생성하는 단계 이전에, 상기 관련 문서 검색 범위를 설정하는 단계를 더 포함하는 것을 특징으로 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  5. 제4항에 있어서, 상기 관련 문서 검색 범위는
    데이터베이스 또는 인터넷에 업로드된 모든 문서들을 포함하는 검색 범위, 사용자가 입력한 쿼리에 대응되는 문서들을 포함하는 검색 범위, 및 사용자에 의해 선택된 카테고리에 속하는 문서들을 포함하는 검색 범위 중 하나 인 것을 특징으로 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  6. 제1항에 있어서, 상기 지식 구조는
    상기 문서에 포함된 주요 키워드에 각각 대응되는 다수의 노드와, 노드간 의미의 근접성을 표시하는 다수의 링크로 표현되는 것을 특징으로 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  7. 제1항에 있어서,
    상기 키워드를 포함하는 관련 문서들을 추가 검색하는 단계에서의 키워드 선택은, 지식구조에 포함된 키워드 또는 상기 키워드와 연관된 추천 키워드 중 어느 하나를 선택할 수 있도록 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  8. 제7항에 있어서, 상기 다른 키워드들을 추천하는 단계는
    상기 최초 선택된 키워드에 대응되는 노드에 연결된 링크와 노드를 표시하기 위한 시각정보를 추가 표시하는 것을 특징으로 하는 지식 구조를 기반으로 한 검색 서비스 제공 방법.
  9. 사용자에 의해 선택된 쿼리 또는 키워드에 대응되는 문서를 검색하는 검색 엔진;
    상기 문서에 대응되는 지식 구조를 생성하는 지식 구조 관리부;
    사용자가 상기 쿼리를 입력하면 상기 검색 엔진을 통해 상기 쿼리에 대응되는 문서들을 획득 및 표시하고, 상기 표시된 문서 중 하나가 선택되면 상기 선택된 문서의 지식 구조를 획득하여 표시하고, 상기 지식 구조에 포함된 키워드가 선택되면 상기 선택된 문서의 지식 구조와 가장 유사한 지식 구조를 가지는 문서를 검색하여 추천 또는 제공하는 제어부; 및
    상기 선택된 문서에 대응되는 지식 구조를 생성하여 상기 제어부에 제공하는 지식 구조 관리부를 포함하는 지식 구조를 기반으로 한 검색 서비스 제공 장치.
  10. 제9항에 있어서, 상기 제어부는
    상기 지식 구조에 포함된 다수의 키워드 중 하나가 최초 선택되면, 상기 최초 선택된 키워드에 연관된 다른 키워드들을 추천하는 기능을 더 포함하는 것을 특징으로 하는 지식 구조를 기반으로 한 검색 서비스 제공 장치.
KR1020130110606A 2013-09-13 2013-09-13 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치 KR101538998B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020130110606A KR101538998B1 (ko) 2013-09-13 2013-09-13 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치
US14/045,707 US20150081657A1 (en) 2013-09-13 2013-10-03 Method and apparatus for providing search service based on knowladge service

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130110606A KR101538998B1 (ko) 2013-09-13 2013-09-13 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20150031087A true KR20150031087A (ko) 2015-03-23
KR101538998B1 KR101538998B1 (ko) 2015-07-24

Family

ID=52668950

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130110606A KR101538998B1 (ko) 2013-09-13 2013-09-13 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치

Country Status (2)

Country Link
US (1) US20150081657A1 (ko)
KR (1) KR101538998B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102075357B1 (ko) * 2019-04-16 2020-02-10 김철호 픽셀 기반 검색 방법
KR20200080571A (ko) * 2018-12-27 2020-07-07 에스케이 주식회사 키워드와 관계 정보를 이용한 정보 검색 시스템 및 방법
WO2022086069A1 (ko) * 2020-10-23 2022-04-28 엘지전자 주식회사 디스플레이장치 및 이의 뉴스 키워드 추천 방법
KR102487820B1 (ko) * 2022-03-23 2023-01-13 최미선 유사한 비교콘텐츠들과의 차별점을 제공하는 콘텐츠 기획과 제작을 위한 통합 플랫폼 서비스 제공 장치, 방법 및 프로그램
KR20230135372A (ko) 2022-03-16 2023-09-25 주식회사 코드와이즈 Ai기반 자연어처리를 통한 지능형 검색 시스템

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10459970B2 (en) * 2016-06-07 2019-10-29 Baidu Usa Llc Method and system for evaluating and ranking images with content based on similarity scores in response to a search query
US10657158B2 (en) * 2016-11-23 2020-05-19 Google Llc Template-based structured document classification and extraction
US10169331B2 (en) * 2017-01-29 2019-01-01 International Business Machines Corporation Text mining for automatically determining semantic relatedness
KR102059743B1 (ko) 2018-04-11 2019-12-26 한국과학기술원 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템
US11232267B2 (en) * 2019-05-24 2022-01-25 Tencent America LLC Proximity information retrieval boost method for medical knowledge question answering systems
KR102370171B1 (ko) 2020-02-25 2022-03-03 경희대학교 산학협력단 문맥적 관련성을 고려한 의료 문서 검색 방법 및 장치
KR20220109188A (ko) 2021-01-28 2022-08-04 이세중 인공지능 기반의 문장 검색 방법 및 시스템
KR20220109952A (ko) 2021-01-29 2022-08-05 이세중 인공지능 기반의 문장 검색 방법 및 시스템

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
US20020194166A1 (en) * 2001-05-01 2002-12-19 Fowler Abraham Michael Mechanism to sift through search results using keywords from the results
ATE466345T1 (de) * 2002-01-16 2010-05-15 Elucidon Group Ltd Abruf von informationsdaten, wobei daten in bedingungen, dokumenten und dokument-corpora organisiert sind
JP2005107688A (ja) * 2003-09-29 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> 情報表示方法及びシステム及び情報表示プログラム
US7689559B2 (en) * 2006-02-08 2010-03-30 Telenor Asa Document similarity scoring and ranking method, device and computer program product
US7552114B2 (en) * 2007-03-07 2009-06-23 International Business Machines Corporation System, and method for interactive browsing
US8290975B2 (en) * 2008-03-12 2012-10-16 Microsoft Corporation Graph-based keyword expansion
EP2128774A1 (en) * 2008-05-29 2009-12-02 Accenture Global Services GmbH Techniques for computing similarity measurements between segments representative of documents
JP5226401B2 (ja) * 2008-06-25 2013-07-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 文書データの検索を支援する装置及び方法
US8463808B2 (en) * 2008-11-07 2013-06-11 Raytheon Company Expanding concept types in conceptual graphs
US8478749B2 (en) * 2009-07-20 2013-07-02 Lexisnexis, A Division Of Reed Elsevier Inc. Method and apparatus for determining relevant search results using a matrix framework

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200080571A (ko) * 2018-12-27 2020-07-07 에스케이 주식회사 키워드와 관계 정보를 이용한 정보 검색 시스템 및 방법
KR102075357B1 (ko) * 2019-04-16 2020-02-10 김철호 픽셀 기반 검색 방법
WO2022086069A1 (ko) * 2020-10-23 2022-04-28 엘지전자 주식회사 디스플레이장치 및 이의 뉴스 키워드 추천 방법
KR20230135372A (ko) 2022-03-16 2023-09-25 주식회사 코드와이즈 Ai기반 자연어처리를 통한 지능형 검색 시스템
KR102487820B1 (ko) * 2022-03-23 2023-01-13 최미선 유사한 비교콘텐츠들과의 차별점을 제공하는 콘텐츠 기획과 제작을 위한 통합 플랫폼 서비스 제공 장치, 방법 및 프로그램

Also Published As

Publication number Publication date
US20150081657A1 (en) 2015-03-19
KR101538998B1 (ko) 2015-07-24

Similar Documents

Publication Publication Date Title
KR101538998B1 (ko) 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치
US11645317B2 (en) Recommending topic clusters for unstructured text documents
US9483532B1 (en) Text processing system and methods for automated topic discovery, content tagging, categorization, and search
US9881037B2 (en) Method for systematic mass normalization of titles
US8868558B2 (en) Quote-based search
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
US20120278341A1 (en) Document analysis and association system and method
US20180081880A1 (en) Method And Apparatus For Ranking Electronic Information By Similarity Association
US11023503B2 (en) Suggesting text in an electronic document
KR20100068532A (ko) 문서 데이터의 키워드 추출 및 연관어 네트워크 구성 장치 및 방법
US20130232147A1 (en) Generating a taxonomy from unstructured information
US11182540B2 (en) Passively suggesting text in an electronic document
Nualart et al. How we draw texts: a review of approaches to text visualization and exploration
Stojanovic On the query refinement in the ontology-based searching for information
Ananiadou et al. Supporting the education evidence portal via text mining
JP2008243024A (ja) 情報取得装置、そのプログラム及び方法
Kaufmann et al. Combining bottom-up and top-down generation of interactive knowledge maps for enterprise search
Eisenstein et al. Topicviz: Semantic navigation of document collections
US9886497B2 (en) Indexing presentation slides
JP7428250B2 (ja) 文書検索の性能を評価する方法、システム、および装置
CN109213830B (zh) 专业性技术文档的文档检索系统
Ramezani et al. Automated text summarization: An overview
Nualart et al. Texty, a visualization tool to aid selection of texts from search outputs
Mamoon et al. Interactive visualization of retrieved information
US20240095283A1 (en) Systems and methods for conceptual highlighting of document search results

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180626

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190625

Year of fee payment: 5