KR20110129696A - 키워드 가중치 조정에 의한 시멘틱 웹 검색방법 - Google Patents

키워드 가중치 조정에 의한 시멘틱 웹 검색방법 Download PDF

Info

Publication number
KR20110129696A
KR20110129696A KR1020100049218A KR20100049218A KR20110129696A KR 20110129696 A KR20110129696 A KR 20110129696A KR 1020100049218 A KR1020100049218 A KR 1020100049218A KR 20100049218 A KR20100049218 A KR 20100049218A KR 20110129696 A KR20110129696 A KR 20110129696A
Authority
KR
South Korea
Prior art keywords
search
similar
search results
keyword
keywords
Prior art date
Application number
KR1020100049218A
Other languages
English (en)
Inventor
황운배
Original Assignee
주식회사 멀티비츠이미지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 멀티비츠이미지 filed Critical 주식회사 멀티비츠이미지
Priority to KR1020100049218A priority Critical patent/KR20110129696A/ko
Publication of KR20110129696A publication Critical patent/KR20110129696A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 사용자 조정에 의한 시멘틱 웹 검색방법에 관한 것으로, 사용자에 의해 입력된 하나 이상의 키워드를 포함하는 미디어 콘텐츠를 검색하고, 그 검색 결과들을 출력하는 단계; 상기 검색결과들과 유사 검색 사전들을 통해 입력되는 키워드들 각각에 대한 가중치 정보를 토대로 검색을 실행하고, 그 검색 결과들을 출력하는 단계; 상기 유사 검색에 따른 검색 결과들 출력시에, 유사 키워드 가중치 조정기를 표시하고, 상기 유사 키워드 가중치 조정기를 통해 입력된 키워드들 각각에 대한 가중치 조정정보를 입력받아 검색을 실행하고, 그 검색 결과들을 출력하는 단계;를 포함하며, 상기 검색 결과들은 가중치 점수에 따라 정렬되어 출력됨을 특징으로 한다.

Description

키워드 가중치 조정에 의한 시멘틱 웹 검색방법{SEMANTIC WEB RETRIEVE METHOD BY KEYWORD WEIGHT ADJUSTMENT}
본 발명은 웹 검색기술에 관한 것으로, 더욱 상세하게는 키워드 가중치 조정에 의한 시멘틱 웹 검색방법에 관한 것이다.
인터넷이 널리 보급됨으로써 대부분의 문서를 컴퓨터로 작성하고 이들 문서를 인터넷을 통해 배포하고 획득하는 것이 일반화되고 있다. 따라서 전문가뿐만 아니라 일반인들도 인터넷에 접속하여 관심있는 분야에 대한 정보를 제공하거나 획득하는 경우가 많다. 이처럼 통신망을 통해 관심있는 분야에 대한 정보를 불특정 다수의 일반인들이 공유할 수 있도록 하기 위해서는 인터넷상에서 동작하는 검색시스템들이 이용되고 있다.
이러한 검색 시스템들은 인터넷을 이용하여 제공되는 모든 문서들에 대한 키워드 정보 및 기본 정보들을 데이터베이스 형태로 저장한다. 상기 기본 정보는 해당 문서의 제목, 크기, 날짜, 그 문서가 저장된 웹사이트의 주소, 요약문 등을 포함하고, 상기 키워드 정보는 해당 문서에 출현하는 키워드들, 키워드별 출현빈도 등을 포함한다.
상기한 검색 시스템은 외부에서 문서를 검색하기 위한 검색 키워드를 입력하면, 그 검색 키워드에 의해 데이터베이스를 검색하여 검색 결과 리스트를 해당 사용자에게 제공한다. 좀 더 설명하면 상기 검색 시스템은 사용자들이 입력한 검색 키워드에 의해 문서들을 검색하고, 검색된 문서들의 순위를 검색 키워드의 출현빈도 등에 의거하여 결정한 후 그 순위에 준하는 검색 리스트를 생성하여 사용자에게 제공하고, 사용자가 해당 검색 리스트를 참조하여 선택한 문서의 내용을 사용자에게 제공하는 것을 기본 기능으로 한다.
이와 같이 검색된 문서들의 순위를 단순히 검색 키워드의 출현빈도에 의해서만 결정하는 것은, 사용자가 우선적으로 제공받고자 하는 문서가 아닌 다른 문서를 1순위로 하여 제공하는 경향이 있었다.
이러한 문제를 해소하기 위해 종래에는 검색 대상인 문서들에 출현하는 키워드들을 노드로 지정하고, 노드간의 연결을 키워드간의 연관 관계로 지정한 후, 각 키워드간의 연관 관계에 따른 연관 정도를 연관 강도 값으로 표현하는 커넥션 네트워크를 이용하여, 사용자가 문서 검색을 위해 입력한 검색 키워드에 연관되는 키워드들인 연관 키워드들을 추출한 후, 추출된 연관 키워드들 중 해당 검색 키워드와의 높은 연관성을 갖는 연관 키워드들을 참조하여 검색 키워드에 의해 검색된 문서들의 순위를 조정할 수 있게 하였다.
그러나 상기한 연관 강도 값은 사용자의 의사를 반영하지 않은 채, 기존의 검색 이력 등을 토대로 결정되었다. 이에 사용자가 특정 정보를 찾아내기 위해 다수의 검색어를 입력하여 검색을 이행하더라도 원하는 정보를 빠르고 쉽게 찾아낼 수가 없었다.
즉 이미지 등의 미디어 콘텐츠를 온라인 판매하는 업체는 방대한 분량의 미디어 콘텐츠 각각에 대해 다수의 키워드를 부여하여 고객이 원하는 미디어 콘텐츠를 검색할 수 있게 하였으나 고객마다 미디어 콘텐츠의 사용 의도가 다르므로, 각기 다른 목적으로 이행되었던 검색 이력에 따른 연관 강도 값을 이용하여 검색 결과의 순위를 결정하는 것은 검색자의 검색 업무를 개선시켜 줄 수가 없었다.
본 발명은 미디어 콘텐츠에 부여된 다수의 키워드를 토대로 미디어 콘텐츠를 검색하고 그 검색 결과들을 출력할 때에, 상기 검색 결과들의 순위를 고객의 선택에 따른 키워드 가중치에 따라 조절하여, 상기 검색 결과들의 순위에 고객의 검색 의도가 반영되게 하는 키워드 가중치 조정에 의한 시멘틱 웹 검색방법을 제공하는 것을 그 목적으로 한다.
상기한 목적을 달성하기 위한 본 발명에 따르는 키워드 가중치 조정에 의한 시멘틱 웹 검색방법은, 사용자에 의해 입력된 하나 이상의 키워드를 포함하는 미디어 콘텐츠를 검색하고, 그 검색 결과들을 출력하는 단계; 상기 검색결과들과 유사 검색 사전들을 통해 입력되는 키워드들 각각에 대한 가중치 정보를 토대로 검색을 실행하고, 그 검색 결과들을 출력하는 단계; 상기 유사 검색에 따른 검색 결과들 출력시에, 유사 키워드 가중치 조정기를 표시하고, 상기 유사 키워드 가중치 조정기를 통해 입력된 키워드들 각각에 대한 가중치 조정정보를 입력받아 검색을 실행하고, 그 검색 결과들을 출력하는 단계;를 포함하며, 상기 검색 결과들은 가중치 점수에 따라 정렬되어 출력됨을 특징으로 한다.
상기한 본 발명은 미디어 콘텐츠에 부여된 다수의 키워드를 토대로 미디어 콘텐츠를 검색하고 그 검색 결과들을 출력할 때에, 상기 검색 결과들의 순위를 고객의 선택에 따른 키워드 가중치에 따라 조절하여, 상기 검색 결과들의 순위에 고객의 검색 의도가 반영되게 하여, 검색 업무를 빠르고 쉽게 이행할 수 있게 하는 효과가 있다.
도 1은 본 발명의 바람직한 실시예에 따른 검색 시스템의 구성도.
도 2는 본 발명의 바람직한 실시예에 따른 키워드 가중치 조정에 의한 시멘틱 웹 검색방법의 흐름도.
도 3 내지 도 6은 본 발명의 바람직한 실시예에 따른 처리 예를 도시한 도면.
<검색 시스템의 구성>
본 발명의 바람직한 실시예에 따른 검색 시스템의 구성을 도 1을 참조하여 설명한다.
상기 검색 시스템은 제1 내지 제N고객 단말기(1001~100N)와 검색 서버(102)와 데이터베이스(104)로 구성된다.
상기 제1 내지 제N고객 단말기(1001~100N)는 고객으로부터 키워드 또는 연관 키워드별 가중치 조정정보를 입력받아 검색 서버(102)로 전송하며, 상기 검색 서버(102)로부터 기본 검색 결과 또는 연관 키워드별 가중치 조정안내정보, 최종 검색 결과 등을 제공받아 표시하여 출력한다.
상기 검색 서버(102)는 네트워크를 통해 접속한 제1 내지 제N고객 단말기(1001~100N) 중 어느 하나로부터 키워드 또는 연관 키워드별 가중치 조정정보를 입력받아 본 발명에 따른 사용자 조정에 의한 시멘틱 웹 검색을 이행하고, 그에 따른 기본 검색 결과 또는 연관 키워드별 가중치 조정안내정보, 최종 검색 결과 등을 해당 고객 단말기로 전송한다.
상기 데이터베이스(104)는 방대한 양의 미디어 컨텐츠를 저장하며, 상기 미디어 컨텐츠 각각에 대해 다수의 키워드를 구비한다.
<검색 방법>
이제 상기한 검색 시스템에 적용 가능한 본 발명에 따른 키워드 가중치 조정에 의한 시멘틱 웹 검색방법을 도 2를 참조하여 상세히 설명한다.
본 발명에 따르는 키워드 가중치 조정에 의한 시멘틱 웹 검색방법은 크게 기본 검색단계(200)와 유사검색사전 구축단계(202)와 유사검색 실행단계(204)와 유사 키워드 가중치 조정단계(206)로 구성된다.
상기 기본 검색단계(100)에서 검색 서버(102)는 네트워크를 통해 접속한 고객 단말기로 도 3의 (a)에 도시한 바와 같은 검색창을 제공한다. 상기 고객 단말기의 고객은 상기 검색창을 통해 자신이 원하는 미디어 콘텐츠를 지시하는 하나 이상의 키워드를 입력한다.
상기 검색 서버(102)는 상기 검색창을 통해 입력되는 하나 이상의 키워드에 대응되는 미디어 콘텐츠들을 검색하고, 그 검색 결과들에 대한 리스트를 도 3의 (b)에 도시한 바와 같이 고객 단말기로 제공한다.
상기 검색 결과들에 대한 리스트를 출력한 상태에서, 고객이 고객 단말기를 통해 어느 한 검색 결과에 대한 유사 검색 대상을 검색하도록 요청하면, 상기 검색 서버(102)는 해당 검색결과에 대한 유사 검색을 위해 상기 유사 검색 실행단계로 진입한다.
상기 유사 검색 실행을 위해서는 유사 검색 사전이 구축되어야 하므로, 이에 대해 설명한다.
상기 유사 검색 사전의 생성을 위해 상기 검색 서버(102)는 표준 키워드를 추출하여 그 표준 키워드에 대한 정보 및 불용어 선택 또는 가중치 부여, 마이너스 가중치 부여 등을 위한 안내 화면을 고객 단말기로 제공한다.
상기 안내화면은 도 4에 도시한 바와 같이 한글 키워드와 키워드별 미디어 콘텐츠의 수 및 불용어 선택 또는 가중치 부여, 마이너스 가중치 부여 등을 위한 등급 선택 버튼 등으로 구성된다.
상기 안내화면을 통해 고객은 유사 검색 대상으로 선정된 미디어 콘텐츠와 유사한 키워드를 구비하는 미디어 콘텐츠를 검색하여 그 결과를 생성할 때에 검색결과의 순위를 결정하기 위한 각종 정보인 불용어 선택 또는 가중치 부여, 마이너스 가중치를 입력받는다.
상기한 바와 같이 유사 검색 대상이 선택됨과 아울러 유사 검색을 위한 가중치 정보가 입력되면, 유사 검색 단계를 수행한다.
상기 유사 검색은 유사 키워드를 포함하는 미디어 컨텐츠들을 검색한 후에, 그 검색 결과를 리스트 형태로 출력하며, 상기 검색 결과의 정렬 순서는 유사 키워드 점수에 따른다.
상기 유사 검색 결과의 출력시에는 도 6의 (a),(b)에 도시한 바와 같은 유사 키워드 가중치 점수 조정기를 표시하여, 상기 유사 키워드 가중치 점수 조정기를 통해 유사 키워드들에 대한 가중치를 입력받고, 그 입력된 가중치에 따라 유사 키워드 가중치 점수를 조정한 후에 유사 검색을 재실행하고, 그 유사 검색 결과를 리스트 형태로 출력하며, 상기 검색결과의 정렬순서는 유사 키워드 점수에 따른다.
1001~100N : 제1 내지 제N고객 단말기
102 : 검색 서버
104 : 데이터베이스

Claims (1)

  1. 키워드 가중치 조정에 의한 시멘틱 웹 검색방법에 있어서,
    사용자에 의해 입력된 하나 이상의 키워드를 포함하는 미디어 콘텐츠를 검색하고, 그 검색 결과들을 출력하는 단계;
    상기 검색결과들과 유사 검색 사전들을 통해 입력되는 키워드들 각각에 대한 가중치 정보를 토대로 검색을 실행하고, 그 검색 결과들을 출력하는 단계;
    상기 유사 검색에 따른 검색 결과들 출력시에, 유사 키워드 가중치 조정기를 표시하고, 상기 유사 키워드 가중치 조정기를 통해 입력된 키워드들 각각에 대한 가중치 조정정보를 입력받아 검색을 실행하고, 그 검색 결과들을 출력하는 단계;를 포함하며,
    상기 검색 결과들은 가중치 점수에 따라 정렬되어 출력됨을 특징으로 하는 사용자 조정에 의한 시멘틱 웹 검색방법.
KR1020100049218A 2010-05-26 2010-05-26 키워드 가중치 조정에 의한 시멘틱 웹 검색방법 KR20110129696A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100049218A KR20110129696A (ko) 2010-05-26 2010-05-26 키워드 가중치 조정에 의한 시멘틱 웹 검색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100049218A KR20110129696A (ko) 2010-05-26 2010-05-26 키워드 가중치 조정에 의한 시멘틱 웹 검색방법

Publications (1)

Publication Number Publication Date
KR20110129696A true KR20110129696A (ko) 2011-12-02

Family

ID=45498775

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100049218A KR20110129696A (ko) 2010-05-26 2010-05-26 키워드 가중치 조정에 의한 시멘틱 웹 검색방법

Country Status (1)

Country Link
KR (1) KR20110129696A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018124464A1 (ko) * 2016-12-26 2018-07-05 삼성전자 주식회사 전자 장치 및 전자 장치의 검색 서비스 제공 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018124464A1 (ko) * 2016-12-26 2018-07-05 삼성전자 주식회사 전자 장치 및 전자 장치의 검색 서비스 제공 방법

Similar Documents

Publication Publication Date Title
KR101721338B1 (ko) 검색 엔진 및 그의 구현 방법
CN113673262B (zh) 使用统计流数据进行不同语言之间的机器翻译
KR101775061B1 (ko) 엔티티들과 연관된 애스펙트들을 식별하기 위한 시스템들 및 방법들
US20110191327A1 (en) Method for Human Ranking of Search Results
US20090077065A1 (en) Method and system for information searching based on user interest awareness
CN102043833A (zh) 一种基于查询词进行搜索的方法和搜索装置
US20120047131A1 (en) Constructing Titles for Search Result Summaries Through Title Synthesis
US11100169B2 (en) Alternative query suggestion in electronic searching
JP2015523659A (ja) 多言語混合検索方法およびシステム
JP2011529600A (ja) 意味ベクトルおよびキーワード解析を使用することによるデータセットを関係付けるための方法および装置
KR20180126577A (ko) 관련 엔티티 탐색
KR20150054300A (ko) 컴퓨터 실행 가능한 중요 키워드 추출 방법, 이를 수행하는 중요 키워드 추출 서버 및 이를 저장하는 기록매체
CN104615723B (zh) 查询词权重值的确定方法和装置
JP2010061420A (ja) 商品情報検索装置、方法及びシステム
US10783196B2 (en) Thematic web corpus
US10643142B2 (en) Search term prediction
JP5880350B2 (ja) 情報検索プログラム及び情報検索装置
US20150193444A1 (en) System and method to determine social relevance of Internet content
KR20140091375A (ko) 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법
KR101308821B1 (ko) 검색엔진용 키워드 추출 시스템 및 추출 방법
Gretzel et al. Intelligent search support: Building search term associations for tourism-specific search engines
KR20110129696A (ko) 키워드 가중치 조정에 의한 시멘틱 웹 검색방법
JP5397198B2 (ja) 話題推薦装置、話題推薦装方法およびプログラム
JP2022106948A (ja) 情報表示方法、装置、電子機器、記憶媒体およびコンピュータプログラム
JP2002157270A (ja) 興味記事配信システム及び興味記事配信方法

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application
E601 Decision to refuse application