KR20070037808A - 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스검색방법 - Google Patents

자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스검색방법 Download PDF

Info

Publication number
KR20070037808A
KR20070037808A KR1020050092847A KR20050092847A KR20070037808A KR 20070037808 A KR20070037808 A KR 20070037808A KR 1020050092847 A KR1020050092847 A KR 1020050092847A KR 20050092847 A KR20050092847 A KR 20050092847A KR 20070037808 A KR20070037808 A KR 20070037808A
Authority
KR
South Korea
Prior art keywords
search
information
search result
user
rule
Prior art date
Application number
KR1020050092847A
Other languages
English (en)
Other versions
KR100794323B1 (ko
Inventor
최옥경
한상용
Original Assignee
중앙대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 중앙대학교 산학협력단 filed Critical 중앙대학교 산학협력단
Priority to KR1020050092847A priority Critical patent/KR100794323B1/ko
Publication of KR20070037808A publication Critical patent/KR20070037808A/ko
Application granted granted Critical
Publication of KR100794323B1 publication Critical patent/KR100794323B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 온톨로지 서버를 이용하여 서비스 요청자의 요구사항에 대한 정확한 파악이 가능하고, 매치메이킹 서비스와 규칙기반 서비스를 이용하여 검색 결과의 우선 순위를 부여함으로써 결과적으로 가장 적합한 정보만을 서비스 요청자에게 제공할 수 있도록 하는 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스 검색방법에 관한 것으로, 사용자가 입력한 검색정보에 따라 정보DB를 검색하는 정보검색단계; 검색된 검색결과물을 확인하여, 검색정보와 검색결과물이 동일한 경우([규칙 1], Exact), 검색정보가 검색결과물의 상위클래스일 경우([규칙 2], PlugIn), 검색정보가 검색결과물의 하위클래스일 경우([규칙 3], Subsume), 검색정보와 검색결과물의 일부만이 동일한 경우([규칙 4], Intersection) 및 검색정보와 검색결과물 간의 일치점이 없는 경우([규칙 5], Fail) 순으로 순위를 설정하는 검색결과물 1차순위 결정단계; 및 상기 검색결과물 1차순위 결정단계를 통해 순위화된 검색결과물을 사용자에게 출력하는 검색결과물 출력단계;를 포함하는 것이다.

Description

자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스 검색방법{Extended semantic web services method for automatic integrated framework}
도 1은 본 발명에 따른 시멘틱 웹 서비스 검색방법의 실시를 위한 시멘틱 웹 서비스 검색시스템을 도시한 도면이고,
도 2는 본 발명에 따른 시멘틱 웹 서비스 검색방법을 순차 도시한 플로우차트이고,
도 3은 DAML-S 구성요소를 도시한 블록도이고,
도 4는 본 발명에 따른 시멘틱 웹 서비스 검색방법에 대한 다른 실시예를 순차 도시한 플로우차트이고,
도 5는 본 발명에 따른 검색어 분석단계 및 도메인 시멘틱정보 제공단계를 구체화한 플로우차트이고,
도 6은 종래 코사인 유사도를 구하는 식과, 상기 코사인 유사도를 표현한 도면이고,
도 7은 XML 문서와 RDF 문서를 분리해서 Semantic Distance 값을 측정한 것을 비교 분석한 모습을 도시한 도면이고,
도 8은 본 발명에 따른 검색방법의 2차 순위결정단계를 세분화한 플로우차트이고,
도 9는 본 발명에 따른 검색방법에서 검색결과물에 대한 규칙기반 검색단계를 세분화한 플로우차트이고,
도 10은 본 발명에 따른 실험방법의 실시예인 핸드폰 구매를 위한 서비스 요청 서비스의 알고리즘을 보인 도면이고,
도 11은 본 발명에 따른 실험방법의 실시예인 핸드폰 구매를 위한 서비스 광고 서비스의 알고리즘을 보인 도면이다.
본 발명은 온톨로지 서버를 이용하여 서비스 요청자의 요구사항에 대한 정확한 파악이 가능하고, 매치메이킹 서비스와 규칙기반 서비스를 이용하여 검색 결과의 우선 순위를 부여함으로써 결과적으로 가장 적합한 정보만을 서비스 요청자에게 제공할 수 있도록 하는 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스 검색방법에 관한 것이다.
종래 웹은 단순 정보 공유 방식으로 사용자가 원하는 정확한 정보를 제공하지 못하였다. 이에 대한 해결책으로 기존의 텍스트 위주의 검색방식에서 벗어나 단어의 유사성 및 상관관계 등을 파악한 후 보다 신뢰성 있는 결과를 제공하는 시멘틱 웹 기술이 등장하게 되었다.
이와 같이 향후 우리가 지향하는 차세대 웹은 보다 정확하고 신뢰성 있는 정보를 제공할 수 있는 의미론 중심의 시멘틱 웹과 단순 정보 제공이 아닌 자동화 방 식으로 사용자(고객)에게 보다 향상된 고품질의 서비스를 제공하는 웹 서비스로 구성되며, 이러한 기술들은 이질적인 환경을 지원하는 분산서비스로의 전환을 추구한다.
여기서 웹 서비스는 XML을 이용하여 구조화한 데이터를 HTTP(HyperText Transfer Protocol) 등의 기존 웹 기술을 이용해 전송함으로써 상호 이질적인 플랫폼 사이의 상호작용을 돕는 소프트웨어 시스템을 일컫는다.
이러한 웹 서비스는 XML을 기초로 하는 SOAP(Simple Object Access Protocol), WSDL(Web Services Description Language), UDDI(Universal Description, Discovry and Intergration) 등의 표준을 바탕으로 웹이라는 분산 환경에서의 RPC 메커니즘을 제공해 줄 수 있는 기술이다. 이는 웹을 통해서 기업들이 자신들의 비즈니스 로직을 공개할 수 있는 기반을 제공하여 B2Bi(Business to Business Integration) 즉, 기업 간 통합을 효율적으로 가능케 하고 있다.
웹 서비스는 e-비즈니스에서 반드시 필요한 핵심기술로 현재 각 업계에서는 시멘틱 웹 서비스 구성을 위해 DAML-S, WSFL, X-LANG과 BPEL4WS와 같은 언어들이 연구 및 개발 중이다. DAML-S는 이러한 기존의 웹 서비스 방식을 시멘틱 웹 환경에서 접근하는 방식으로 웹 서비스 자동화를 위해 기존 연구들의 부족한 면을 보완하여 효과적인 웹 서비스의 등록, 검색, 구성, 실행 및 조합이 가능하다.
하지만, 현재의 시멘틱 웹 서비스 모델인 DAML-S는 자동화된 웹 서비스를 지원하기 위해서 몇 가지 부족한 점이 있다.
첫째, UDDI와 같은 기본 웹 서비스 방식은 구문분석과 같은 단순 검색방식으 로 의미적인 요소의 반영이 이루어지지 않는다. 또한 인공지능의 에이전트와 같은 사용자가 원하는 정보를 기술하고 이에 대한 결과를 비교할 수 있는 서비스가 제공되지 않아 사용자 요구사항에 대한 검증 및 확인이 어렵다.
둘째, 단위서비스 간의 통합 및 조합을 위해선 먼저 서로 다른 온톨로지 정보에 대한 통합이 선행되어야 하는데 현재는 이에 대한 처리가 미숙하다. 현재 웹 서비스들 간의 조합을 위한 언어(Web Service Composition Language)로 마이크로소프트가 제안한 XLANG, IBM이 제안한 WSFL(Web Service Flow Language), 마이크로소프트와 IBM이 공통으로 제안한 BPEL4WS(Business Process Execution Language for Web Service) 등이 존재하지만 각기 다른 표준화 작업으로 통합 환경을 위한 요소에 오히려 장애가 되고 있다. 또한 에이전트 기술과 같은 자동화된 웹 서비스 조합 기술이 요구된다.
셋째, 시멘틱 웹 서비스에서 가장 중요한 것은 제공하는 서비스를 얼마만큼 신뢰할 수 있는가 이다.
그러나 기존의 다른 웹 서비스 방식들은 신뢰성 있는 메시지 처리가 이루어지지 않고 대기시간, 메시지 처리시간 및 전송시간이 길어 수행 성능면에서 떨어지는 단점이 있다.
넷째, 현재의 웹 서비스 검색 방식은 검색결과에 대한 우선 순위 및 자동화 분류방식을 제공하지 못하고 있다. 따라서 사용자 요구사항과 선호도 등을 고려한 순위화 기법이 요구된다.
이에 본 발명은 정보를 검색하는 사용자의 의도를 정확히 파악하여 신뢰할 수 있는 검색결과를 제공하고, 정보를 제공하는 입장에서는 당해 정보를 요구하는 사용자와 연결되면서 정보의 공급과 수요가 적절히 이루어질 수 있도록 하는 시멘틱 웹 서비스 검색방법을 제공하는 것을 기술적 과제로 한다.
상기의 기술적 과제를 달성하기 위하여 본 발명은,
사용자가 입력한 검색정보에 따라 정보DB를 검색하는 정보검색단계;
검색된 검색결과물을 확인하여, 검색정보와 검색결과물이 동일한 경우([규칙 1], Exact), 검색정보가 검색결과물의 상위클래스일 경우([규칙 2], PlugIn), 검색정보가 검색결과물의 하위클래스일 경우([규칙 3], Subsume), 검색정보와 검색결과물의 일부만이 동일한 경우([규칙 4], Intersection) 및 검색정보와 검색결과물 간의 일치점이 없는 경우([규칙 5], Fail) 순으로 순위를 설정하는 검색결과물 1차순위 결정단계; 및
상기 검색결과물 1차순위 결정단계를 통해 순위화된 검색결과물을 사용자에게 출력하는 검색결과물 출력단계;
를 포함하는 시멘틱 웹 서비스 검색방법이다.
상기의 기술적 과제를 달성하기 위한 본 발명은, 상기 시맨틱 웹 서비스 검색방법에 있어서,
상기 검색정보의 시멘틱 정보를 확인하여, 온톨로지 정보가 저장된 데이터베 이스에서 상기 검색정보 내 입력단어의 동음어를 확인하는 시멘틱 정보확인단계;
상기 시멘틱 정보확인단계를 통해 해당 단어의 동음어가 둘 이상 있을 경우, 사용자에게 재질의를 해 온톨로지를 확정하는 온톨로지 확정단계; 및
상기 온톨로지 확정단계를 통해 확정된 동음어의 의미와 유사한 유사어를 확인하여, 검색에 필요한 도메인 시멘틱 정보를 완성하는 유사어 확인단계;
를 더 포함하는 것이다.
상기의 기술적 과제를 달성하기 위한 본 발명은, 상기 시맨틱 웹 서비스 검색방법에 있어서,
RDF 문서를 저장하는 데이터베이스에서 상기 도메인 시멘틱 정보와 관련된 정보를 검색하는 RDF 문서 검색단계; 및
상기 검색결과물 1차순위 결정단계를 통해 순위화된 검색결과물과 상기 RDF 문서 검색단계를 통해 검색된 결과물을 순위화하는 검색결과물 순위결정단계;
로 이루어진 검색결과물 2차순위 결정단계를 더 포함하는 것이다.
상기의 기술적 과제를 달성하기 위한 본 발명은, 상기 시맨틱 웹 서비스 검색방법에 있어서, 상기 검색결과물 순위결정단계는
그 순위결정 기준을 용어 간의 관계성(Semantic Distance ; Dj) 대비 용어들 간의 동의어 관계(Term Relationship ; Rj)의 결과값과, CosSim(dj, q)과의 곱의 연산값을 기준으로 하여 검색한 정보의 순위를 분류하되;
상기 용어 간의 관계성(Dj)은,
Figure 112005055977248-PAT00001
Figure 112005055977248-PAT00002
,
Figure 112005055977248-PAT00003
,
Figure 112005055977248-PAT00004
Figure 112005055977248-PAT00005
; 각 노드간의 수평 근접도,
Figure 112005055977248-PAT00006
; 각 용어간의 수평 근접도
Figure 112005055977248-PAT00007
; 문서내의 각 트리의 level 측정변수
Figure 112005055977248-PAT00008
; 문서(i)에서 용어(j)가 위치한 곳의 level 값
Figure 112005055977248-PAT00009
; 문서(i)에서 최대 level 값
Figure 112005055977248-PAT00010
Figure 112005055977248-PAT00011
; 각 노드간의 수직 근접도
Figure 112005055977248-PAT00012
; 수직 근접도 결정인자(0 < F < 1)
Figure 112005055977248-PAT00013
; 각 용어간의 수직노드 거리
이고;
상기 용어들 간의 동의어 관계(Rj)는,
Figure 112005055977248-PAT00014
Figure 112005055977248-PAT00015
; term relationship
Figure 112005055977248-PAT00016
; 문서(i)에서 용어(j)의 발생수
Figure 112005055977248-PAT00017
; 용어(j)들간의 유사도 측정 변수
인 것이다.
상기의 기술적 과제를 달성하기 위한 본 발명은, 상기 시맨틱 웹 서비스 검색방법에 있어서,
상기 검색결과물이 사용자에게 출력되기 전, 해당 검색결과물은 규칙기반 검색단계를 거쳐 검색결과물들의 순위 재조정 및 검색결과물의 추출이 이루어지되, 상기 규칙기반 검색단계는, 사용자 정보가 저장된 저장모듈에서 당해 검색정보 및 검색결과물과 관련된 정보를 검색하는 사용자정보 검색단계와, 상기 검색결과물을 상기 사용자정보 검색단계에서 검색된 사용자정보와 비교하여 이들의 순위를 재조정하고, 상기 사용자정보와 관련성이 먼 검색결과물은 추출하는 검색결과물 조정단계로 된 것이다.
이하 본 발명을 첨부된 예시도면에 의거하여 상세히 설명한다.
도 1은 본 발명에 따른 시멘틱 웹 서비스 검색방법의 실시를 위한 시멘틱 웹 서비스 검색시스템을 도시한 것이고, 도 2는 본 발명에 따른 시멘틱 웹 서비스 검색방법을 순차 도시한 플로우차트 인바, 이를 참조하여 설명한다.
본 발명에 따른 시멘틱 웹 서비스 검색방법은 사용자의 검색의도를 정확히 파악하여 검색결과에 대한 사용자의 만족도 및 그 효용성을 높일 수 있도록 하기 위한 것으로, 다음과 같은 절차를 통해 검색이 진행된다.
S10 ; 사용자 검색정보 입력단계
사용자(10)는 단말기를 통해 웹에 접속한다. 웹에 접속한 사용자(10)는 상기 시멘틱 웹 서비스 검색시스템을 구동할 수 있는 웹페이지 또는 프로그램에 접근하여 검색을 준비한다.
사용자(10)는 검색하고자 하는 검색정보를 상기 웹페이지 또는 프로그램에 입력한다. 이때, 사용자(10)의 단말기를 통해 입력된 검색정보는 본 발명에 따른 시멘틱 웹 서비스 검색시스템의 일구성요소인 검색서버(110)로 전송ㆍ처리된다.
일예로, 상기 사용자(10)는 자동차 회사의 영업사원인 박차장이라 하고, 박차장은 고객에게 신차 모델을 빠르게 보여주기 위해 카메라 폰 기능이 있는 삼성 핸드폰의 구입을 희망한다. 또한, 가격대는 20만원 이하로 하고 가격대가 20만원 이상이 될 경우에는 삼성제품이 아닌 대기업 OEM 제품으로 대체해서 구매하기를 희망한다.
이러한 희망에 따라 카메라 폰, 삼성핸드폰, 20만원 이하의 가격대, 20만원 이상의 가격대일 경우 대기업 OEM 제품으로 대체 등에 대한 사용자 검색정보를 입력한다.
S40 ; 정보검색단계
상기 검색서버(110)는 전송된 검색정보에 따라 정보DB(170)를 검색한다. 상 기 정보DB(170)는 일반 인터넷일 수 있으나, 본 발명에 따른 실시예에서는 업체의 광고물이 저장되는 광고DB(AD DB) 및/또는 UDDI(universal description, discovery, and integration)으로 하였다. 하지만, 본 발명에 따른 검색방법은 이에 한정되는 것은 아니다.
일예로, 상기 박차장이 입력한 검색정보는 검색서버(110)의 검색 키워드가 되어 상기 정보DB(170)에서 해당 내용이 포함된 정보를 검색한다.
S50 ; 검색결과물 1차순위 결정단계
상기 정보DB(170)로부터 검색된 검색 결과물은 사용자(10)의 검색 의도를 파악하여 그 순위가 결정된다.
이를 위해 상기 검색 결과물은 매치메이킹 엔진(150)으로 전송된다.
메치메이킹(Matchmaking)은 사용자의 요구사항을 만족하는 웹 서비스(검색정보) 제공자를 연결하기 위한 과정으로 웹 서비스 요청(검색정보 입력)과 웹 서비스 제공자가 제공한 검색 결과물 간의 일치 여부에 의해 결정된다.
상기 매치메이킹 엔진(150)은 저장소를 통해 입출력을 지원하고 요청된 서비스의 브라우징, 수정, 취소가 가능하도록 할 수 있다.
다음은 매치메이킹 엔진(150)을 위한 요구사항이다. 한편 본 발명에 따른 검색방법은 일반적으로 웹을 통한 광고기술에 주로 활용될 수 있을 것이므로, 여기서는 사용자(10)가 요구하는 검색 결과물이 광고물인 것으로 하여 설명한다. 그러나, 본 발명에 따른 기술적 사상이 검색 결과물이 광고물에 한정되는 것은 아니다.
광고(Advertising) : 사용자(10)와 웹 서비스 제공자는 서비스 요청과 제공 을 위한 정보를 기술해야 한다. 또한 적합한 상대를 찾기 위해 부가적인 정보가 요구되며 추론정보는 협상절차를 위한 규칙들 뿐만 아니라 협상 용어들과 조건들이 표시되어야 한다.
질의(Querying) : 적합한 광고들을 찾기 위해 모든 광고들에 대한 필터링이 가능해야 하는데 이러한 작업은 서비스 요청자의 요구에 따라 이루어져야 한다. 또한 온톨로지 서버를 통해 사용자 질의에 대한 정확한 분석이 선행되어야 하는데 본 발명에 따른 검색방법에서는 온톨로지 서버를 통해 도메인 시멘틱 정보에 대한 분석을 수행할 수 있다.
브라우징(Browsing) : 매치메이킹 엔진(150)은 서비스를 광고 및 질의하기 위한 저장소를 지원해야 하며, 서비스에 대한 수정 및 삭제가 가능해야 한다. 또한 효율적인 브라우징을 위해 매치메이킹 서비스들은 광고들과 용어들에 대한 분류화 작업을 수행해야 한다.
본 발명에 따른 상기 메치메이킹 엔진(150)은 번역모듈(151)과 추론모듈(152)을 포함한다.
상기 번역모듈(151)은 정보DB(170)에 대한 본 발명에 따른 실시예인 UDDI의 서비스 표현을 분석하는 것이다.
상기 추론모듈(152)은 상기 검색 결과물을 분석하여 사용자(10)가 요구한 정보와 검색 결과물 간의 매칭 상태를 확인한다.
본 발명에 따른 검색방법에서는 상기 검색 결과물을 DAML-S 기반의 온톨로지로 정의하고 검색 결과물과 검색정보 간의 일치를 위한 DAML+OIL의 구문의 DL notions을 사용한다.
DL(Description Logics)은 지식 표현 체계형성을 위해 가장 잘 알려진 집합으로 클래스와 같은 개념(concepts)과 이진 관계와 같은 규칙들로 구성된다.
DAML-S는 "Semantic Markup For Web Service" 즉, 시멘틱 웹상의 웹 서비스를 위한 DAML의 확장이라고 정의할 수 있다. 도 3(DAML-S 구성요소를 도시한 블록도)은 DAML-S의 구성요소로 Service 클래스는 서비스의 최상위 계층에 위치하며 리소스들로부터 제공된다. 서비스는 "서비스가 하는 일은 무엇인가?"를 의미하는 서비스 프로파일, "서비스는 어떻게 동작하는가?"를 나타내는 서비스 모델, "서비스가 어떻게 접근할 수 있는가?"를 나타내는 서비스 그라운딩으로 구성된다.
여기서 서비스 기술 언어로써의 DAML-S는 매치메이킹 과정을 위해 서비스 프로파일을 이용하는데, 이는 사용자의 요구를 만족시키는 정보를 에이전트가 찾을 수 있도록 도와준다. 또한, 서비스 프로파일은 서비스의 기능을 input, output, precondition, effect로 표현하여 사용자(10)와 서비스 제공자(정보 제공자) 사이의 효율적인 매칭이 가능하다.
상기 추론모듈(152)은 사용자(10)의 검색을 위한 검색정보와 이 검색정보에 의해 검색되는 검색결과물 간의 포함관계에 대한 판단 및 분석이 가능하다. 본 발명에 따른 추론모듈(152)은 DL notions을 이용하여 상기 매치메이킹 엔진(150)을 설계한다.
효율적인 시멘틱 웹 서비스 검색을 위해서는 서비스 요청(검색을 위한 검색정보)과 서비스 광고(상기 검색정보에 대한 검색 결과물) 간의 정확한 일치가 이루 어져야 한다. 이러한 요청과 광고 간의 일치 여부는 서비스 기능적 측면의 입출력의 일치에 따른다. 즉, 서비스 요청의 입력과 서비스 광고의 입력을 비교하여 서로 간에 요소들을 채울 수 있으면 둘 간의 입력이 일치된다고 본다. 반대로 서비스 요청의 출력과 서비스 광고의 출력을 비교하여 서로 간의 요소들을 만족시킬 수 있으면 둘 간에 출력이 일치된다고 본다. 결과적으로 입출력 모두가 일치되면 해당 서비스는 서비스 요청을 올바르게 수행하여 만족스러운 결과를 제공해 주게 된다.
본 발명에서는 이러한 입출력의 일치 여부를 판단하기 위해 Exact, PlugIn, Subsume, Intersection, Fail의 5등급으로 나누어 표시하였으며, [규칙 1]에서 [규칙 5]로 갈수록 낮은 순위가 부여된다.
[규칙 1] Exact
서비스 요청(R)과 서비스 광고(A)가 동일할 경우에 이를 Exact라고 명한다.(R=A)
[규칙 2] PlugIn
서비스 요청이 서비스 광고의 상위클래스일 경우에 이를 PlugIn이라고 명한다.(R⊃A)
[규칙 3] Subsume
서비스 요청이 서비스 광고의 하위클래스일 경우에 이를 Subsume이라고 명한다.(R⊂A)
[규칙 4] Intersection
서비스 요청과 서비스 광고 간의 교차점이 발생하면 이를 Intersection이라고 명한다.(R∩A)
[규칙 5] Fail
서비스 요청과 서비스 광고 간의 일치 부분이 없으면 이를 Fail이라고 명한다.(R≠A)
여기서, [규칙 2]와 [규칙 3]이 혼동될 수 있다. 예를 들어, "남자" 타입의 출력을 내주는 서비스를 원하는 경우, "남자"가 "사람" 클래스의 하위 클래스라 하여 "사람" 타입의 출력을 결과로 찾아 준다면 이 서비스는 적합하지 않을 것이다. 따라서, 종래 일치방식과는 다르게 본 발명에 따른 검색방법에서는 [규칙 2]와 [규칙 3] 방식을 기준으로 "남자"를 입력으로 받는 서비스를 원할 경우 요청의 검색정보가 검색 결과물보다 크거나 동일할 경우에 우선 등급을 부여하였다.
이상 상술한 검색결과물 1차순위 결정단계(S50)는 일예로, 박차장이 입력한 검색정보(서비스 요청)인 카메라 폰, 삼성핸드폰, 20만원 이하의 가격대, 20만원 이상의 가격대일 경우 대기업 OEM 제품으로 대체 등을 통해 검색된 검색 결과물들을 상기 규칙에 따라 순위를 결정한다.
S80 ; 검색결과물 출력단계
상기 검색서버(110)는 상술한 결과에 따른 순위로 검색 결과물을 사용자(10) 단말기에 전송한다.
도 4는 본 발명에 따른 시멘틱 웹 서비스 검색방법에 대한 다른 실시예를 순차 도시한 플로우차트이고, 도 5는 본 발명에 따른 검색어 분석단계 및 도메인 시 멘틱정보 제공단계를 구체화한 플로우차트 인바, 이를 참조하여 설명한다.
e-엔진 온톨로지 서버(120)는 월드맵(121 ; 이하 정보검색모듈)과 컨텐츠 매니지먼트 모듈(122 ; 이하 검색정보 분석모듈)로 구성되며 상기 검색정보 분석모듈(122)은 e-엔진 신텐틱 레이어(Syntactic Layer ; XML), e-엔진 시멘틱 레이어(Semantic Layer ; RDF)를 포함한다. 상술된 구성을 갖는 상기 e-엔진 온톨로지 서버(120)는 웹상의 정보를 단순한 데이터 차원으로 처리하면서도 검색된 데이터들에 의미론적 가치를 적용하여, 최종적으로 검색 및 생성된 정보가 사용자가 요구하는 가치를 지닌 상태로 향상될 수 있도록 하는 알고리즘을 포함한다.
상기 e-엔진 신텐틱 레이어는 임의의 문서구조를 지정할 수 있는 반면에 문서구조가 갖는 의미에 대해서는 정의하지 못하며 표현한 문서의 의미를 해석하는 역할은 하지 않는다. 즉, 상기 e-엔진 신텐틱 레이어는 문서구조를 이루는 각 단어들의 구문적 차원에서의 정의만을 수행하며, 데이터 표현층에서 XML로서 구현된다.
상기 e-엔진 시멘틱 레이어는 웹이 포함하고 있는 내용을 이해하고 조작하기 위해, 사람이 아닌 컴퓨터가 정보의 의미를 이해할 수 있는 자원을 제공한다. 즉, 컴퓨터가 정보의 의미를 이해하기 위해 해당 데이터에 대한 추론을 규정하는 규칙과 이 규칙을 표현할 수 있는 언어를 제공한다. 이러한 언어로는 웹상의 정보와 다른 정보와의 관계를 표현하기 위한 RDF(Resource Description Framework)가 있다.
상기 RDF는 프레임워크와 스키마를 통해 구현된다.
계속해서, 상기 정보검색모듈(121)은 상기 검색정보 분석모듈(122)에서 구문론적ㆍ의미론적으로 처리된 웹상의 정보를 지식으로서의 가치를 지닌 상태로 향상시킨다.
서로 다른 두 개의 데이터가 의미상으로 보면 같은 의미의 구조와 명칭을 가질 수 있다. 예를들어 "영화"라는 데이터가 있을 때 이 태그를 <movie>는 물론 <cinema> 또는 <screen>으로도 표현할 수 있다. 따라서, 위의 세 단어는 의미상으로 보면 같은 의미의 태그이고 이를 하나의 추상적인 스키마(Abstract Schema)로 통합하거나 의미론적으로 연결한다. 상기 정보검색모듈(121)은 이러한 표준 규약 및 존재론에 대한 역할을 담당한다.
한편, 온톨로지는 유형별로 세분화하면 도메인 온톨로지, 메타데이터 온톨로지, 개념적 온톨로지로 구분할 수 있다. 도메인 온톨로지는 특정 분야에 한정되는 온톨로지이고, 메타데이터 온톨로지는 온라인 정보자원의 내용을 기술하기 위한 온톨로지이다. 개념적 온톨로지는 프레임 온톨로지와 같이 여러 개념을 객체 지향적으로 표현할 때 쓰이는 프레임, 슬롯 등과 같은 메타 수준의 온톨로지로 어떤 특정 영역에서의 개념에 관한 것이라기보다는 다른 개념을 온톨로지로 표현하는데 쓰이는 개념 표현을 위한 온톨로지를 말한다.
상기 정보검색모듈(121)은 컨텐츠 매니저, 스키마 매니저, 시소러스 매니저로 구성된다. 상기 컨텐츠 매니저는 시멘틱 메타데이터에 대한 정의ㆍ의미론적 데이터 검색을 위한 분류 모델 정의ㆍ메타데이터 간의 관계를 정의해 놓은 레이어로 표준 데이터 분류 모델이 정의되어 있어 상기 검색서버(110)에게 일관된 분류 체계 를 제공해 준다.
상기 스키마 매니저는 상기 컨텐츠 매니저의 표준 분류 모델과 시소러스 매니저의 의미론적 통합 모델에 대한 표준 데이터 타입 및 형식이 정의되어 있다.
상기 시소러스 매니저는 전자상거래 국제 표준에 따라 식별ㆍ속성 표준을 정의한 일종의 백과사전으로 스키마 통합이나 유사 용어들에 대한 통일 및 재구성의 역할을 담당한다. 즉 의미론적 유사어에 대한 통합화 기능이 있다. 이러한 통합화 기능에서 가장 중요한 것은 상호 이질적 온톨로지 간의 변환작업이다. 즉 온톨로지 통합에 있어 가장 중요한 점이 상이한 두 온톨로지 간의 병목현상을 해결하는 일인데 이러한 온톨로지 변환을 위해서 하나의 온톨로지를 이용하여 표현한 정보 또는 서비스를 스키마 매니저와 시소러스 매니저의 표준을 이용하여 변환한다. 또한 기존 시스템들 대부분이 구문적 변환만을 다루었으나 본 발명에 따른 검색시스템은 의미론적 변환을 위한 새로운 기법으로 DAML + OIL 지식의 자동추론 기법을 이용하여 병합한다.
결과적으로, 상술한 구성을 갖는 e-엔진 온톨로지 서버(120)는 사용자가 검색을 희망하는 단어 또는 문장을 입력하면, 해당 단어 및 문장을 확인하고, 확인된 결과를 근거로 컨텐츠 DB 서버(140)를 검색하여 필요한 도메인 시멘틱 정보를 추출한다.
이상 기술한 검색시스템을 통해 본 발명에 따른 검색방법은 다음의 과정이 더 포함될 수 있다.
S20 ; 검색어 분석단계
상기 사용자 검색정보 입력단계(S10)를 통해 입력된 검색정보는 상기 e-엔진 온톨로지 서버(120)로 전송된다. 여기서 입력된 검색정보는 "제일제당의 OEM이 부착된 식품"으로 예시하여 설명한다.
상기 검색정보를 받은 e-엔진 온톨로지 서버(120)는 상기 검색정보 분석모듈(122) 기반 하에 관련 온톨로지를 검색하고 이를 제공하는 상기 정보검색모듈(121)을 포함한다. 따라서, 상기 e-엔진 온톨로지 서버(120)는 검색정보인 "제일제당의 OEM이 부착된 식품"과 관련된 도메인 시멘틱 정보 즉, 온톨로지를 확인한다.
검색정보인 "제일제당의 OEM이 부착된 식품"을 해석함에 있어, 상기 스키마 매니저는 상기 검색정보의 형식을 확인하고(본 실시예에서, 상기 검색정보는 스트링(string) 형식을 취함), 상기 컨텐츠 매니저에서는 "제일제당", "OEM" 및 "식품" 의 의미를 확인한다. 상기 시소러스 매니저는 상기 컨텐츠 매니저에서 확인한 각 단어들의 의미와 유사한 동의어 및 다의어(동음어)를 검색한다.
즉, 음은 동일하지만 그 의미가 다른 동음어가 있는지 여부를 확인한다.(S25)
S30 ; 도메인 시멘틱정보 제공단계
상기 검색서버(110)의 검색을 위해 제공되는 도메인 시멘틱정보를 확정하기 위한 단계로, 다음의 과정을 통해 진행된다.
S32 ; 재질의를 통한 온톨로지 확정단계
상기 e-엔진 온톨로지 서버(120)는 검색정보를 구성하는 단어들 중 다의어(동음어)를 선택한 후 이를 사용자(10)에게 재질의를 통해 검색범위를 한정한다.
즉, 검색정보를 구성하는 단어 중, "OEM"은 "주문자 부착 상표 방식", "회사끼리의 파트너 프로그램인 Macromedia 한국 - 파트너:파트너 프로그램" 또는 "Object Embedding Method"의 의미를 갖는 바, 본 발명에 따른 정보검색시스템(100)은 사용자(10)에게 "OEM"에 관한 상기 세 가지 의미를 제시하여 검색범위를 좁힌다.
사용자(10)는 제시된 세 가지 예시들 중 사용자(10)가 검색하고자 하는 대상인 "주문자 부착 상표 방식"을 선택한다. 물론, 상기 e-엔진 온톨로지 서버(120)는 사용자(10)에 의해 선택된 "OEM"의 의미를 가지고 실제 검색에 필요한 도메인 시멘틱 정보를 완성하여 상기 검색서버(110)로 전송한다.(S34)
S36 ; 검색정보를 구성한 용어의 유사어 확인단계
상기 시소러스 매니저는 상기 온톨로지 확정단계를 통해 확정된 다의어의 의미와, 기타 검색정보를 구성하는 다른 단어들의 의미를 갖는 단어들을 상기 컨텐츠 DB 서버(140)에서 검색한다.
이상의 상술한 과정을 통해, 종래 웹 검색 엔진이 질문의 의미론적 연결을 고려하지 않음으로서, "OEM"이라는 검색어가 "주문자 부착상표 방식" 인지 아니면 "회사끼리의 파트너 프로그램인 마크로미디어 한국 - 파트너 : 파트너 프로그램" 인지 아니면 "Object Embedding Method" 인지를 알 수가 없던 종래 문제를 극복할 수 있다.
또한, 사용자(10)가 어떠한 검색결과물을 제공받기 위해 입력하는 검색정보가 특정 용어에 국한되어도, 그 용어와 유사한 용어까지 확인하여 검색에 적용함으 로서 보다 효율적인 검색결과물을 기대할 수 있게 된다.
계속해서, 본 발명에 따른 검색방법은 메치메이킹 방법의 효율성과 정확성을 위해 일치등급 부여방식을 두 단계로 나누어 진행하도록 할 수 있다.
즉, 도 4에 도시된 바와 같이, 본 발명에 따른 검색방법에서는 검색결과물 2차순위 결정단계(S60)가 더 포함될 수 있다.
따라서, 상기 1차순위 결정단계(S50) 진행 후, 상기 2차순위 결정단계(S60)가 진행되며, 당해 단계(S60)에서는 [규칙 2] 및 [규칙 3]에 대해 기존 벡터 모델방식 및 이를 수정한 새로운 순위적용 알고리즘을 적용시켜 그 순위결정을 세분화한다.
본 발명에 따른 일치등급 부여 알고리즘은 다음과 같다.
1단계
First_Match_Compare(output.R, output.A)
{
if output.R is equivalent to output.A then Level = Exact;return
Exact;
else if output.R is SuperClassOf output.A then Level = PlugIn;
return PlugIn;
else if output.R is SubClassOf output.A then Level = SubSume;
return SubSume;
else if output.R is not incomparable with output.A then Level =
Intersection;return Intersection;
else Level = Fail;return Fail;
}
R : request, A : Advertisement
2단계
Second_Match_Compare(output.R, output.A)
{
Switch(Level){
case Exact:
Level_rank = 0;
Break;
case PlugIn:
case Subsume:
Call Function Ranking_Compare();
Break;
}
}
여기서 2단계의 일치등급 부여방식은 일치등급이 Exact, PlugIn, Subsume 일 경우에 적용된다. 먼저 일치등급이 Exact일 경우엔 서비스 요청과 서비스 광고가 정확하게 일치하는 경우로 최상위 등급을 부여한다. 그 다음에 서비스 요청과 서비스 광고 간의 포함관계가 형성될 경우에는 도 1에 도시된 시멘틱 매니지먼트 서버(130)를 구동시켜 Ranking_Compare() 함수를 호출한다.
상기 Ranking_Compare() 함수는 같은 등급의 서비스들 간의 순위부여를 위해 반드시 필요한 함수로 각 용어 간의 관계성 즉, 상속 계층 간의 수직, 수평 근접도와 용어들 간의 동의어 관계를 이용하여 순위를 적용한다. 따라서, 1단계의 단순 일치등급 부여방식을 보완하기 위해 보다 세분화된 2단계 일치등급 부여방식이 부여됨으로서 검색결과물에 대한 확실한 우선 순위를 제공할 수 있고, 결과적으로 보다 정확하고 효율적인 검색결과물의 제공을 기대할 수 있게 된다.
도 6은 코사인 유사도를 구하는 식과, 상기 코사인 유사도를 표현한 도면이다.
호출된 상기 Ranking_Compare() 함수는 상기 분류 및 순위화를 도 6에 도시된 벡터 모델과 코사인 유사도(Cosine Similarity)를 통해 진행할 수 있다.
상기 벡터 모델은 질의나 문헌의 색인어에 비이진 가중치를 할당한다. 이 용어 가중치는 궁극적으로 사용자 질의와 시스템에 저장되어 있는 각 문헌과의 유사도를 계산하는데 사용되는데 검색된 문헌을 이 유사도 값의 내림차순으로 정렬함으로써 벡터공간 모델은 질의 용어에 부분 정합되는 문헌을 검색하게 된다. 벡터 모델에서는 문서와 질의어를 벡터공간 상에서 한점으로 취급한다. 벡터공간은 문헌 콜렉션에 나타나는 색인어에 의해 결정된다.
벡터 모델에서 용어 문헌 쌍(ki, dj)의 가중치 Wi,j는 양의 비이진 값이며, 질의 색인어도 가중치를 가진다. [ki, q]의 가중치를 Wi, q >= 0이라 하면, 질의 벡터는 (w1, q, w2, q .....wi, q)로 정의되며, 여기서 t는 시스템 내의 전체 색인어 수이다. 문헌벡터는 (w1, j, w2, j, .....wi, j)로 표현된다.
따라서, 문헌 dj와 사용자 질의 q는 도 6(b)와 같이 t 차원 벡터로 표시된다. 벡터 모델에서 문헌 dj와 질의 q의 유사도 측정은 두 벡터와의 상관도로 구할 수 있으며, 이 상관도의 예로 두 벡터 간 사이각의 코사인 값으로 정량화 할 수 있다.
한편, 상술한 벡터 모델을 발전시켜 좀더 정밀한 순위결정을 진행할 수 있는데, 이하에서 계속 설명한다.
상기 시멘틱 매니지먼트 서버(130)는 정보추출 에이전트(133 ; 이하 정보추출모듈)를 이용하여 상기 검색서버(110)를 통해 검색된 결과 중 관련 웹 페이지들을 추출하고 Wrapper(132 ; 이하 변환모듈)를 통해 자료 중심의 XML 문서로 변환시킨 후 자동분류모듈(131)을 이용하여 페이지를 자동 분류하고 그 결과를 상기 컨텐츠 DB 서버(140)에 저장한다. 여기서 정보를 자동 분류하고 순위를 부여하기 위해선 관련 페이지들의 유사도를 측정하여야 하는데 이러한 유사도 측정을 위해 본 발명에서는 각 용어들(i) 간의 동의어 관계를 측정한 term relationship 변수, 용어 간에 관계성을 측정한 Semantic Distance 변수를 이용한다.
상기 term relationship 변수는 각 용어가 가지는 유사도 범위를 이용하여 측정하는데 범위는 1에서 9 사이의 값을 가지며 유사성이 높을수록 1에 가깝고 유 사성이 떨어질수록 9에 가까워진다. 각 범위의 비교 대상요소는 검색어, 추출된 문서에 포함된 용어, 온톨로지를 통해 추출된 검색어의 동의어, 온톨로지를 통해 추출된 문서에 포함된 용어의 동의어이다.
상기 term relationship의 정의는 다음과 같다.
Figure 112005055977248-PAT00018
Figure 112005055977248-PAT00019
; term relationship
Figure 112005055977248-PAT00020
; 문서(i)에서 용어(j)의 발생수
Figure 112005055977248-PAT00021
; 용어(j)들간의 유사도 측정 변수
상기 각 용어들 간의 유사도 측정 변수는 다음 표 1과 같은 기준에 의해서 그 값이 결정된다. Ratio 변수의 범위는 1-9 사이의 값으로 지정하였으며, 유사성이 높을수록 1에 가깝고 유사성이 떨어질수록 9에 가까워진다.
비교범위 설명 값(Ration)
1 A와 B의 완전 일치 1
2 C와 B의 완전 일치 2
3 A와 D의 완전 일치 3
4 C와 D의 완전 일치 4
5 A와 B의 부분 일치 5
6 C와 B의 부분 일치 6
7 A와 D의 부분 일치 7
8 C와 D의 부분 일치 8
9 A와 B의 불 일치 9
A ; 검색어 B ; 추출된 문서에 포함된 용어(태그)
C ; 온톨로지를 통해 추출된 A의 동의어
D ; 온톨로지를 통해 추출된 B의 동의어
Semantic Distance 변수는 각 문서가 가지는 구조들의 각 수평 노드간의 근접도(
Figure 112005055977248-PAT00022
)와 각 수직 노드간의 근접도(
Figure 112005055977248-PAT00023
)를 이용하여 가중치를 결정한다. 도 7은 XML 문서와 RDF 문서를 분리해서 Semantic Distance 값을 측정한 것을 비교 분석한 모습을 도시한 도면이다.
여기서 XML 문서와 RDF 문서간의 Semantic Distance 변수값이 다르게 나타나는 이유는 XML 문서는 트리구조의 계층적 방식이고 RDF 문서는 그래프 구조방식으로, "저자(Author)와 출판자(Publisher)가 모두 Berners Lee인 책(book)"을 찾는다고 했을 때 RDF 문서에선 저자와 창작자(creator) 사이의 수평 노드간 거리가 "1"로 매우 밀접한 관련이 있지만 XML 문서에선 수평 노드간 거리가 "3"으로 관련성이 떨어지게 된다.
상기 Semantic Distance(용어간의 관계성, 즉 거리에 따른 근접도를 측정)의 정의는 다음과 같다.
Figure 112005055977248-PAT00024
Figure 112005055977248-PAT00025
Figure 112005055977248-PAT00026
Figure 112005055977248-PAT00027
Figure 112005055977248-PAT00028
; 각 노드간의 수평 근접도,
Figure 112005055977248-PAT00029
; 각 용어간의 수평 근접도
Figure 112005055977248-PAT00030
; 문서내의 각 트리의 level 측정변수
Figure 112005055977248-PAT00031
; 문서(i)에서 용어(j)가 위치한 곳의 level 값
Figure 112005055977248-PAT00032
; 문서(i)에서 최대 level 값
Figure 112005055977248-PAT00033
Figure 112005055977248-PAT00034
; 각 노드간의 수직 근접도
Figure 112005055977248-PAT00035
; 수직 근접도 결정인자(0 < F < 1)
Figure 112005055977248-PAT00036
; 각 용어간의 수직노드 거리
자동 분류 및 순위화를 위한 가중치 부여 비례 반영치(
Figure 112005055977248-PAT00037
)는 다음과 같다.
Figure 112005055977248-PAT00038
Figure 112005055977248-PAT00039
; 각 용어들(i) 간의 동의어 관계를 측정한 term relationship 변수
Figure 112005055977248-PAT00040
; 용어 간의 관계성(relationship)을 측정한 semantic distance 변수
본 발명에 따른 정보검색방법에서는 RDF 문서와 일반 웹 문서를 분류하여 검색하던 종래 방식에서 진일보하여 두 문서 간에 구분을 두지 않고 동일하게 취급한다. 모든 문서들은 온톨로지 정보를 이용하여 동의어 집합요소들을 반영한 순위측정 알고리즘에 의해 성능측정이 이루어지게 되며 최종적으로 순위가 매겨지게 된다.
Figure 112005055977248-PAT00041
Figure 112005055977248-PAT00042
; 가중치 부여 비례 반영치
상기 수식은 의미론적 메타정보를 사용한 RDF 문서와 XML, HTML과 같은 문서들의 자동 분류 및 순위를 부여하기 위한 순위 측정 알고리즘으로 기존 벡터모델의 코사인 유사도와 가중치 부여 비례 반영치(
Figure 112005055977248-PAT00043
)로 이루어진다.
계속해서, 상기 컨텐츠 DB 서버(140)는 RQL 시멘틱 검색엔진(141 ; 이하 RQL 시멘틱 검색모듈)과 저장매니저(142 ; 이하 저장모듈)로 구성된다.
상기 RQL 시멘틱 검색모듈(141)은 상기 e-엔진 온톨로지 서버(110)를 통해 추출된 도메인 시멘틱 정보의 내용에 따라 DB를 검색하여 그 결과물을 상기 시멘틱 매니지먼트 서버(130)로 보내고, 상기 시멘틱 매니지먼트 서버(130)는 상기 인터페이스 매니지먼트 서버(120)의 웹 검색 결과물과 더불어 이들을 분류 및 순위를 결정한다.
상기 RQL 시멘틱 검색모듈(141)은 RQL 컨버터(141a)와 엔진분석기(141c)로 구성된다.
상기 RQL 컨버터(141a)는 RQL(RDF Query Language)을 사용하여 질의문을 생성한다. RQL은 RDF와 RDF스키마를 위한 질의 언어로 RDF/RDF 스키마로 표현된 지식을 기반으로 에이전트 간에 질의를 던져서 사용자가 원하는 응답을 받아내는 방식이다.
상기 엔진분석기(141c)는 상기 RQL 컨버터(141a)를 통해 나온 결과를 상기 저장모듈(142)로 보낸 후 각 구성요소를 분석ㆍ저장한다.
상기 저장모듈(142)은 상기 e-엔진 온톨로지 서버(120)의 온톨로지 정보를 바탕으로 상기 시멘틱 매니지먼트 서버(130)을 통해 분류된 웹 문서들을 RDF와 DAML-OIL 형식으로 변환하여 각 페이지의 URL 정보와 함께 저장한다. 저장된 정보는 저장모듈(142)에 구성된 저장정보확인수단(142a)을 통해 확인할 수 있으며, 여기서 해당 정보의 수정이 가능하다.
이상 상술한 내용에 따른 본 발명에 따른 검색방법에서 상기 검색결과물 2차순위 결정단계(S60)는 다음과 같이 그 과정이 세분화될 수 있다.
도 8은 본 발명에 따른 검색방법의 2차 순위결정단계를 세분화한 플로우차트인바 이를 참조하여 설명한다.
S62 ; 2차 순위결정단계 대상 확인단계
이미 설명한 바와 같이, 2차 순위결정단계가 적용되는 대상은 1차 순위결정단계(S50)를 통해 결정된 [규칙 2] 및 [규칙 3]인 PlugIn 및 Subsume에 한정된다.
따라서, 상기 1차 순위결정단계를 통해 결정된 각 검색결과물의 해당 [규칙]을 확인하여 2차 순위결정 대상을 확인한다.
S64 ; RQL을 이용한 RDF 문서검색단계
본 발명에 따른 검색시스템 및 검색방법에서는 RQL을 이용한 RDF 문서 검색 방법을 위해서 Jena API를 사용하였다.
상기 Jena는 시멘틱 웹 응용을 위한 자바 프레임워크로 RDF, RDF(s), OWL과 같은 시멘틱 웹 문서를 다룰 수 있는 프로그래밍 환경을 제공한다. Jena는 공개소스로 RQL, OWL API, RDQL(A Query Language for RDF)의 요소들을 포함한다.
S66 ; 검색결과물 순위결정단계
검색결과물인 URI 정보는 상기 시멘틱 매니지먼트 모듈(130)로 전송되며, 상기 정보추출에이전트(133)를 통해 관련 웹페이지들이 추출된다. 이렇게 추출된 웹페이지는 상기 변환모듈(132)에 의해 자료중심의 XML 문서로 변환되고, 상기 자동분류모듈(131)로서 순위가 부여되어 저장된다.
검색결과물에 대한 순위 부여는 본 발명에 따른 term relationship 변수와 semantic distance 변수를 통해 연산된다.
도 9는 본 발명에 따른 검색방법에서 검색결과물에 대한 규칙기반 검색단계를 세분화한 플로우차트인바, 이를 참조하여 설명한다.
도 4에 도시된 바와 같이, 본 발명에 따른 검색방법은 사용자의 검색 이력 또는 각종 초기 입력정보를 검색결과물의 선택에 적용하여 사용자가 의도한 검색결과에 가까워질 수 있도록 한다.
이를 위해 본 발명에 따른 검색시스템은 사용자 프로파일 레지스트리(160)를 포함한다.
또한, 상기 사용자 프로파일 레지스트리(160)는 사용자의 초기 입력정보 및/또는 검색 이력정보가 저장되는 저장모듈(162)과, 이 저장모듈(162)의 입출력을 처리하는 입출력모듈(161)을 구비한다.
상기 입출력모듈(161)은 사용자가 입력한 검색정보와 상기 1,2차 순위결정단계를 통해 순위화된 검색결과물을 확인하여 이에 상응하는 정보를 상기 저장모듈(162)에서 검색하며, 당해 사용자가 그동안 검색한 내용과 그 내용의 처리사항 등을 이력정보로 저장한다.
이를 보다 구체적으로 설명하기 위해 아래에서 예시를 들어 설명하도록 한다.
본 발명에 따른 검색방법은 규칙기반 검색단계(S70)를 더 포함한다. 이를 위해 상기 규칙기반 검색단계(S70)는 사용자정보 검색단계(S72)와 검색결과물 선택(S74)를 통해 진행된다.
S72 ; 사용자정보 검색단계
상기 입출력모듈(161)은 사용자가 입력한 검색정보와 1,2차 순위결정을 통해 순위화된 검색결과물을 확인하여 상기 저장모듈(162)을 검색한다.
일예로, 상기 입출력모듈(161)은 카메라 폰, 삼성핸드폰, 20만원 이하의 가격대, 20만원 이상의 가격대일 경우 대기업 OEM 제품으로 대체 등에 대한 사용자 검색정보를 입력한 박차장의 저장모듈(162)을 확인하여 박차장이 대기업 OEM 제품으로 한맥이라는 브랜드를 선호하고 제품을 구입할 때 가격대비 다양한 기능을 보유한 제품을 선호하는 경향이 있다는 정보를 얻는다. 따라서, 상기 1,2차 순위결정을 통한 검색결과물 중 한맥과 가격대비 기능의 다양성을 그 순위결정에 반영하여 이를 재조정한다.
S74 ; 검색결과물 조정단계
상술한 바와 같이, 사용자정보에 따라 상기 1,2차 순위결정을 통한 검색결과물 중 당해 사용자정보에 부합하는 검색결과물을 선택하거나 그 순위를 재조정한다.
상술한 본 발명에 따른 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스 검색방법을 실현한 실시예를 이하에서 제시한다.
앞서 보인 일예를 바탕으로 온톨로지를 정의한 예로서, 온톨로지의 정의를 위해서 DAML-S 0.9 버전의 서비스 프로파일 클래스를 이용하여 광고(Advertisement), 요청(Request) 서비스를 정의하였다. 또한 구문 규칙을 표현하기 위해서 DAML+OIL 구문의 DL notions을 사용하였으며 표현된 방식은 다음과 같다.
ServiceProfile ⊆ ⊥
Advertisement ⊆ ServiceProfile
Query ⊆ ServiceProfile
또한, Sales와 Provider, Product 온톨로지를 추가로 정의한다.
Sales ⊆ (= | providedBy.Provider) ∩
(= | hasFeatureSelction.FeatureTyper) ∩
(= | hasQuantity.Integer) ∩
(= | hasProductPrice.Integer)
Provider ⊆ (= | hasName.ProviderMame) ∩
(= | hasCompanyName.CompanyName)
Product ≡ hasbuilt-inCamera.Item
Item ≡ Cellular-Phone U PDA
도 10은 본 발명에 따른 실험방법의 실시예인 핸드폰 구매를 위한 서비스 요청 서비스의 알고리즘을 보인 도면이고, 도 11은 본 발명에 따른 실험방법의 실시예인 핸드폰 구매를 위한 서비스 광고 서비스의 알고리즘을 보인 도면이다.
도 10 및 도 11은 서비스 제공자의 광고와 서비스 요청자의 질의 온톨로지로 서비스 요청자는 카메라폰 기능이 있는 20만원 이하의 삼성 핸드폰을 원하고, 서비스 제공자는 20만원 이하의 핸드폰을 제공하기는 하지만 삼성 제품인지의 여부는 알 수 없다. 위의 결과를 바탕으로 일치순위등급을 부여할 경우 서비스 요청자의 정보가 서비스 제공자의 광고를 포함하므로, 당해 알고리즘이 적용된 검색결과물은 [규칙 2]의 등급에 해당하는 결과를 받게 된다.
이상 본 발명에 따르면, 사용자의 검색정보와 검색결과물과의 관계를 확인하여 사용자가 의도한 검색결과에 가까운 순으로 그 검색결과물을 제공할 수 있고, 각각의 검색결과물을 더욱 세분화하여 사용자의 검색결과에 대한 만족도를 높일 수 있는 한편, 검색결과물과 사용자 기본 정보의 비교를 통해 사용자가 다르더라도 검색정보가 동일하면 동일한 검색결과가 나오는 단순한 문답형태의 검색이 아닌 사용자 별로 그 특성을 살려 적합한 검색결과물을 제공할 수 있는 효과가 있다.

Claims (5)

  1. 사용자가 입력한 검색정보에 따라 정보DB를 검색하는 정보검색단계;
    검색된 검색결과물을 확인하여, 검색정보와 검색결과물이 동일한 경우([규칙 1], Exact), 검색정보가 검색결과물의 상위클래스일 경우([규칙 2], PlugIn), 검색정보가 검색결과물의 하위클래스일 경우([규칙 3], Subsume), 검색정보와 검색결과물의 일부만이 동일한 경우([규칙 4], Intersection) 및 검색정보와 검색결과물 간의 일치점이 없는 경우([규칙 5], Fail) 순으로 순위를 설정하는 검색결과물 1차순위 결정단계; 및
    상기 검색결과물 1차순위 결정단계를 통해 순위화된 검색결과물을 사용자에게 출력하는 검색결과물 출력단계;
    를 포함하는 것을 특징으로 하는 시멘틱 웹 서비스 검색방법.
  2. 제 1 항에 있어서,
    상기 검색정보의 시멘틱 정보를 확인하여, 온톨로지 정보가 저장된 데이터베이스에서 상기 검색정보 내 입력단어의 동음어를 확인하는 시멘틱 정보확인단계;
    상기 시멘틱 정보확인단계를 통해 해당 단어의 동음어가 둘 이상 있을 경우, 사용자에게 재질의를 해 온톨로지를 확정하는 온톨로지 확정단계; 및
    상기 온톨로지 확정단계를 통해 확정된 동음어의 의미와 유사한 유사어를 확인하여, 검색에 필요한 도메인 시멘틱 정보를 완성하는 유사어 확인단계;
    를 더 포함하는 것을 특징으로 하는 시멘틱 웹 서비스 검색방법.
  3. 제 2 항에 있어서,
    RDF 문서를 저장하는 데이터베이스에서 상기 도메인 시멘틱 정보와 관련된 정보를 검색하는 RDF 문서 검색단계; 및
    상기 검색결과물 1차순위 결정단계를 통해 순위화된 검색결과물과 상기 RDF 문서 검색단계를 통해 검색된 결과물을 순위화하는 검색결과물 순위결정단계;
    로 이루어진 검색결과물 2차순위 결정단계를 더 포함하는 것을 특징으로 하는 시맨틱 웹 서비스 검색방법.
  4. 제 3 항에 있어서, 상기 검색결과물 순위결정단계는
    그 순위결정 기준을 용어 간의 관계성(Semantic Distance ; Dj) 대비 용어들 간의 동의어 관계(Term Relationship ; Rj)의 결과값과, CosSim(dj, q)과의 곱의 연산값을 기준으로 하여 검색한 정보의 순위를 분류하되;
    상기 용어 간의 관계성(Dj)은,
    Figure 112005055977248-PAT00044
    Figure 112005055977248-PAT00045
    ,
    Figure 112005055977248-PAT00046
    ,
    Figure 112005055977248-PAT00047
    Figure 112005055977248-PAT00048
    ; 각 노드간의 수평 근접도,
    Figure 112005055977248-PAT00049
    ; 각 용어간의 수평 근접도
    Figure 112005055977248-PAT00050
    ; 문서내의 각 트리의 level 측정변수
    Figure 112005055977248-PAT00051
    ; 문서(i)에서 용어(j)가 위치한 곳의 level 값
    Figure 112005055977248-PAT00052
    ; 문서(i)에서 최대 level 값
    Figure 112005055977248-PAT00053
    Figure 112005055977248-PAT00054
    ; 각 노드간의 수직 근접도
    Figure 112005055977248-PAT00055
    ; 수직 근접도 결정인자(0 < F < 1)
    Figure 112005055977248-PAT00056
    ; 각 용어간의 수직노드 거리
    이고;
    상기 용어들 간의 동의어 관계(Rj)는,
    Figure 112005055977248-PAT00057
    Figure 112005055977248-PAT00058
    ; term relationship
    Figure 112005055977248-PAT00059
    ; 문서(i)에서 용어(j)의 발생수
    Figure 112005055977248-PAT00060
    ; 용어(j)들간의 유사도 측정 변수
    인 것을 특징으로 하는 시맨틱 웹 서비스 검색방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 검색결과물이 사용자에게 출력되기 전, 해당 검색결과물은 규칙기반 검색단계를 거쳐 검색결과물들의 순위 재조정 및 검색결과물의 추출이 이루어지되, 상기 규칙기반 검색단계는, 사용자 정보가 저장된 저장모듈에서 당해 검색정보 및 검색결과물과 관련된 정보를 검색하는 사용자정보 검색단계와, 상기 검색결과물을 상기 사용자정보 검색단계에서 검색된 사용자정보와 비교하여 이들의 순위를 재조정하고, 상기 사용자정보와 관련성이 먼 검색결과물은 추출하는 검색결과물 조정단계로 된 것을 특징으로 하는 시맨틱 웹 서비스 검색방법.
KR1020050092847A 2005-10-04 2005-10-04 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스검색방법 KR100794323B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050092847A KR100794323B1 (ko) 2005-10-04 2005-10-04 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스검색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050092847A KR100794323B1 (ko) 2005-10-04 2005-10-04 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스검색방법

Publications (2)

Publication Number Publication Date
KR20070037808A true KR20070037808A (ko) 2007-04-09
KR100794323B1 KR100794323B1 (ko) 2008-01-11

Family

ID=38159391

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050092847A KR100794323B1 (ko) 2005-10-04 2005-10-04 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스검색방법

Country Status (1)

Country Link
KR (1) KR100794323B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100902759B1 (ko) * 2007-10-22 2009-06-15 아주대학교산학협력단 알디에프 뷰에 기반하는 정보 보호 방법
KR100903499B1 (ko) * 2007-12-27 2009-06-18 엔에이치엔비즈니스플랫폼 주식회사 검색 의도 분류에 따른 광고 제공 방법 및 상기 방법을수행하기 위한 시스템
WO2009131386A2 (ko) * 2008-04-23 2009-10-29 재단법인서울대학교산학협력재단 시맨틱 웹 자원의 랭킹처리방법
KR100964013B1 (ko) * 2007-11-09 2010-06-15 광주과학기술원 사용자 선호도 기반의 데이터 변환 서비스 시스템 및 그방법
WO2010071245A1 (en) * 2008-12-15 2010-06-24 Korea Institute Of Science & Technology Information System and method for efficient reasoning using view in dbms-based rdf triple store
KR101140724B1 (ko) * 2009-08-31 2012-05-04 서울시립대학교 산학협력단 개념 네트워크 기반 사용자 프로파일 구성 방법 및 시스템과 이를 이용한 개인화 질의 확장 시스템
KR20200129232A (ko) 2019-05-07 2020-11-18 한국정보통신기술협회 의료용 소프트웨어를 위한 테스트 자동화 프레임워크 시스템 및 테스트 자동화 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100378240B1 (ko) 2000-08-23 2003-03-29 학교법인 통진학원 엔트로피와 사용자 프로파일을 적용한 문서순위 조정방법
BR0210589A (pt) * 2001-06-22 2005-04-26 Nosa Omoigui Sistema e método para a recuperação, o gerenciamento, a entrega e a apresentação do conhecimento
KR100546743B1 (ko) * 2003-10-02 2006-01-26 한국전자통신연구원 언어분석 기반 자동 질문/정답 색인 방법과 그 질의응답방법 및 시스템

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100902759B1 (ko) * 2007-10-22 2009-06-15 아주대학교산학협력단 알디에프 뷰에 기반하는 정보 보호 방법
KR100964013B1 (ko) * 2007-11-09 2010-06-15 광주과학기술원 사용자 선호도 기반의 데이터 변환 서비스 시스템 및 그방법
KR100903499B1 (ko) * 2007-12-27 2009-06-18 엔에이치엔비즈니스플랫폼 주식회사 검색 의도 분류에 따른 광고 제공 방법 및 상기 방법을수행하기 위한 시스템
WO2009131386A2 (ko) * 2008-04-23 2009-10-29 재단법인서울대학교산학협력재단 시맨틱 웹 자원의 랭킹처리방법
WO2009131386A3 (ko) * 2008-04-23 2010-03-04 재단법인서울대학교산학협력재단 시맨틱 웹 자원의 랭킹처리방법
KR100963623B1 (ko) * 2008-04-23 2010-06-15 재단법인서울대학교산학협력재단 시맨틱 웹 자원의 랭킹처리방법
WO2010071245A1 (en) * 2008-12-15 2010-06-24 Korea Institute Of Science & Technology Information System and method for efficient reasoning using view in dbms-based rdf triple store
US8352403B2 (en) 2008-12-15 2013-01-08 Korea Institute Of Science And Technology Information System and method for efficient reasoning using view in DBMS-based RDF triple store
KR101140724B1 (ko) * 2009-08-31 2012-05-04 서울시립대학교 산학협력단 개념 네트워크 기반 사용자 프로파일 구성 방법 및 시스템과 이를 이용한 개인화 질의 확장 시스템
KR20200129232A (ko) 2019-05-07 2020-11-18 한국정보통신기술협회 의료용 소프트웨어를 위한 테스트 자동화 프레임워크 시스템 및 테스트 자동화 방법

Also Published As

Publication number Publication date
KR100794323B1 (ko) 2008-01-11

Similar Documents

Publication Publication Date Title
KR100794323B1 (ko) 자동화된 통합 프레임워크를 위한 확장된 시멘틱 웹 서비스검색방법
Ludwig et al. Semantic approach to service discovery in a Grid environment
Aldea et al. An Ontology-Based Knowledge Management Platform.
Ashraf et al. A framework for measuring ontology usage on the web
Al-Sayed et al. An intelligent cloud service discovery framework
Hsu Personalized web feeds based on ontology technologies
Pakari et al. Web service discovery methods and techniques: A review
Rajasurya et al. Semantic information retrieval using ontology in university domain
Kim et al. Agent based intelligent search framework for product information using ontology mapping
Phan et al. Ontology-based heuristic patent search
KR20070065774A (ko) 온톨로지를 이용한 시맨틱 블로그 관리 시스템 및 방법
Aslam et al. SPedia: a central hub for the linked open data of scientific publications
KR100794302B1 (ko) 의미론적 데이터 통합을 위한 시멘틱 웹 기반의정보검색시스템과 정보검색방법
Kwon et al. Recommendation of e-commerce sites by matching category-based buyer query and product e-catalogs
Obidallah et al. A survey on web service discovery approaches
Ludwig et al. Matchmaking framework for mathematical web services
Nguyen et al. Domain ontology construction using web usage data
Zemmouchi-Ghomari Linked Data: A Manner to Realize the Web of Data
Cornelis Personalizing search in digital libraries
Powell et al. Semantically enhancing collections of library and non-library content
Zhang et al. Conceptual frameworks of geospatial semantic web
Paulus et al. Recommending Semantic Concepts for Improving the Process of Semantic Modeling
Arnicans et al. Intelligent integration of information from semistructured web data sources on the basis of ontology and meta-models
KR20100067764A (ko) 전자상거래에서 온톨로지 기반의 상품정보 서비스 시스템 및 방법
Alti et al. Ontology and tool support for quality service management

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
G170 Publication of correction
FPAY Annual fee payment

Payment date: 20130103

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131231

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee