KR101818716B1

KR101818716B1 - 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체

Info

Publication number: KR101818716B1
Application number: KR1020110097524A
Authority: KR
Inventors: 이호석; 윤도영
Original assignee: 네이버 주식회사
Priority date: 2011-09-27
Filing date: 2011-09-27
Publication date: 2018-01-15
Also published as: KR20130033694A

Abstract

본 발명은 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체에 관한 것이다. 본 발명의 일 태양에 따르면, 컨셉 키워드 확장 데이터 셋 생성장치에 의해 수행되는 컨셉 키워드 확장 데이터 셋 생성방법에 있어서, (a) 키워드 그룹으로부터 컨셉 키워드를 추출하는 단계; (b) 상기 키워드 그룹과 상기 컨셉 키워드 간의 컨셉 키워드별 그룹 연관도 점수를 산출하는 단계; 및 (c) 상기 컨셉 키워드별 그룹 연관도 점수에 기초하여 서로 연관 관계를 가지는 복수의 컨셉 키워드를 결정하고, 상기 결정된 복수의 컨셉 키워드를 키워드 확장 데이터 셋으로 설정하는 단계를 포함하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법이 제안된다.

Description

컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체{METHOD, APPARATUS AND COMPUTER READABLE RECORDING MEDIUM FOR GENERATING EXETENSION DATA-SET OF CONCEPT KEYWORDS}

본 발명은 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체에 관한 것으로서, 더욱 상세하게는 키워드로부터 수식어와 컨셉 키워드를 구분하여 각각을 추출하고, 추출된 컨셉 키워드 간의 연관관계에 따라 연관관계를 가지는 컨셉 키워드들의 집합인 컨셉 키워드 확장 데이터 셋을 생성할 수 있는 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체에 관한 것이다.

인터넷의 광범위한 보급에 따라 인터넷을 이용한 검색이 일반화되었으며, 근래 모바일 기기의 발달로 인하여 이러한 인터넷 검색이 더욱 더 활성화되고 있는 추세이다. 통상적으로 사용자는 정보통신기기를 조작하여 검색 서버에 접속한 후, 자신이 검색하고자 하는 정보에 대한 검색 키워드를 검색창에 입력함으로써 인터넷 검색을 수행하게 된다. 종래기술에 따른 검색 서비스의 경우, 사용자가 입력한 검색 키워드에 기초하여 매칭되는 검색결과 결정되므로, 사용자가 입력한 검색 키워드에 일치되는 검색결과만이 사용자에게 제공된다는 문제점이 있다. 이러한 문제점을 해결하기 위하여, 사용자가 입력한 검색 키워드를 확장하여 동일 또는 유사한 검색 키워드에 매칭되는 검색결과를 검색/제공하는 기술이 개발되었으나, 검색 키워드에 대한 확장이 검색 키워드를 구성하는 형태소 전체에 대해 수행되어 검색 키워드가 수식어와 컨셉 키워드로 구성되어 있는 경우 부적절한 검색 결과를 제공하게 된다는 문제점이 있었다.

한편, 인터넷의 보급에 따라 인터넷을 이용한 광고의 중요성은 점점 늘어나고 있으며, 인터넷을 이용한 광고의 종류 역시 계속하여 발달하고 있다.

이러한 인터넷을 이용한 광고 중 가장 고전적인 형태로서 배너 광고를 들 수 있는데, 이는 포털 사이트나 뉴스 사이트 등 사용자들이 많이 방문하는 사이트의 특정 영역인 소위 광고 영역에 배너 형태의 텍스트, 그림 또는 동영상 형식의 광고를 삽입하는 방식이다. 배너 광고의 경우, 사용자가 해당하는 배너 광고에 클릭 또는 마우스 오버 등의 액션을 취하면 해당 배너 광고가 활성화되면서 자세한 광고 내용을 제공하거나 또는 광고에 해당하는 웹사이트로 연결하는 방식을 통해서 광고 효과를 얻을 수 있다.

하지만, 배너 광고의 형태는 사용자의 취미나 취향, 또는 관심사 등과 전혀 관계없이 일방적으로 광고를 제공함으로써 그 광고 효과가 떨어지는 한편, 배너 광고에 사용되는 색상이 다양하고 특히 사이트의 한정된 공간에 다수의 배너 광고를 삽입하는 경우 일관성이 유지되지 않고 복잡하게 보이므로 해당 사이트의 미관을 해친다는 단점 역시 존재하고 있다.

한편, 인터넷을 이용한 광고 모델 중 새로운 형태로서 키워드 광고가 각광을 받고 있다. 키워드 광고는 검색 결과 등을 제공하는 포털 사이트 등에서 사용자가 입력한 검색 키워드에 매칭되는 제품 또는 서비스에 관심도가 더 높을 것이라는 예상에 기초하여, 입력한 검색 키워드와 매칭되는 광고를 검색 결과를 제공하는 영역 중 특정 영역에 또는 배너 형태로 제공하는 방식이다. 키워드 광고의 경우, 광고의 상세한 내용을 함께 제공하여 사용자에게 노출되는 자체만으로, 그리고 사용자의 클릭이나 마우스 오버 등의 액션에 의해 자세한 광고 내용을 제공하거나 또는 광고에 해당하는 웹사이트로 연결하는 방식을 통해서 광고 효과를 얻을 수 있다.

이러한 키워드 광고에 있어, 사용자가 입력한 검색 키워드에 기초하여 매칭되는 광고가 결정되므로, 사용자가 입력한 키워드에 일치되는 광고만이 노출된다는 문제점이 있다. 이러한 문제점을 해결하기 위하여, 사용자가 입력한 검색 키워드를 확장하여 동일 또는 유사한 검색 키워드에 매칭되는 광고를 검색/노출하는 기술이 개발되었다. 한국공개특허 제10-2010-0025731호(확장 키워드 풀을 사용한 검색 방법 및 시스템, 2010.03.10 공개)는 검색 광고 구매 이력이 있는 키워드 집합 이외에 기타 키워드와 키워드별 조회수가 일정 이상 발생하는 키워드의 집합을 더 포함하여 키워드 풀을 생성함으로써 보다 넓은 범위에서 키워드를 제공할 수 있는 확장 키워드 풀을 사용한 검색 시스템과 방법을 제안하고 있다.

즉, 일반적으로 검색 광고를 요청하는 광고주 구매 광고 키워드의 특성을 살펴보면, 광고 키워드는 광고하고자 하는 상품 또는 서비스 자체를 나타내는 컨셉 키워드(Concept Keyword 또는 Concept)와 컨셉 키워드를 수식하기 위한 수식어(지역명, 나라명, 도로명, 역명, 형용상(싼, 저렴한, 이쁜, 빠른,...), 기타 수식어(연령대, 학년,...))로 구성된다. 이러한 컨셉 키워드와 수식어로 구성된 광고 키워드의 경우 수식어를 포함한 전체 키워드에 대하여 확장을 하는 경우, 수식어 부분에서 품질의 문제가 발생하게 된다. 즉, 수식어까지 확장되는 경우, 광고주와 사용자가 원하는 정보가 정확히 제공될 수 없다는 문제점이 존재한다. 예를 들어, 서울 지역에서 꽃배달 서비스를 제공하는 광고주가 '서울 꽃배달'이라는 광고 키워드를 구매한 경우, 수식어까지 확장되면 '서울 꽃배달'은 '부산 꽃배달', '제주 꽃배달',.... 등으로 확장될 수 있으며, 이러한 경우 부정확한 검색 광고가 사용자에게 제공되며, 광고주도 자신이 목표로 하지 않는 사용자에게 자신의 광고가 노출되어 광고효과를 기대할 수 없을 뿐만 아니라 불필요한 광고비가 지출되게 된다는 문제점이 있다.

이러한 문제점을 해결하기 위해서는, 광고 키워드로부터 컨셉 키워드와 수식어를 구분할 수 있는 기술이 필요하지만 종래기술에서는 이러한 기술을 제공하고 있지 못하다는 문제점이 있다. 또한, 종래기술에 따르면, 복수의 광고 키워드에 대하여 유의미한 컨셉 키워드를 선정하고, 서로 연관성이 있는 컨셉 키워드 간의 확장 데이터 셋을 제공할 수 없다는 문제점이 있다.

본 발명의 목적은 위에서 언급한 종래기술의 문제점을 해결하는 것이다.

본 발명의 일 목적은 키워드로부터 수식어와 컨셉 키워드를 구분하여, 수식어와 컨셉 키워드 각각을 추출할 수 있는 컨셉 키워드 확장 데이터 셋 생성방법 및 장치를 제공하는 것이다.

본 발명의 다른 목적으로, 추출된 컨셉 키워드 후보들 중 키워드와 가장 밀접한 관련성을 가지는 컨셉 키워드 후보를 컨셉 키워드로 결정하고, 결정된 컨셉 키워드들 간의 연관관계에 따라 컨셉 키워드 간의 확장 데이터 셋을 생성할 수 있는 컨셉 키워드 확장 데이터 셋 생성방법 및 장치를 제공하는 것이다.

본 발명의 또 다른 목적은, 사용자가 입력한 검색 키워드를 컨셉 키워드에 매칭함으로써 수식어를 제외하고, 검색 키워드에 매핑된 컨셉 키워드의 확장 데이터 셋을 이용하여 컨셉 키워드를 확장하며, 확장된 복수의 컨셉 키워드에 수식어를 부가하여 최종 확장 키워드를 생성한 후, 최종 확장 키워드들에 매칭되는 검색결과 및/또는 검색어 광고를 검색/노출할 수 있는 컨셉 키워드 확장 데이터셋 생성방법 및 장치를 제공하는 것이다.

상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특유의 효과를 달성하기 위한, 본 발명의 특징적인 구성은 하기와 같다.

본 발명의 일 태양에 따르면, 컨셉 키워드 확장 데이터 셋 생성장치에 의해 수행되는 컨셉 키워드 확장 데이터 셋 생성방법에 있어서, (a) 키워드 그룹으로부터 컨셉 키워드를 추출하는 단계; (b) 상기 키워드 그룹과 상기 컨셉 키워드 간의 컨셉 키워드별 그룹 연관도 점수를 산출하는 단계; 및 (c) 상기 컨셉 키워드별 그룹 연관도 점수에 기초하여 서로 연관 관계를 가지는 복수의 컨셉 키워드를 결정하고, 상기 결정된 복수의 컨셉 키워드를 키워드 확장 데이터 셋으로 설정하는 단계를 포함하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법이 제공된다.

본 발명의 다른 일 태양에 따르면, 적어도 하나 이상의 키워드를 포함하는 복수의 키워드 그룹을 저장하고 있는 컨셉 키워드 확장 데이터 셋 생성장치에 있어서, 키워드 그룹으로부터 컨셉 키워드를 생성하고, 생성된 상기 컨셉 키워드에 대하여 컨셉 키워드별 그룹 연관도 점수를 산출하는 컨셉 키워드 생성부; 및 상기 컨셉 키워드별 그룹 연관도 점수에 기초하여 서로 연관 관계를 가지는 복수의 컨셉 키워드를 결정하고, 상기 결정된 복수의 컨셉 키워드를 컨셉 키워드 확장 데이터 셋으로 설정하는 확장 데이터 셋 생성부를 포함하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치가 제공된다.

상술한 바와 같이 본 발명에 따르면, 키워드로부터 수식어와 컨셉 키워드를 구분하여, 수식어와 컨셉 키워드 각각을 추출할 수 있다는 효과가 있다.

또한, 본 발명에 따르면, 추출된 컨셉 키워드 후보들 중 키워드와 가장 밀접한 관련성을 가지는 컨셉 키워드 후보를 컨셉 키워드로 결정하고, 결정된 컨셉 키워드들 간의 연관관계에 따라 컨셉 키워드 간의 확장 데이터 셋을 생성할 수 있다는 효과가 있다.

또한, 본 발명에 따르면, 사용자가 입력한 검색 키워드를 컨셉 키워드에 매핑함으로써 수식어와 구분하고, 검색 키워드에 매핑된 컨셉 키워드의 확장 데이터 셋을 이용하여 컨셉 키워드를 확장하며, 확장된 복수의 컨셉 키워드에 수식어를 부가하여 최종 확장 키워드를 생성한 후, 최종 확장 키워드들에 매칭되는 검색결과 및/또는 검색어 광고를 검색/노출할 수 있다는 효과가 있다.

도 1a는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋 생성장치 및 컨셉 키워드 확장 데이터 셋을 이용한 광고장치를 포함하는 전체 시스템의 구성 블록도이다.
도 1b는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋의 생성과 이를 이용한 광고 방법을 설명하기 위한 개념도이다.
도 2a는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋 생성장치의 구성 블록도이다.
도 2b는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 광고장치의 구성 블록도이다.
도 3은 본 발명의 바람직한 일 실시예예 따른 컨셉 키워드 확장 데이터 셋 생성장치에서 수행되는 컨셉 키워드 확장 데이터 셋 생성과정을 도시한 순서도이다.
도 4a는 본 발명의 바람직한 일 실시예예 컨셉 키워드 확장 데이터 셋 생성과정을 설명하기 위한 개념도이다.
도 4b는 본 발명의 바람직한 일 실시예예 컨셉 키워드 후보군의 생성과정을 설명하기 위한 개념도이다.
도 4c는 본 발명의 바람직한 일 실시예에 따른 키워드와 컨셉 키워드간의 매핑과정을 설명하기 위한 개념도이다.
도 5는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 광고장치에서 수행되는 광고노출 과정을 도시한 순서도이다.
도 6은 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 최종 키워드 확장 과정을 설명하기 위한 개념도이다.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는 적절하게 설명된다면 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.

이하, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.

[본 발명의 바람직한 실시예]

본 발명의 실시예에서, 용어 "키워드"란 검색 서비스 또는 검색어 광고 서비스 등 검색어를 이용한 모든 종류 서비스에 이용될 수 있는 키워드를 의미하며, 이하에서는 설명의 편의를 위하여 검색어 광고 서비스에 적용하기 위한 실시예를 중심으로 설명하지만, 이에 한정되는 것은 아니다. 예시적으로, 본 발명의 실시예에서, 용어 "키워드"란 광고주가 검색어 광고를 노출하기 위하여 구매한 광고 키워드를 의미할 수 있다. 이하의 실시예에 있어, 설명의 편의를 위하여 검색어 광고에 적용될 수 있는 광고장치를 기준으로 본 발명의 실시예에 대한 상세한 설명을 개시하지만, 전술한 바와 같이 모든 종류의 검색 서비스에 본 발명이 적용될 수 있으며, 본 발명의 요지를 포함하고 있는 한 본 발명의 권리범위에 속한다는 것에 유의해야 한다.

또한, 용어 "키워드 그룹"이란 미리 설정된 기준에 의하여 분류된 적어도 하나 이상의 키워드의 집합으로서, 예시적으로 광고주의 설정에 따라 하나의 그룹으로 그룹핑되어 관리되는 키워드들의 집합일 수도 있으며, 또는 상품군(서비스군)의 종류에 따라 분류되어 그룹핑된 키워드들의 집합일 수도 있으나, 이에 한정되는 것은 아니다.

또한, 용어 "토큰"이란 키워드를 구성하고 있는 형태소를 의미하며, "주요 토큰"이란 복수의 토큰들 중에서 키워드 그룹 내에서의 중요성에 따라 높은 중요성을 갖는 것으로 판단되어 설정되는 형태소를 의미한다.

또한, 용어 "컨셉 키워드"란 키워드 중 상품 또는 서비스 자체를 나타내는 컨셉을 의미한다.

전체 시스템 구성

도 1a는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋 생성장치 및 컨셉 키워드 확장 데이터 셋을 이용한 광고장치를 포함하는 전체 시스템의 구성 블록도이다. 이하에서 도 1a를 참조하여, 본 발명에 따른 전체 시스템에 대하여 살펴보도록 한다.

도 1a에 도시된 바와 같이, 본 발명에 따른 전체 시스템은 광고주 단말기(100), 네트워크(110), 사용자 단말기(120) 및 광고 서버(130)를 포함할 수 있다.

광고주 단말기(100)는 광고주의 조작에 따라 네트워크(110)를 통해 광고 서버(130)에 접속하여 특정 광고 키워드를 구매하여 검색어 광고를 신청하고, 구매된 광고 키워드를 관리하는 기능을 수행하게 된다.

한편, 사용자 단말기(120)는 네트워크(110)를 통해 검색 서버(미도시)에 접속하여 사용자의 조작에 따라 입력되는 검색 키워드를 검색 서버로 전송하고, 검색 서버로부터 전송되는 검색 결과(검색 키워드 매칭에 따른 광고정보 포함)를 수신 받아 출력하는 기능을 수행하게 된다.

전술한 바와 같은 광고주 단말기(100) 및 사용자 단말기(120)는 데스크톱 컴퓨터뿐만 아니라 노트북 컴퓨터, 워크스테이션, 팜톱(palmtop) 컴퓨터, 개인 휴대 정보 단말기(personal digital assistant: PDA), 웹 패드, 스마트 폰을 포함하는 이동 통신 단말기 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖춘 디지털 기기라면 얼마든지 본 발명에 따른 광고주 단말기(100) 또는 사용자 단말기(120)로서 채택될 수 있다.

또한, 전술한 바와 같은 광고주 단말기(100) 및 사용자 단말기(120)는 일반적인 검색어 광고 시스템을 구성하는 광고주 단말기(100) 및 사용자 단말기(120)와 동일한 기능을 수행하도록 구성되는 바, 더 이상의 상세한 설명은 생략하기로 한다.

본 발명의 일 실시예에 따르면, 네트워크(110)는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN; Personal Area Network), 근거리 통신망(LAN; Local Area Network), 도시권 통신망(MAN; Metropolitan Area Network), 광역 통신망(WAN; Wide Area Network) 등 다양한 통신망으로 구성될 수 있다.

마지막으로 본 발명에 따른 광고 서버(130)는 광고주 페이지를 광고주 단말기(100)로 제공하여 검색어 광고를 위한 광고 키워드를 판매하고, 광고주 단말기(100)로부터 전송되는 설정정보에 따라 특정 광고주가 구매한 광고 키워드를 설정/관리하는 기능을 수행하게 된다. 이러한 광고 서버(130)에는 광고 정보가 저장된 데이터베이스(132)가 연결되어 있으며, 광고 서버(130)는 검색 서버와 연동하여, 사용자 단말기(120)로부터 전송되는 검색 키워드에 매칭되는 광고 정보를 데이터베이스(132)로부터 추출하여 사용자 단말기(120)로 제공하는 기능을 수행하게 된다. 이하에서는 검색 서버와 광고 서버가 하나의 서버에 구현된 실시예를 기준으로 설명하도록 하며, 이러한 검색어 광고 기능 자체는 이미 공지된 검색어 광고 서버의 기능과 유사하므로, 더 이상의 상세한 설명은 생략하기로 하며, 이하에서는 본 발명에 따른 광고 서버(130)의 독창적인 구성을 위주로 설명하도록 한다.

본 발명에 따른 광고 서버(130)는 컨셉 키워드 확장 데이터 셋 생성장치(200)와 확장 데이터 셋을 이용한 광고장치(300)를 구비하여 크게 두 가지의 독창적인 기능을 수행하도록 구성될 수 있다. 본 발명에 따른 광고 서버(130)는 컨셉 키워드 확장 데이터 셋 생성장치(200)를 이용하여 소정의 기준에 따라 그룹핑된 동일한 키워드 그룹으로부터 컨셉 키워드를 생성하고, 생성된 컨셉 키워드들을 컨셉 키워드 확장 데이터 셋으로 설정하는 기능을 수행하게 된다. 이러한 컨셉 키워드 확장 데이터 셋 생성장치(200)의 상세 구성과 기능에 대해서는 도 2a를 참조하여 후술하도록 한다.

또한, 본 발명에 따른 광고 서버(130)는 컨셉 키워드 확장 데이터 셋을 이용한 광고장치(300)를 이용하여, 사용자 단말기(120)로부터 전송되는 검색 키워드 중 컨셉 키워드를 판단하고, 판단된 컨셉 키워드의 확장 데이터 셋을 이용하여 검색 키워드를 최종 확장함으로써 광고주와 사용자의 의도에 보다 적합한 광고를 추출하여 사용자 단말기(120)로 제공하는 기능을 수행하게 된다. 이러한 컨셉 키워드 확장 데이터 셋을 이용한 광고장치(300)의 상세 구성과 기능에 대해서는 도 2b를 참조하여 후술하도록 한다.

한편, 도 1a에 도시된 실시예에 있어, 컨셉 키워드 확장 데이터 셋 생성장치(200)와 확장 데이터 셋을 이용한 광고장치(300)가 모두 광고 서버(130)에 구비된 것으로 도시되어 있으나, 이는 예시적인 실시예일 뿐이고 실시예를 구성하기에 따라 광고 서버(130)는 생성된 컨셉 키워드 확장 데이터 셋 정보와 확장 데이터 셋을 이용한 광고장치(300)를 구비하도록 구성될 수도 있으며, 또는 컨셉 키워드 확장 데이터 셋 생성장치(200)와 확장 데이터 셋을 이용한 광고장치(300)가 광고 서버(130)와 별도로 구성될 수 있음은 당업자에게 자명할 것이다. 이하에서는, 설명의 편의를 위하여 광고 서버(130)는 컨셉 키워드 확장 데이터 셋 생성장치(200)와 확장 데이터 셋을 이용한 광고장치(300)를 구비하고 있는 실시예를 중심으로 설명하나, 이에 한정되지 않음에 유의하여야 한다.

다른 한편으로, 전술한 바와 같이 본 발명이 검색 서비스에 적용되는 경우, 전술한 광고 서버(130)와 유사하게 구성된 검색 서버가 검색 서비스 기능을 수행하는 동시에, 컨셉 키워드 확장 데이터 셋 생성 기능 및 검색 키워드의 확장과 이를 이용한 검색결과를 검색하고, 검색된 검색결과를 제공하는 기능을 수행하게 된다.

전체 시스템의 동작 방법의 개괄

도 1b는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋의 생성과 이를 이용한 광고 방법을 설명하기 위한 개념도이다. 도 1b를 참조하여 본 발명에 따른 컨셉 키워드 확장 데이터 셋의 생성과 이를 이용한 광고 방법을 개괄적으로 살펴보도록 한다.

먼저 전술한 바와 같이, 본 발명에 따른 광고 서버(130)는 컨셉 키워드 확장 데이터 셋을 생성/저장하는 기능을 수행한다. 도 1b에 도시된 바와 같이, 광고 서버(130)는 특정 키워드 그룹에 대한 확장 데이터 셋(152)을 '화환, 꽃바구니, 꽃배달서비스'로 설정하여 저장하게 된다. 이러한 확장 데이터 셋(152)이 광고 서버(130)에 저장되어 있는 상태에서, 사용자가 사용자 단말기(120)를 조작하여 검색 키워드(서울꽃배달, 부산꽃배달, 여자친구꽃배달, 100일기념꽃배달 중 어느 하나)(140)를 광고 서버(130)로 전송하면, 광고 서버(130)는 수신된 검색 키워드를 확장 데이터 셋에 포함된 컨셉 키워드들 중 하나로 매핑하고(도시된 실시예에서는 꽃배달(150)으로 매핑됨), 매핑된 컨셉 키워드의 확장 데이터 셋(152)을 이용해 컨셉 키워드를 확장하게 된다. 도시된 실시예에서 '꽃배달'이 '화환, 꽃바구니, 꽃배달서비스'로 확장됨을 확인할 수 있다. 확장 데이터 셋(152)를 이용하여 컨셉 키워드의 확장이 종료되면, 광고 서버(130)는 검색 키워드와 컨셉 키워드의 매핑에 따라 '수식어'로 판단된 부분(도시된 실시예의 경우 '서울, '부산', '여자친구', '100일기념' 등)을 확장된 컨셉 키워드와 조합하여 최종 확장 키워드를 생성하게 된다. 도 1b에 도시된 실시예에서, 최종 확장 키워드는 사용자가 검색 키워드로 '서울꽃배달'을 입력한 경우, '서울화환, 서울꽃바구니, 서울꽃배달서비스'로 확장되어 최종 확장 키워드가 생성되는 것을 확인할 수 있다.

본 발명에 따른 광고 서버(130)는 전술한 바와 같은 과정을 수행함으로써, 광고 키워드 중 수식어와 컨셉 키워드를 구분하고, 컨셉 키워드의 연관관계에 따라 컨셉 키워드를 확장하며, 확장된 컨셉 키워드에 다시 수식어를 조합하여 최종 확장 키워드를 생성함으로써, 광고주와 사용자 모두의 의도에 부합되는 광고를 검색하여 사용자에게 제공할 수 있는 효과를 기대할 수 있다.

컨셉 키워드 확장 데이터 셋 생성장치

도 2a는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋 생성장치의 구성 블록도이다. 이하에서, 도 2a를 참조하여 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋 생성장치의 상세 구성과 기능에 대하여 설명하도록 한다.

도 2a에 도시된 바와 같이, 본 발명에 따른 컨셉 키워드 확장 데이터 셋 생성장치(200)는 주요 토큰 추출부(210), 컨셉 키워드 생성부(212), 확장 데이터 셋 생성부(214) 및 데이터베이스(220)을 포함할 수 있다.

확장 데이터 셋 생성장치(200)에 연결된 데이터베이스(220)에는 적어도 하나 이상의 키워드를 포함하고 있는 다수의 키워드 그룹(222a~222n) 정보가 저장되어 있다. 전술한 바와 같이, 이러한 키워드 그룹은 실시예를 구성하기에 따라 광고주의 설정에 따라 그룹핑된 키워드 집합일 수도 있으며, 또는 일정한 기준(상품 또는 상품군 등)에 따라 분류/그룹핑된 키워드 집합일 수도 있다.

주요 토큰 추출부(210)는 키워드 그룹에 포함된 (광고) 키워드 각각에 대하여 형태소 분석을 수행하여 복수의 토큰(형태소)를 추출한 후, 토큰별 중요도 점수(해당 토큰이 해당 그룹 내에서 갖는 중요도)에 따라 주요 토큰을 결정하는 기능을 수행하게 된다. 이를 보다 상세하게 살펴보면, 주요 토큰 추출부(210)는 그룹 내 키워드들로부터 추출된 각각의 토큰에 대하여 TF-IDF(Term Frequency - Inverse Document Frequency)에 기초하여 토큰별 중요도 점수를 산출하도록 구성된다. TF-IDF는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다. TF(단어 빈도수, term frequency)는 특정한 단어가 문서 내에 얼마나 자주 등장하는지를 나타내는 값으로, 이 값이 높을수록 문서에서 중요하다고 생각할 수 있다. 하지만 단어 자체가 문서군 내에서 자주 사용되는 경우, 이것은 그 단어가 흔하게 등장한다는 것을 의미한다. 이것을 DF(문서 빈도수, document frequency)라고 하며, 이 값의 역수를 IDF(inverse document frequence)라고 한다. TF-IDF는 TF와 IDF를 곱한 값이다. 즉, 본 발명에 따른 주요 토큰 추출부(210)는 특정 토큰이 해당 그룹에서 얼마나 자주 나타나는지를 나타내는 TF(그룹 내 단어 빈도수) 값과 해당 토큰이 다른 그룹에서 얼마나 자주 나타나는지를 나타내는 DF의 역수인 IDF 값을 이용하여 특정 토큰이 키워드 그룹 내에서 갖는 중요도를 산출하도록 구성된다. 물론, TF-IDF는 예시적인 실시예일 뿐이므로, 필요에 따라 정보 검색과 텍스트 마이닝에서 이용하는 가중치를 산출할 수 있는 다양한 공지된 알고리즘 중 하나가 채택되어 이용될 수 있으며, 이러한 변형에도 불구하고 본 발명의 요지를 그대로 포함하고 있는 한 본 발명의 권리범위에 속함은 당업자에게 자명할 것이다.

토큰별 중요도 점수가 산출되면, 주요 토큰 추출부(210)는 설정에 따라 토큰별 중요도 점수에 기초하여 토큰들 중에서 주요 토큰을 결정하도록 구성된다. 즉, 설정에 따라 주요 토큰 추출부(210)는 토큰들 중에서 높은 중요도 점수를 가지는 상위 3개의 토큰을 주요 토큰으로 결정하도록 구성될 수도 있으며, 또는 미리 설정된 점수 이상의 중요도 점수를 가지는 토큰들 전부를 주요 토큰으로 결정하도록 구성될 수도 있다. 이러한 방식으로 토큰들(형태소) 중에서 그룹 내에서의 중요성이 높은 주요 토큰을 결정하는 것은, 이러한 주요 토큰들의 조합이 컨셉 키워드를 구성하게될 확률이 높다는 통계적 결과에 기초한 것이며, 따라서 주요 토큰 추출부(210)에서 주요 토큰을 결정함으로써 키워드 중에서 수식어와 컨셉 키워드를 구분할 수 있게 된다는 효과를 기대할 수 있다.

컨셉 키워드 생성부(212)는 주요 토큰 추출부(210)에 의해 추출/결정된 주요 토큰을 조합하여 컨셉 키워드를 생성하도록 구성된다. 이를 보다 상세하게 살펴보면, 컨셉 키워드 생성부(212)는 주요 토큰을 1 ~ n개(n : 주요 토큰의 수)까지 순차적으로 선택하여, 선택된 주요 토큰(들)을 이용하여 컨셉 키워드 후보를 생성하게 된다. 즉, 컨셉 키워드 생성부(212)는 n개의 주요 토큰들의 가능한 모든 조합을 이용하여 컨셉 키워드 후보를 생성하고, 생성된 컨셉 키워드 후보들 중에서 컨셉 키워드를 결정하도록 구성된다. 본 발명에 따른 컨셉 키워드 생성부(212)는 생성된 컨셉 키워드 후보들 중에서 컨셉 키워드를 결정함에 있어 다양한 방식을 이용하도록 구성될 수 있다. 예를 들어, 컨셉 키워드 생성부(212)는 컨셉 키워드 후보들 각각의 조회수를 비교하여, 조회수가 높은 상위 몇몇의 컨셉 키워드 후보들을 컨셉 키워드로 결정할 수도 있다. 다른 실시예에 있어, 컨셉 키워드 생성부(212)는 컨셉 키워드 후보들 중 매칭되는 광고 키워드가 존재하는 후보들을 컨셉 키워드로 결정하도록 구성될 수도 있다. 또 다른 실시예에 있어, 컨셉 키워드 생성부(212)는 컨셉 키워드 후보들 중 키워드 그룹에 속한 적어도 하나 이상의 키워드에 매핑되는 컨셉 키워드 후보를 컨셉 키워드로 결정하도록 구성될 수 있다. 이러한 컨셉 키워드 결정 기준은 각기 개별적으로 이용될 수도 있으며, 또는 실시예를 구성하기에 따라 복수의 결정 기준이 조합되어 이용되도록 구성될 수도 있다.

전술한 컨셉 키워드 결정 기능을 수행하기 위하여, 컨셉 키워드 생성부(212)는 컨셉 키워드 후보들 각각에 대하여 대응되는 광고 키워드가 존재하는지 여부를 판단하고, 대응되는 광고 키워드가 존재하는 컨셉 키워드 후보를 컨셉 키워드로 결정하도록 구성될 수 있다. 또한, 보다 바람직하게, 컨셉 키워드 생성부(212)는 동일한 주요 토큰으로 구성된 컨셉 키워드 후보가 복수로 전재하는 경우, 경합하는 복수의 컨셉 키워드 후보 중 조회수가 가장 많은 컨셉 키워드 후보를 컨셉 키워드로 결정하도록 구성될 수 있다.

한편, 이러한 경우 컨셉 키워드가 지나치게 확장될 수 있다는 문제점이 있으므로, 컨셉 키워드 생성부(212)는 유의미한 컨셉 키워드의 확장을 위하여 대응되는 광고 키워드가 존재하는 컨셉 키워드 후보들 중에서 다시 컨셉 키워드를 선별하는 과정을 더 수행하도록 구성될 수 있다. 즉, 본 발명에 따른 컨셉 키워드 생성부(212)는 대응되는 광고 키워드가 존재하는 컨셉 키워드 후보들 중 키워드 그룹 내의 각 키워드에 매핑되는 컨셉 키워드 후보를 컨셉 키워드로 결정하도록 구성될 수 있다. 이러한 키워드 그룹 내의 키워드와 컨셉 키워드 후보 간의 매핑은 유사 계수(jaccard cefficient)를 기초로 수행될 수 있다. 유사 계수란 분류학에서 사용되는 연관 계수로서, 두 종류의 개체가 가지고 있지 않은 것을 제외하고, 동일한 특성이 많을수록 증가하는 특성을 가지고 있다. 따라서, 컨셉 키워드 생성부(212)는 그룹 내 키워드 각각과 전체 컨셉 키워드 후보들 간의 유사 계수를 산출하고, 키워드와 가장 높은 유사 계수를 갖는 컨셉 키워드 후보에 해당 키워드를 매핑하며, 매핑된 컨셉 키워드 후보를 컨셉 키워드로 결정하도록 구성된다.

한편, 특정 키워드와 동일한 유사 계수를 가지는 컨셉 키워드 후보가 복수로 존재하는 경우, 컨셉 키워드 생성부(212)는 각각의 컨셉 키워드 후보에 대하여 컨셉 키워드 후보를 구성하는 주요 토큰의 토큰별 중요도 점수를 합산한 값의 평균값을 산출하고, 가장 높은 중요도 점수 평균값을 가지는 컨셉 키워드 후보에 해당 키워드를 매핑하고, 그 컨셉 키워드 후보를 컨셉 키워드로 결정하도록 구성될 수 있다. 이러한 중요도 점수의 평균값을 이용하여 매핑되는 컨셉 키워드를 결정하는 경우, 그룹 내에서의 중요도가 반영되어 경합하는 복수의 컨셉 키워드 후보 중 가장 그룹에 대하여 높은 중요도를 갖는 컨셉 키워드 후보가 컨셉 키워드로 결정될 수 있다는 효과를 기대할 수 있다.

전술한 바와 같은 매핑 과정을 수행하여 컨셉 키워드들이 결정되면, 컨셉 키워드 생성부(212)는 결정된 컨셉 키워드와 키워드 그룹 간의 그룹 연관도 점수를 더 산출하도록 구성될 수 있다. 그룹 연관도 점수란 결정된 특정 컨셉 키워드가 해당 그룹과 관련하여 얼마만큼의 대표성(연관성)을 가지는지를 나타내는 척도로서, 해당 컨셉 키워드에 매핑된 그룹 내 키워드 수로 정의하도록 한다. 예를 들어 10개의 키워드를 포함하고 있는 키워드 그룹 1로부터 생성/결정된 컨셉 키워드 1이 키워드 그룹 1 내의 5개의 키워드와 매핑되고, 컨셉 키워드 2가 키워드 그룹 1 내의 1개의 키워드와 매핑되며, 컨셉 키워드 3이 키워드 그룹 1 내의 4개의 키워드와 매핑되는 경우, 컨셉 키워드 1은 5라는 그룹 연관도 점수를 가지며 컨셉 키워드 2는 1이라는 그룹 연관도 점수를 가지고, 컨셉 키워드 3은 4라는 그룹 연관도 점수를 가지게 된다. 이러한 키워드별 그룹 연관도 점수를 이용하면, 설사 적절하지 못한 컨셉 키워드가 결정되더라도 낮은 그룹 연관도 점수를 가지게 되므로 식별 및 관리가 가능하다. 즉, 전술한 예에서 컨셉 키워드 2의 경우 1이라는 낮은 그룹 연관도 점수를 가지므로 우연히 뽑힌 컨셉 키워드임을 인지할 수 있으며, 발명을 구성하기에 따라 컨셉 키워드 2를 컨셉 키워드 확장 데이터 셋에서 제외할 수도 있다.

한편, 이러한 그룹 연관도 점수를 이용하는 경우, 특정 키워드 그룹에서 결정된 컨셉 키워드들의 연관도 점수의 합은 원칙적으로 특정 키워드 그룹의 크기(키워드 그룹에 포함된 키워드의 수)와 동일하므로, 큰 그룹에서 뽑힌 컨셉 키워드는 작은 그룹에서 뽑힌 컨셉 키워드 보다 상대적으로 큰 가중치(연관도 점수)를 가지게 된다. 따라서, 이러한 그룹 연관도 점수를 이용하는 경우, 상대적으로 높은 연관도 점수를 가지는 컨셉 키워드들을 선택하여 중심 키워들 확장 데이터 셋을 생성할 수도 있다.

확장 데이터 셋 생성부(214)는 컨셉 키워드 생성부(212)에 의해 동일한 키워드 그룹으로부터 생성된 복수의 컨셉 키워드를 컨셉 키워드 확장 데이터 셋으로 설정하는 기능을 수행하도록 구성된다. 이때, 확장 데이터 셋 생성부(214)는 전술한 바와 같은 컨셉 키워드의 그룹 연관도 점수를 이용하여 특정 컨셉 키워드를 확장 데이터 셋에 포함시키거나 또는 제외할 수도 있다.

또한, 본 발명에 따른 확장 데이터 셋 생성부(214)는 컨셉 키워드들에 대한 사용자들의 클릭정보를 이용하여 컨셉 키워드 확장 데이터 셋으로부터 특정 컨셉 키워드를 제외하거나, 또는 특정 컨셉 키워드를 확장 데이터 셋에 추가할 수 있도록 구성될 수 있다. 즉, 확장 데이터 셋 생성부(214)는 소정의 기간 동안 특정 컨셉 키워드를 포함하고 있는 최종 확장 키워드에 매칭되어 노출된 광고의 클릭 횟수가 미리 설정된 횟수 이하인 경우, 해당 컨셉 키워드를 확장 데이터 셋에서 제외할 수도 있으며, 또는 소정의 기간 동안 확장 데이터 셋에 포함되어 있지 않은 컨셉 키워드를 포함하고 있는 키워드에 매칭되어 노출된 광고의 클릭 횟수가 미리 설정된 횟수 이상인 경우 해당 컨셉 키워드를 확장 데이터 셋에 추가하도록 구성될 수도 있다.

한편, 본 발명에 따른 확장 데이터 셋 생성부(214)는 클릭 그래프(Click Graph) 알고리즘을 이용하여, 복수의 컨셉 키워드 간의 연관 관계를 판단하고, 서로 연관 관계를 갖는 모든 컨셉 키워드를 확장 데이터 셋으로 설정하도록 구성될 수도 있다. 클릭 그래프란 검색 사용자들의 클릭 정보를 이용해 검색 품질을 향상시키기 위해 개발된 알고리즘으로서, 사용자들의 클릭 패턴을 이용해 좋은 문서(사용자가 원하는 문서)를 찾아내기 위한 알고리즘이다. 클릭 그래프에서 사용자가 입력한 쿼리와 문서는 그래프의 점으로, 클릭 수는 에지(edge)로 나타나며, 쿼리-문서 쌍이 많이 클릭 될수록 에지는 강하게 나타난다. 클릭 그래프 알고리즘에는 포워드 워크(forward walk)와 백워드 워크(backward walk) 방식이 있다. 포워드 워크 방식은 쿼리 노드에서 시작해서 많이 클릭된 문서 노드로 이동하고, 그 문서를 많이 클릭한 다른 쿼리를 찾아서 또 이동하고, 이러한 과정을 반복하여 좋은 품질의 문서를 찾아내는 방식이다. 백워드 워크 방식은 문서 노드에서 시작해서 쿼리 노드로, 다시 문서 노드를 거쳐 쿼리 노드로 도착하는 것을 반복하여 좋은 쿼리를 찾아내는 방식이다. 본 발명에 따른 확장 데이터 셋 생성부(214)는 컨셉 키워드와 키워드 그룹을 각각 노드로 설정하고, 그룹 연관도 점수를 에지로 설정하여 클릭 그래프 알고리즘을 적용할 수도 있다. 즉, 복수의 키워드 그룹으로부터 추출된 모든 컨셉 키워드들이 하나의 컨셉 키워드 확장 데이터 셋을 구성하고, 특정 컨셉 키워드의 연결관계(즉 그룹->키워드->그룹->키워드 등의 관계)를 가지는 다른 컨셉 키워드들을 해당 컨셉 키워드의 확장 데이터로 설정하도록 구성될 수 있다.

도 2b는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 광고장치의 구성 블록도이다. 이하에서는 도 2b를 참조하여, 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 광고장치의 상세 구성과 기능에 대하여 설명하도록 한다.

도 2b에 도시된 바와 같이, 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 광고장치(300)는 컨셉 키워드 매핑부(310), 컨셉 키워드 확장부(312), 확장 키워드 생성부(314) 및 데이터베이스(320)를 포함할 수 있다.

광고장치(300)에 연결된 데이터베이스(320)에는 전술한 확장 데이터 셋 생성장치(200)에서 생성된 컨셉 키워드 확장 데이터 셋(322a~322n)이 저장되어 있으며, 광고장치는 저장된 확장 데이터 셋을 이용하여 사용자 단말기(120)로부터 전송된 검색 키워드에 대한 최종 확장 키워드를 생성하고, 생성된 최종 확장 키워드에 매칭되는 광고를 추출하여 사용자 단말기(120)로 노출하는 기능을 수행하게 된다.

이러한 기능을 수행하기 위하여, 컨셉 키워드 매핑부(310)는 사용자 단말기(120)로부터 전송되는 검색 키워드를 확장 데이터 셋에 포함되는 특정 컨셉 키워드에 매핑하도록 구성된다. 검색 키워드와 컨셉 키워드 간의 매핑에 있어, 컨셉 키워드 매핑부(310)는 전술한 바와 같은 유사 계수를 이용하여 매핑을 수행하게 된다. 즉, 검색 키워드와 컨셉 키워드들 각각에 대하여 유사 계수를 산출하고, 가장 높은 유사 계수를 갖는 컨셉 키워드에 검색 키워드를 매핑하도록 구성된다. 이때, 동일한 유사 계수를 갖는 컨셉 키워드가 복수 개 존재하는 경우, 컨셉 키워드 매핑부(310)는 경합하는 복수의 컨셉 키워드들 중 조회수가 가장 높은 컨셉 키워드에 해당 검색 키워드를 매핑하게 된다. 이는, 전술한 확장 데이터 셋 생성과정에서의 키워드-컨셉 키워드 매핑 과정에서는 해당 그룹에서의 컨셉 키워드의 중요도가 중요하지만, 검색 키워드-컨셉 키워드 매핑 과정에서는 컨셉 키워드의 광고로서의 인기도가 중요하기 때문이다.

또한, 본 발명에 따른 컨셉 키워드 매핑부(310)는 검색 키워드 중 매핑된 컨셉 키워드에 포함되지 않은 부분을 선택 토큰으로 간주하고, 이를 최종 확장시 활용하기 위하여 임시로 저장하는 기능을 수행하게 된다. 예를 들어, '100일기념꽃배달'이라는 검색 키워드가 '꽃배달'이라는 컨셉 키워드로 매핑되는 경우, 컨셉 키워드 매핑부(310)는 컨셉 키워드의 확장 후 최종 확장 키워드 생성과정에서 활용하기 위하여 '100일', '기념'이라는 형태소를 선택 토큰으로 저장하여 확장 키워드 생성부로 출력하게 된다. 이러한 방식은 검색 키워드의 수식어 문제를 해결하기 위한 것으로서, 검색 키워드를 구성하는 토큰(형태소) 중 매핑된 컨셉 키워드에 포함되지 않는 토큰을 수식어로 판단하여, 수식어에 대해서는 확장을 수행하지 않고 컨셉 키워드에 대한 확장 후 수식어를 다시 조합하여 최종 확장 키워드를 생성하고자 하는 것이다.

한편, 사용자 단말기(120)로부터 전송된 검색 키워드에 매핑될 수 있는 컨셉 키워드가 존재하지 않는 경우, 본 발명에 따른 광고장치는 일반적인 검색어 광고방법에 따라 검색 키워드에 대한 광고를 처리하게 된다.

컨셉 키워드 확장부(312)는 검색 키워드에 매핑된 컨셉 키워드가 속하는 확장 데이터 셋을 이용하여 컨셉 키워드를 확장하는 기능을 수행하게 된다. 즉, 매핑된 컨셉 키워드와 해당 컨셉 키워드가 속하는 확장 데이터 셋에 포함된 컨셉 키워드들 각각이 최종 확장 키워드 생성시 필수 토큰이 된다. 여기서, 필수 토큰이란 최종 확장 키워드 생성시 필수 토큰들 중 하나가 필수적으로 포함되어야 하는 토큰을 의미하며, 전술한 선택 토큰이란 최종 확장 키워드 생성시 선택적으로 포함될 수 있는 토큰을 의미한다.

확장 키워드 생성부(314)는 컨셉 키워드 확장부(312)로부터 출력되는 필수 토큰들(매핑된 컨셉 키워드와 해당 컨셉 키워드가 속하는 확장 데이터 셋에 포함된 컨셉 키워드들)과 컨셉 키워드 매핑부(310)로부터 출력되는 선택 토큰들을 조합하여 최종 확장 키워드를 생성하는 기능을 수행하게 된다.

보다 바람직하게 본 발명에 따른 확장 키워드 생성부(314)는 사용가능한 광고 키워드들에 대한 인덱스 정보를 저장하고 있으며, 인덱스 정보를 참조하여 필수 토큰 또는 필수 토큰 및 선택 토큰의 조합으로 생성된 확장 키워드가 사용가능한 광고 키워드인지 여부를 판단하고, 사용가능한 광고 키워드인 경우에 한하여 최종 확장 키워드로 결정하도록 구성될 수 있다.

또한, 본 발명에 따른 확장 키워드 생성부(314)는 전술한 과정을 통해 생성된 복수의 최종 확장 키워드들 각각에 대하여 미리 설정된 기준에 따라 순위(점수)를 산출하도록 구성될 수도 있으며, 이러한 최종 확장 키워드별 순위는 다양한 방식으로 이용될 수 있다. 점수를 산출하기 위한 이러한 기준은 필요에 따라 다양하게 설정될 수 있다. 예를 들어, 검색 순위가 일 기준이 될 수 있다. 검색 순위를 기준으로 하여 생성된 최종 확장 키워드들의 순위를 산출하도록 구성되는 경우, 확장 키워드 생성부(314)는 각 최종 확장 키워드의 검색 순위에 기초하여 최종 확장 키워드들 간의 순위를 산출할 수 있으며, 설정에 따라 순위를 기초로 생성된 최종 확장 키워드들 중 상위 순위에 속하는 몇몇의 최종 확장 키워드들만(예를 들어 3위 이내의 키워드만 사용)을 이용하여 매칭되는 광고를 검색하도록 구성될 수 있다. 이러한 방식을 채택하는 경우, 생성된 최종 확장 키워드들 중 광고로서 인기가 있는 키워드들이 사용되므로 검색 광고의 효율성과 정확성이 제고될 수 있다. 한편, 실시예를 구성하기에 따라, 조회(검색) 건수가 순위 산출의 일 기준이 될 수 있으며, 이러한 경우, 미리 설정된 건수 이상의 조회 건수를 가지는 최종 확장 키워드들을 선택하여 매칭되는 광고를 검색하도록 구성될 수도 있다. 또는, 실시예를 구성하기에 따라, 선택 토큰이 얼마나 포함되어 있는지 여부를 기초로 생성된 최종 확장 키워드들의 순위가 결정될 수도 있다. 즉, 선택 토큰이 사용자가 입력한 검색 키워드의 수식어에 해당되므로, 선택 토큰이 많이 포함되어 있을수록 검색 키워드를 입력한 사용자의 검색 의도에 부합될 수 있으므로, 각 최종 확장 키워드에 포함된 선택 토큰의 수에 따라 최종 확장 키워드들 간의 순위를 산출할 수도 있다. 최종 확장 키워드들 간의 순위를 결정하기 위한 기준은 전술한 기준들 이외에 필요에 따라 다양한 기준들이 적용될 수 있으며, 이러한 변형에 불구하고 본 발명의 요지를 포함하고 있는 한 본 발명의 권리범위에 속함은 당업자에게 자명할 것이다.

컨셉 키워드 확장 데이터 셋 생성방법의 예시

도 3은 본 발명의 바람직한 일 실시예예 따른 컨셉 키워드 확장 데이터 셋 생성장치에서 수행되는 컨셉 키워드 확장 데이터 셋 생성과정을 도시한 순서도이고, 도 4a는 본 발명의 바람직한 일 실시예예 컨셉 키워드 확장 데이터 셋 생성과정을 설명하기 위한 개념도이며, 도 4b는 본 발명의 바람직한 일 실시예예 컨셉 키워드 후보군의 생성과정을 설명하기 위한 개념도이고, 도 4c는 본 발명의 바람직한 일 실시예에 따른 키워드와 컨셉 키워드 간의 매핑과정을 설명하기 위한 개념도이다. 이하에서는 도 3, 도 4a 내지 4c를 참조하여, 본 발명에 따른 컨셉 키워드 확장 데이터 셋의 생성과정에 대하여 상세하게 설명하도록 한다.

먼저, 개괄적인 설명을 위해 도 4a를 참조하면, 본 발명에 따른 컨셉 키워드 확장 데이터 셋 생성방법은 크게 각각의 키워드 그룹으로부터 컨셉 키워드 후보군을 생성하는 컨셉 마이닝 단계(S400), 키워드 그룹에 포함된 각각의 키워드를 컨셉 마이닝 단계를 통해 생성된 컨셉 키워드 후보들 중 하나에 매핑하여 컨셉 키워드를 결정하는 키워드-컨셉 매핑 단계(S410), 키워드-컨셉 매핑 단계를 통해 결정된 각각의 컨셉 키워드들의 그룹 연관도 점수를 산출하는 그룹-컨셉 스코어링 단계(S420), 컨셉 키워드와 키워드 그룹을 각각 노드로 설정하고, 그룹 연관도 점수를 에지로 설정하여 클릭 그래프 알고리즘을 적용하는 클릭 그래프 적용 단계(S430), 클릭 그래프 적용 단계를 통해 판단된 컨셉 키워드들의 연관관계에 기초하여 컨셉 키워드 간의 확장 데이터 셋을 생성하는 단계(S440)를 수행함으로써 확장 데이터 셋을 생성한다.

보다 구체적인 설명을 위하여 도 3을 참조하면, 먼저 확장 데이터 셋 생성장치(200)는 저장된 키워드 그룹의 키워드에 대하여 형태소 분석을 통하여 토큰(형태소)를 추출한다(S300). 토큰들이 추출된 후 확장 데이터 셋 생성장치(200), 추출된 토큰들 각각에 대하여 TF-IDF 기반의 토큰별 중요도 점수를 산출하고, 산출된 토큰별 중요도 점수에 기초하여 주요 토큰을 결정한다(S302). 도 4b에 도시된 실시예를 참조하면, S 402' 단계에서 '꽃', '배송', '배달', '꽃다발', '다발', '장미'라는 주요 토큰들이 추출/결정되었음을 확인할 수 있다.

주요 토큰들이 결정되면, 확장 데이터 셋 생성장치(200)는 주요 토큰들을 조합하여 컨셉 키워드 후보군을 생성한다(S304). 도 4b를 참조하면, 1~n개의 주요 토큰을 이용하여 생성된 컨셉 키워드 후보군이 S404' 단계에 도시되어 있다. 이때, 조합되어 생성되는 모든 컨셉 키워드 후보가 컨셉 키워드 후보군에 포함되지 않고, 대응되는 광고 키워드가 존재하는 컨셉 키워드 후보가 컨셉 키워드 후보군에 포함되도록 구성될 수 있다. 즉, 실제 광고 키워드로 사용되지 않는 컨셉 키워드 후보는 무의미하므로, 컨셉 키워드 후보군 생성과정에서 제외하도록 구성될 수 있다. 도 4b의 S404' 단계에서, '꽃다발꽃', '배달꽃다발', '꽃장미배달', '배달꽃', '꽃배달장미', '다발장미', '꽃배달꽃다발'은 실제 광고 키워드로 사용되지 않기 때문에 컨셉 키워드 후보군에서 제외된다.

컨셉 키워드 후보군 생성이 완료되면, 확장 데이터 셋 생성장치(200)는 키워드 그룹 내의 각각의 키워드를 컨셉 키워드 후보군 중 하나의 컨셉 키워드 후보에 매핑하는 과정을 수행한다(S306). 전술한 바와 같이, 이러한 매핑 과정은 키워드와 컨셉 키워드 후보 간의 유사 계수를 이용하여 수행된다. 도 4c를 참조하면, 키워드 그룹에 포함되어 있는 '빨간장미꽃배달'(400)이라는 키워드는 '빨간', '장미', '꽃', '배달'이라는 토큰으로 구성되어 있으며, 컨셉 키워드 후보 '장미꽃다발배송'(402)은 '장미', '꽃', '다발', '배송'이라는 토큰으로 구성되어 있고, '장미꽃배달'(404)은 '장미', '꽃', '배달'이라는 토큰으로 구성되어 있으며, '꽃다발장미'(406)는 '꽃', '다발', '장미'라는 토큰으로 구성되어 있다, 토큰을 기준으로 '빨간장미꽃배달'(400)이라는 키워드에 대한 각 컨셉 키워드 후보의 유사 계수를 산출하면, 장미꽃다발배송'(402)은 2/6, '장미꽃배달'(404)은 3/4, '꽃다발장미'(406)는 2/5의 유사 계수를 가지게 되므로, '빨간장미꽃배달'(400)이라는 키워드는 '장미꽃배달'(404)라는 컨셉 키워드 후보에 매핑된다. 확장 데이터 셋 생성장치(200)는 키워드 그룹 내의 키워드에 매핑되는 컨셉 키워드 후보를 컨셉 키워드로 결정한다(S308).

한편, 복수의 키워드 그룹이 저장/설정되어 있는 경우, 각각의 키워드 그룹에 대하여 별도로 전술한 과정이 수행되어, 각 키워드 그룹별로 컨셉 키워드가 생성/결정된다.

키워드 그룹에 대한 컨셉 키워드가 결정되면, 확장 데이터 셋 생성장치(200)는 컨셉 키워드별로 컨셉 키워드에 매핑된 키워드 그룹에 속한 키워드 수를 이용하여 컨셉 키워드별 그룹 연관도 점수를 산출한다(S310).

컨셉 키워드별 그룹 연관도 점수가 산출되면, 확장 데이터 셋 생성장치(200)는 컨셉 키워드와 키워드 그룹을 각각 노드로 설정하고, 그룹 연관도 점수를 에지로 설정하여 클릭 그래프 알고리즘을 적용하여 각 컨셉 키워드 간의 연관 관계를 판단한다(S312).

컨셉 키워드들 간의 연관 관계가 판단되면, 확장 데이터 셋 생성장치(200)는 서로 연관 관계를 갖는 주요 키워드들을 하나의 컨셉 키워드 확장 데이터 셋으로 설정함으로써 과정을 종료한다(S314).

컨셉 키워드 확장 데이터 셋을 이용한 광고방법의 예시

도 5는 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 광고장치에서 수행되는 광고노출 과정을 도시한 순서도이고, 도 6은 본 발명의 바람직한 일 실시예에 따른 컨셉 키워드 확장 데이터 셋을 이용한 최종 키워드 확장 과정을 설명하기 위한 개념도이다. 이하에서, 도 5 및 6을 참조하여, 본 발명에 따른 컨셉 키워드 확장 데이터 셋을 이용한 광고방법이 수행되는 과정을 상세하게 설명하도록 한다.

도 5를 참조하면, 먼저 광고장치(300)는 사용자 단말기(120)로부터 전송되는 검색 키워드를 수신하고, 광고장치(300)는 수신된 검색 키워드를 확장 데이터 셋에 포함된 컨셉 키워드들 중 하나에 매핑한다(S500). 전술한 바와 같이, 이러한 매핑은 검색 키워드와 컨셉 키워드들 간의 유사 계수를 산출하고, 가장 높은 유사 계수를 갖는 컨셉 키워드에 검색 키워드를 매핑하도록 구성된다. 또한, 광고장치(300)는 매핑을 수행하는 동시에, 검색 키워드의 토큰 중 매핑된 컨셉 키워드에 포함되지 않은 토큰을 선택 토큰으로서 저장한다. 도 6을 참조하면, '100일기념꽃배달'(600)이란 검색 키워드가 '꽃배달'(602)이라는 컨셉 키워드에 매핑되며, 컨셉 키워드 '꽃배달'(602)에 포함되지 않은 검색 키워드의 토큰 '100일', '기념'은 선택 토큰으로서 저장된다.

검색 키워드와 컨셉 키워드의 매핑이 완료되면, 광고장치(300)는 컨셉 키워드 확장 데이터 셋(610)을 이용하여 매핑된 컨셉 키워드를 확장한다(S502). 도 6을 참조하면, '꽃배달'(602)이라는 컨셉 키워드는 '화환'(604), '꽃바구니'(606), '꽃배달서비스'(608)라는 컨셉 키워드들로 확장된다. 이때, 확장되는 컨셉 키워드들은 필수 토큰으로서 저장된다.

컨셉 키워드의 확장이 완료되면, 광고장치(300)는 필수 토큰과 선택 토큰을 이용하여 최종 확장 키워드를 생성한다(S504). 전술한 바와 같이, 필수 토큰은 필수 토큰들 중 하나가 최종 확장 키워드에 반드시 포함되어야 하는 토큰이며, 선택 토큰은 선택적으로 최종 확장 키워드에 포함될 수 있는 토큰을 의미한다. 도 6을 참조하면, '꽃배달'(602)이라는 컨셉 키워드는 '화환'(604), '꽃바구니'(606), '꽃배달서비스'(608)라는 컨셉 키워드들로 확장되므로, 필수 토큰은 '화환'(604), '꽃바구니'(606), '꽃배달서비스'(608)가 된다. 또한, 전술한 바와 같이, 선택 토큰은 '100일', '기념'이 되므로, 광고장치(300)는 필수 토큰과 선택 토큰을 이용하여 최종 확장 키워드를 생성하게 된다. 이때, 보다 바람직하게 본 발명에 따른 광고장치(300)는 사용가능한 광고 키워드들에 대한 인덱스 정보(620)를 저장하고 있으며, 인덱스 정보를 참조하여 필수 토큰 또는 필수 토큰 및 선택 토큰의 조합으로 생성된 확장 키워드가 사용가능한 광고 키워드인지 여부를 판단하고, 사용가능한 광고 키워드인 경우에 한하여 최종 확장 키워드로 결정하도록 구성될 수 있다. 도 6에 도시된 실시예에 있어, 필수 토큰과 선택 토큰을 이용한 모든 가능한 확장 키워드는 '화환', '100일화환', '기념화환', '100일기념화환', '꽃바구니', '100일꽃바구니', '기념꽃바구니', '100일기념꽃바구니', '꽃배달서비스', '100일꽃배달서비스', '기념꽃배달서비스', '100일기념꽃배달서비스'이다. 그러나 실제 '100일화환', '기념화환', '100일기념화환'은 사용가능하지 않은 광고 키워드에 해당되므로, 최종 확장 키워드 집합(630)에는 제외된다.

광고장치(300)는 최종 확장 키워드 집합이 생성되면, 최종 확장 키워드 집합에 포함된 최종 확장 키워드들을 이용하여 매칭되는 광고를 검색하고, 검색된 광고를 사용자 단말기(120)로 노출한다(S506).

본 발명에 따른 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

100 : 광고주 단말기 110 : 네트워크
120 : 사용자 단말기 130 : 광고 서버
200 : 컨셉 키워드 확장 데이터 셋 생성장치
300 : 컨셉 키워드 확장 데이터 셋을 이용한 광고장치

Claims

삭제
컨셉 키워드 확장 데이터 셋 생성장치에 의해 수행되는 컨셉 키워드 확장 데이터 셋 생성방법에 있어서,
(a) 키워드 그룹으로부터 컨셉 키워드를 추출하는 단계;
(b) 상기 키워드 그룹과 상기 컨셉 키워드 간의 컨셉 키워드별 그룹 연관도 점수를 산출하는 단계; 및
(c) 상기 컨셉 키워드별 그룹 연관도 점수에 기초하여 서로 연관 관계를 가지는 복수의 컨셉 키워드를 결정하고, 상기 결정된 복수의 컨셉 키워드를 키워드 확장 데이터 셋으로 설정하는 단계를 포함하고,
상기 (a) 단계는,
(a1) 상기 키워드 그룹에 속한 각각의 키워드에 대하여 형태소 분석을 통하여 토큰을 추출하는 단계;
(a2) 상기 추출된 토큰 각각에 대하여 토큰별 중요도 점수를 산출하는 단계;
(a3) 상기 산출된 토큰별 중요도 점수를 기초로 미리 설정된 기준에 따라 상기 토큰 중 적어도 하나 이상의 토큰을 주요 토큰으로 설정하는 단계; 및
(a4) 상기 주요 토큰을 이용하여 컨셉 키워드를 생성하는 단계를 포함하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2에 있어서,
상기 (a2) 단계는 상기 토큰의 상기 키워드 그룹 내의 노출 빈도(Term Frequency)에 기초하여 상기 토큰별 중요도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2에 있어서,
상기 (a2) 단계는 상기 토큰의 다른 키워드 그룹 내의 노출 빈도(Inverse Document Frequency)에 기초하여 상기 토큰별 중요도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2에 있어서,
상기 (a2) 단계는 상기 토큰의 상기 키워드 그룹 내의 노출 빈도(Term Frequency) 및 상기 토큰의 다른 키워드 그룹 내의 노출 빈도(Inverse Document Frequency)에 기초하여 상기 토큰별 중요도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2에 있어서,
상기 (a3) 단계는 미리 설정된 이상의 중요도 점수를 가지는 토큰을 주요 토큰으로 설정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2에 있어서,
상기 (a3) 단계는 상기 토큰별 중요도 점수를 기초로 미리 설정된 수의 상위 토큰들을 주요 토큰으로 설정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2에 있어서,
상기 (a4) 단계는 상기 설정된 주요 토큰을 1개부터 n개(주요토큰의 총 개수)까지 선택하고, 선택된 적어도 하나 이상의 주요 토큰을 조합하여 상기 컨셉 키워드를 생성하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2에 있어서,
상기 (a4) 단계는,
(a4-1) 상기 설정된 주요 토큰을 이용하여 복수의 컨셉 키워드 후보를 생성하는 단계; 및
(a4-2) 미리 설정된 기준에 따라 상기 생성된 복수의 컨셉 키워드 후보 중 컨셉 키워드를 결정하는 단계를 포함하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 9에 있어서,
상기 (a4-2) 단계는 상기 복수의 컨셉 키워드 후보의 조회수를 비교하고, 조회수를 기초로 조회수가 높은 미리 설정된 개수의 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 9에 있어서,
상기 (a4-2) 단계는 동일한 주요 토큰으로 구성된 컨셉 키워드 후보가 복수 개 존재하는 경우, 상기 동일한 주요 토큰으로 구성된 복수의 컨셉 키워드 후보 중 조회수가 가장 많은 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 9에 있어서,
상기 (a4-2) 단계는 상기 생성된 복수의 컨셉 키워드 후보 중 대응되는 검색 키워드가 존재하는 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 9에 있어서,
상기 (a4-2) 단계는 상기 키워드 그룹에 속한 각각의 키워드를 상기 생성된 복수의 컨셉 키워드 후보 중 하나에 매핑하고, 상기 키워드 그룹에 속한 키워드 중 적어도 하나에 매핑되는 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 13에 있어서,
상기 (a4-2) 단계는,
(a4-2-1) 상기 컨셉 키워드 후보들과 상기 키워드 그룹에 속한 키워드 각각의 유사 계수(jaccard coefficient)를 산출하는 단계;
(a4-2-2) 상기 유사 계수를 기초로 상기 키워드 그룹에 속한 각각의 키워드를 상기 컨셉 키워드 후보들 중 가장 높은 유사 계수를 가지는 컨셉 키워드 후보에 매핑하는 단계; 및
(a4-2-3) 상기 키워드 그룹에 속한 키워드 중 적어도 하나의 키워드에 매핑되는 컨셉 키워드 후보를 컨셉 키워드로 결정하는 단계를 포함하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 14에 있어서,
상기 (a4-2-2) 단계는 상기 키워드 그룹에 속한 키워드에 매핑되는 동일한 유사 계수를 가지는 복수의 컨셉 키워드 후보가 존재하는 경우, 상기 복수의 컨셉 키워드 후보를 구성하는 상기 주요 토큰의 토큰별 중요도 점수를 합산하고, 합산된 중요도 점수의 평균값을 산출한 후, 가장 높은 중요도 점수 평균값을 갖는 컨셉 키워드 후보에 상기 키워드를 매핑하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 13에 있어서,
상기 (b) 단계는 상기 컨셉 키워드에 매핑된 상기 키워드 그룹에 속한 키워드의 수를 기초로 각각의 컨셉 키워드별 그룹 연관도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
컨셉 키워드 확장 데이터 셋 생성장치에 의해 수행되는 컨셉 키워드 확장 데이터 셋 생성방법에 있어서,
(a) 키워드 그룹으로부터 컨셉 키워드를 추출하는 단계;
(b) 상기 키워드 그룹과 상기 컨셉 키워드 간의 컨셉 키워드별 그룹 연관도 점수를 산출하는 단계; 및
(c) 상기 컨셉 키워드별 그룹 연관도 점수에 기초하여 서로 연관 관계를 가지는 복수의 컨셉 키워드를 결정하고, 상기 결정된 복수의 컨셉 키워드를 키워드 확장 데이터 셋으로 설정하는 단계를 포함하고,
상기 (c) 단계는 키워드 그룹 정보, 컨셉 키워드 정보 및 컨셉 키워드별 그룹 연관도 점수에 기초하여 클릭 그래프 알고리즘을 이용해 컨셉 키워드 간의 연관 관계를 판단하고, 서로 연관 관계를 갖는 복수의 컨셉 키워드를 컨셉 키워드 확장 데이터 셋으로 설정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성방법.
청구항 2 내지 17 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.
삭제
적어도 하나 이상의 키워드를 포함하는 복수의 키워드 그룹을 저장하고 있는 컨셉 키워드 확장 데이터 셋 생성장치에 있어서,
키워드 그룹으로부터 컨셉 키워드를 생성하고, 생성된 상기 컨셉 키워드에 대하여 컨셉 키워드별 그룹 연관도 점수를 산출하는 컨셉 키워드 생성부; 및
상기 컨셉 키워드별 그룹 연관도 점수에 기초하여 서로 연관 관계를 가지는 복수의 컨셉 키워드를 결정하고, 상기 결정된 복수의 컨셉 키워드를 컨셉 키워드 확장 데이터 셋으로 설정하는 확장 데이터 셋 생성부를 포함하고,
상기 컨셉 키워드 확장 데이터 셋 생성장치는, 상기 키워드 그룹으로부터 적어도 하나 이상의 주요 토큰을 추출하는 주요 토큰 추출부를 더 포함하며,
상기 컨셉 키워드 생성부는 상기 주요 토큰 추출부에 의해 추출된 상기 주요 토큰을 조합하여 상기 컨셉 키워드를 생성하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 20에 있어서,
상기 주요 토큰 추출부는 상기 키워드 그룹에 속한 각각의 키워드에 대하여 형태소 분석을 통하여 토큰을 추출하고, 상기 추출된 토큰 각각에 대하여 토큰별 중요도 점수를 산출하며, 상기 산출된 토큰별 중요도 점수를 기초로 미리 설정된 기준에 따라 상기 토큰 중 적어도 하나 이상의 토큰을 주요 토큰으로 설정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 21에 있어서,
상기 주요 토큰 추출부는 상기 토큰의 상기 키워드 그룹 내의 노출 빈도(Term Frequency)에 기초하여 상기 토큰별 중요도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 21에 있어서,
상기 주요 토큰 추출부는 상기 토큰의 다른 키워드 그룹 내의 노출 빈도(Inverse Document Frequency)에 기초하여 상기 토큰별 중요도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 21에 있어서,
상기 주요 토큰 추출부는 상기 토큰의 상기 키워드 그룹 내의 노출 빈도(Term Frequency) 및 상기 토큰의 다른 키워드 그룹 내의 노출 빈도(Inverse Document Frequency)에 기초하여 상기 토큰별 중요도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 21에 있어서,
상기 주요 토큰 추출부는 미리 설정된 이상의 중요도 점수를 가지는 토큰을 주요 토큰으로 설정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 21에 있어서,
상기 주요 토큰 추출부는 상기 토큰별 중요도 점수를 기초로 미리 설정된 수의 상위 토큰들을 주요 토큰으로 설정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 20에 있어서,
상기 컨셉 키워드 생성부는 상기 설정된 주요 토큰을 1개부터 n개(주요토큰의 총 개수)까지 선택하고, 선택된 적어도 하나 이상의 주요 토큰을 조합하여 상기 컨셉 키워드를 생성하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 20에 있어서,
상기 컨셉 키워드 생성부는 상기 설정된 주요 토큰을 이용하여 복수의 컨셉 키워드 후보를 생성하고, 미리 설정된 기준에 따라 상기 생성된 복수의 컨셉 키워드 후보 중 컨셉 키워드를 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 28에 있어서,
상기 컨셉 키워드 생성부는 상기 복수의 컨셉 키워드 후보의 조회수를 비교하고, 조회수를 기초로 조회수가 높은 미리 설정된 개수의 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 28에 있어서,
상기 컨셉 키워드 생성부는 동일한 주요 토큰으로 구성된 컨셉 키워드 후보가 복수 개 존재하는 경우, 상기 동일한 주요 토큰으로 구성된 복수의 컨셉 키워드 후보 중 조회수가 가장 많은 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 28에 있어서,
상기 컨셉 키워드 생성부는 상기 생성된 복수의 컨셉 키워드 후보 중 대응되는 검색 키워드가 존재하는 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 28에 있어서,
상기 컨셉 키워드 생성부는 상기 키워드 그룹에 속한 각각의 키워드를 상기 생성된 복수의 컨셉 키워드 후보 중 하나에 매핑하고, 상기 키워드 그룹에 속한 키워드 중 적어도 하나에 매핑되는 컨셉 키워드 후보를 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 32에 있어서,
상기 컨셉 키워드 생성부는 상기 컨셉 키워드 후보들과 상기 키워드 그룹에 속한 키워드 각각의 유사 계수(jaccard coefficient)를 산출하고, 상기 유사 계수를 기초로 상기 키워드 그룹에 속한 각각의 키워드를 상기 컨셉 키워드 후보들 중 가장 높은 유사 계수를 가지는 컨셉 키워드 후보에 매핑하며, 상기 키워드 그룹에 속한 키워드 중 적어도 하나의 키워드에 매핑되는 컨셉 키워드 후보들을 컨셉 키워드로 결정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 33에 있어서,
상기 컨셉 키워드 생성부는 상기 키워드 그룹에 속한 키워드에 매핑되는 동일한 유사 계수를 가지는 복수의 컨셉 키워드 후보가 존재하는 경우, 상기 복수의 컨셉 키워드 후보를 구성하는 상기 주요 토큰의 토큰별 중요도 점수를 합산하고, 합산된 중요도 점수의 평균값을 산출한 후, 가장 높은 중요도 점수 평균값을 갖는 컨셉 키워드 후보에 상기 키워드를 매핑하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
청구항 32에 있어서,
상기 컨셉 키워드 생성부는 상기 컨셉 키워드에 매핑된 상기 키워드 그룹에 속한 키워드의 수를 기초로 각각의 컨셉 키워드별 그룹 연관도 점수를 산출하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.
적어도 하나 이상의 키워드를 포함하는 복수의 키워드 그룹을 저장하고 있는 컨셉 키워드 확장 데이터 셋 생성장치에 있어서,
키워드 그룹으로부터 컨셉 키워드를 생성하고, 생성된 상기 컨셉 키워드에 대하여 컨셉 키워드별 그룹 연관도 점수를 산출하는 컨셉 키워드 생성부; 및
상기 컨셉 키워드별 그룹 연관도 점수에 기초하여 서로 연관 관계를 가지는 복수의 컨셉 키워드를 결정하고, 상기 결정된 복수의 컨셉 키워드를 컨셉 키워드 확장 데이터 셋으로 설정하는 확장 데이터 셋 생성부를 포함하고,
상기 확장 데이터 셋 생성부는 키워드 그룹 정보, 컨셉 키워드 정보 및 컨셉 키워드별 그룹 연관도 점수에 기초하여 클릭 그래프 알고리즘을 이용해 컨셉 키워드 간의 연관 관계를 판단하고, 서로 연관 관계를 갖는 복수의 컨셉 키워드를 컨셉 키워드 확장 데이터 셋으로 설정하는 것을 특징으로 하는 컨셉 키워드 확장 데이터 셋 생성장치.