KR20090068803A - 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템 - Google Patents

콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템 Download PDF

Info

Publication number
KR20090068803A
KR20090068803A KR1020070136565A KR20070136565A KR20090068803A KR 20090068803 A KR20090068803 A KR 20090068803A KR 1020070136565 A KR1020070136565 A KR 1020070136565A KR 20070136565 A KR20070136565 A KR 20070136565A KR 20090068803 A KR20090068803 A KR 20090068803A
Authority
KR
South Korea
Prior art keywords
search
content
item
emotional
appreciation
Prior art date
Application number
KR1020070136565A
Other languages
English (en)
Other versions
KR100917784B1 (ko
Inventor
한성주
Original Assignee
한성주
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한성주 filed Critical 한성주
Priority to KR1020070136565A priority Critical patent/KR100917784B1/ko
Priority to US12/679,011 priority patent/US20100262597A1/en
Priority to PCT/KR2008/007228 priority patent/WO2009082100A2/en
Publication of KR20090068803A publication Critical patent/KR20090068803A/ko
Application granted granted Critical
Publication of KR100917784B1 publication Critical patent/KR100917784B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 콘텐트(content)를 감상한 사람들이 달아놓은 코멘트(comment) 정보를 적극적으로 이용한 검색 방법 및 시스템에 대한 것이다. 본 발명은 감성적인 단어가 포함된 검색 질의에 대해 적절한 순위의 결과를 보여주는 것이 목적이다.
이를 위해 검색용 데이터베이스를 만드는 단계에서 코멘트에서 감상적인 단어들을 추출하여 종류별로 분류한 다음 해당 콘텐트에 대한 감상을 정리한 메타데이터(metadata)를 만들어 콘텐트 관련 정보와 함께 저장한다.
그 후 사용자가 감성적인 단어가 포함된 검색 질의를 하면 먼저 질의어에서 감성적인 단어와 그렇지 않은 단어를 분리한다. 그 다음 비감성적인 단어를 이용하여 해당 콘텐트를 찾은 뒤 그 중 감성적인 단어와 관련된 감상 항목 체크 여부에 따라(혹은 점수에 따라) 검색 결과 순위를 조정한다.
본 발명을 이용하여 감성적인 정보 검색 질의에 대해 객관적이고 신뢰할 수 있는 결과를 보여줄 수 있다.
코멘트, 덧글, 감성, 집단 감성, 아날로그적, 감상종류

Description

콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템{METHOD AND SYSTEM FOR SEARCHING INFORMATION OF COLLECTIVE EMOTION BASED ON COMMENTS ABOUT CONTENTS ON INTERNET}
본 발명은 컴퓨터 혹은 정보통신망을 이용한 정보검색 방법 및 시스템에 관한 것으로서, 감성적 단어가 포함된 검색 질의에 부합하는 콘텐트를 적절한 결과 순위로 보여주는 검색 방법 및 시스템에 관한 것이다.
종래에는 정보검색자가 인터넷 상에서 감성적 단어가 포함된 질의(예를 들어 "아름다운 바다 사진")를 하는 경우 검색 서비스 제공자는 각종 웹 사이트 상의 콘텐트에 대해 순위가 포함된 적절한 검색결과를 보여줄 방법이 없었다.
따라서 검색 서비스 제공자가 직접 임의로 결과 및 순위를 결정하거나 아니면 질의에 포함되어 있는 감성적 단어와 일치하는 텍스트 정보(예를 들어 이미지 파일 이름)를 가진 콘텐트를 보여주었을 뿐이다.
이러한 종래 방식은 소수의 검색 서비스 제공자가 콘텐트에 대한 감상을 직접 작성하고 편집해야 하기 때문에 방대하고 빠르게 증가하는 인터넷 상의 콘텐트들에 대해 일일이 사람의 손에 의존한다는 것은 매우 비능률적이라는 문제점이 있다.
또한 소수의 검색 서비스 제공자에 의해 임의로 결정되므로 검색 결과에 대한 객관성과 신뢰성이 떨어지는 문제점이 있다.
또한 종래에는 이미지에 대한 감성적 단어가 포함된 정보검색의 경우 보통 이미지가 속한 문헌의 정보를 가지고 결과 순위를 조정했었다. 즉 일반적으로 이미지 파일 이름, 그 이미지 파일을 링크하는 앵커 텍스트(anchor text), 그 이미지가 속한 웹 사이트의 정보나 텍스트, 타이틀을 이용했었다. 그러나 이미지 파일 이름 등이 그 이미지에 대해 적절히 설명하지 못하는 경우가 많은 문제점이 있었다.
한편 이미지나 동영상에 대해 그 콘텐트 내용 자체를 이루는 비트(bit)들로부터 감성적인 정보를 추출하고 데이터베이스화하여 검색 질의에 이용하려는 시도가 있었다. 그러나 이러한 방법이 인간이 느끼는 복잡 미묘하고 설명하기 난해한 감성적인 질의와 부합하는 콘텐트를 찾을 수 있을지 회의적이고 지나치게 많은 계산 비용등으로 인해 실용화가 가능한지 의문이었다.
또한 종래 국내등록특허 제10-0462542호의 '신뢰성 있는 컨텐츠를 제공하는 컨텐츠 검색시스템 및 그 방법'에서는 신뢰도를 측정하기 위한 평가 변수로써 컨텐츠에 대한 다른 사용자들의 코멘트 수를 개시하고 있다.
그러나 이는 코멘트 수를 이용한 신뢰도 평가로써 코멘트의 내용과 무관하게 단순히 코멘트의 수만을 가지고 신뢰도를 평가하는 것이었다. 따라서 코멘트 내용을 참조하지 않기 때문에 정보검색자가 감성적 단어가 포함된 질의를 하는 경우 적절 한 순위결과를 보여주지 못하는 문제점이 있었다.
본 발명은 상기의 문제점을 해결하기 위해 인터넷 상의 각종 콘텐트에 달린 코멘트를 수집하여 검색용 데이터베이스(이하 DB라고 한다)를 작성하고 이 검색용DB를 이용하여 감성적인 질의에 대해 객관적이고 신뢰할 수 있는 순위 결과를 보여줌과 동시에 산업적으로 이용 가능한 검색 방법 및 시스템을 얻고자 한다.
본 발명은 상기 기술적 과제를 달성하기 위해 다음과 같은 두 가지 가설을 전제로 한 검색 방법과 시스템을 제공한다.
첫째, 사람들이 콘텐트를 접하고 느끼는 감정은 유사하다. 즉 남이 그 콘텐트를 보고 느끼는 감정은 나와 유사할 것이다. 예를 들어 어떤 이가 특정 사진을 보고 아름답다고 느낄 경우 다른 이도 그렇게 느낄 것이라는 것이다.
둘째, 하나의 콘텐트를 접하고 느낀 감정을 적은 감상 코멘트(서비스 업체별로 다양한 이름으로 불려질 수 있다. 예를 들어, 꼬리말, 덧글, 한줄 답변 등등이 있다)를 쓴 사용자가 많을수록 그 코멘트에 있는 감상들의 합이나 평균은 정상적인 인간이 그 콘텐트를 접하고 느끼는 감정의 종류 및 그 강도와 점점 더 근접해진다.
본 발명에서는 이러한 가설을 다수의 개인이 참여하여 협업하면 더 좋은 지적인 결과물을 낸다는 집단 지성(collective intelligence)과 유사한 개념인 집단 감성(collective emotion)이라고 정의한다.
본 발명은 이 가설을 바탕으로 콘텐트를 감상한 사람들이 달아놓은 코멘트 정보를 적극적으로 이용하여 데이터베이스화시킨 후 이러한 데이터베이스를 기반으로 하여 감성적 단어가 포함된 질의어에 대한 정보를 검색하는 방법 및 시스템을 제공하여 상기의 기술적 과제를 해결했다.
본 발명은 다음과 같은 단계를 특징으로 하는 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템이다.
먼저 중앙서버가 감상항목 테이블이 기록된 검색용DB를 구축하는 DB구축단계(S101)를 거친다.
여기서 감상항목 테이블이란 감성적 단어를 항목별로 분류해놓은 감상항목과 그에 대한 값(value)을 필드로 하는 표(도7참조)를 말한다.
그 후 상기 중앙서버가 정보검색자로부터 질의어를 입력 전송받는 질의어전송단계(S102)를 진행하고 상기 중앙서버가 전송된 질의어로부터 비감성적 단어와 감성 적 단어를 분리하여 추출하는 단어추출단계(S103)를 거친다.
다음으로 상기 중앙서버가 비감성적 단어와 관련된 콘텐트를 검색용DB로부터 검색하는 콘텐트검색단계(S104)를 진행한다. 다만 질의어에 비감성적 단어가 없는 경우 상기 콘텐트검색단계(S104)는 생략이 가능하다.
그 후 상기 중앙서버가 감성적 단어가 속하는 감상종류를 감상분류표로부터 검색하는 감상종류검색단계(S105)를 진행한다.
그 후 상기의 감상분류표로부터 해당 감성적 단어가 속하는 감상종류를 판단한 후 상기 중앙서버는 상기 콘텐트검색단계를 거쳐 검색된 콘텐트에 대한 감상 항목들 중 질의한 감상종류에 일치하는 항목이 체크되어 있는지(혹은 점수가 부여되어 있는지)를 판단하는 감상항목체크단계(S106)를 진행한다.
그 후 상기 중앙서버가 상기 감상항목체크단계에서 일치하는 항목이 체크되어 있으면(혹은 점수가 부여되어 있으면) 소정의 방식에 따라 검색결과 순위를 조정하는 순위조정단계(S107)를 진행한다. 여기서 상기의 소정의 방식은 구체적인 실시예를 통해 후술한다.
그 후 최종적으로 상기 중앙서버는 조정된 순위에 따라 검색결과를 정보검색자단말기에 표시하는 결과표시단계(S108)를 진행한다.
이로써 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법이 이루어진다.
이하에서는 상기의 검색 방법을 각 단계별로 순서에 따라 구체적으로 상술한다.
먼저 상기의 DB구축단계(S101)를 설명한다.
상기의 DB구축단계(S101)는 다시 다음과 같은 단계를 포함한다.
먼저 상기 중앙서버가 인터넷 상에서 코멘트가 달린 문서를 수집하는 문서수집단계(S201)를 진행하고,
상기 중앙서버가 수집된 문서에서 코멘트를 추출하는 코멘트추출단계(S202)를 진행한다.
즉 중앙서버는 인터넷에 산재해 있는 많은 웹 문서로부터 원하는 정보만을 자동으로 선택하여 수집하는 종래의 웹 로봇(web robot) 등을 이용하여 코멘트가 달린 웹 문서를 수집하고 수집된 웹 문서로부터 코멘트를 추출하게 된다.
그 후 상기 중앙서버는 추출된 코멘트로부터 감성적 단어가 있는지 검색하는 감성단어검색단계(S203)를 진행한다.
즉 종래의 형태소 분석 방법, 워드 스테밍(word stemming)기법 등을 이용하여 상기의 추출된 코멘트로부터 감성적 단어(혹은 문구(phrase))등을 분리하여 추출한다.
그 후 상기 중앙서버가 감성적 단어를 분리 추출하면 감상분류표를 참조하여 해당 콘텐트가 속하는 감상 종류를 검색하는 감상종류검색단계(S204)를 진행한다.
그 후 검색된 해당 감상 항목에 체크하거나 점수를 부여하는 감상항목체크단계(S205)를 진행한다.
여기서 상기의 감상분류표(도3참조)란 감성적 단어를 항목별로 분류해 놓은 표를 말한다. 예를 들어 도3으로부터 '성나는' 이라는 감성적 단어가 '즐거운/분노의'라는 감상항목에 속한다는 것을 알 수 있다.
이렇게 감상을 분류하는 종류로는 인간이 보통 느끼는 희노애락오욕미추(喜怒哀樂惡慾美醜)나 '훌륭한', '멋지게' 등의 형용사/부사가 있을 수 있다. 이러한 분류법은 고정적으로 정해진 것은 아니며 얼마든지 그 분류를 변경하거나 간략화 혹은 상세화할 수 있다. 예를 들어 '귀엽다'와 '깜찍하다'라는 형용사는 같은 범주의 감상으로 분류할 수 있는 것이다.
또한 상기 감상항목체크단계(S205)는 단순히 해당 콘텐트가 어떠한 감상항목에 속하느냐를 체크하는 것뿐 만 아니라 해당 감상항목에 점수를 부여하는 것을 포함한다.
즉 상기의 감상항목체크단계(S205)에서 감성적인 코멘트가 달린 수(혹은 그러한 코멘트를 단 사용자 수)나 그 느낌의 강도를 기반으로 감상 항목별 점수를 줄 수 있다.
여기서 점수를 부여하는 방법에는 다음과 같은 방법들이 가능하다.
첫째, A와 B라는 뉴스 콘텐트를 접한 사용자들이 A에 대해서는 10개의 기쁘다는 코멘트를 달고 B에 대해서는 3개의 기쁘다는 코멘트를 달 경우 A콘텐트의 '기 쁜'이라는 감상항목의 점수를 B의 경우보다 더 많이 부여한다.
둘째, 뉴스 콘텐트 A, B에 대해 똑같이 기쁘다는 반응의 코멘트를 달더라도 A의 경우 '환희' 혹은 '매우 기쁜'이라는 좀 더 강도가 높은 표현이 달린 경우 B의 평범하게 기쁘다는 표현에 비해 더 높은 점수를 부여한다.
셋째, 해당 코멘트에 대한 다른 사용자들의 추천(혹은 찬성)이나 반대 여부를 가지고 점수를 조정할 수 있다. 혹은 감상을 텍스트 방식이 아닌 등급 부여(rating)방식으로 입력하게 하고 이를 기반으로 감상항목별 점수를 정할 수 있다.
넷째, 감성적 단어를 종류별로 분류할 때 반대되는 감상은 같은 항목으로 묶어서 관련된 단어를 찾은 경우 해당 항목에 점수를 더할 뿐 아니라 빼기도 할 수도 있다.
예를 들어 '기쁜'과 '슬픈'은 여타의 감정과 구분되면서도 서로 반대되는 감정이므로 '기쁜/슬픈'이라는 하나의 감상 항목을 만들 수 있다. 그리하여 '기쁜'과 관련된 감성적 단어일 경우 그 항목에 점수를 더하고 '슬픈'과 관련된 감성적 단어일 경우 그 항목의 점수를 뺄 수 있다(즉 음의 점수 부여).
다섯째, 복합적인 감정을 나타내는 단어의 경우 복수의 감상항목에 점수를 동시에 부여할 수도 있다. 예를 들어 '장려(壯麗)한'이라는 감성적 단어는 '웅장'하다는 감상과 '화려'하다는 감상을 내포하고 있으므로 두 단어에 속한 항목에 동시에 점수를 부여할 수 있다.
여섯째, 같은 코멘트라도 사용자의 권위나 평판, 신뢰도에 따라 감상항목에 부 여되는 점수를 다르게 할 수 있다.
한편 상기의 감상항목체크단계(S205)를 거친 후, 상기 중앙서버는 해당 콘텐트 관련정보와 그 메타데이터인 감상항목 테이블(도7참조)을 검색용DB에 저장하는 검색용DB저장단계(S206)를 진행함으로써 상기의 DB구축단계(S101)를 완료하게 된다.
여기서 콘텐트 관련정보란 도6에서와 같이 색인어, 웹페이지URL, 관련 콘텐트 URL, 순위점수 등을 말한다.
이하에서는 상기의 DB구축단계(S101)를 예를 통해 요약한다.
웹 문서에 '아기들 사진'이라는 제목으로 올라와 있는 아기들의 소꿉장난하는 사진을 접한 사용자들이 '귀엽다' 와 '깜찍하다'라는 반응의 코멘트를 올릴 수 있다. 그 후 중앙서버는 그 문서를 수집하고 검색용DB를 만들 때 이 사진에 대한 코멘트 중 감성적 단어(혹은 문구)를 분리, 추출한다. '귀여운'이라는 감상 항목이 체크된 감상항목테이블을 콘텐트 정보(URI, URL, 축약 정보 혹은 콘텐트 그 자체) 및 관련 문헌 정보(예: 웹 페이지의 텍스트)와 함께 검색용DB에 저장하는 것이다.
한편 이러한 검색용DB 작성 전후(前後)에 이 콘텐트 및 관련 문헌(예로 웹페이지)의 단어(혹은 문구)에 대해 색인화(indexing), 순위화(ranking)할 수도 있다. 나아가 예상되는 감성적 단어(혹은 문구)와 비감성적 단어(혹은 문구)의 조합으로 된 문구를 미리 색인화 및 순위화할 수도 있다. 그리고 그 콘텐트에 대한 코멘트도 문헌의 일부라고 볼 수 있다.
여기서 검색을 위한 색인화(정확한 용어는 역색인화(inverted indexing)이나 통상 색인화라고도 한다) 및 순위화는 본 발명에 의할 수도 있고 또는 본 발명과 상관없는 별도의 또 다른 검색 관련 처리 과정과 함께 사용될 수도 있다.
또한 색인화의 대상은 콘텐트나 문헌(document)에 나와 있는 단어(혹은 단어 집단(word group), 문구)들로써 그 제한은 없으며 그 콘텐트 혹은 문헌에 달린 코멘트(감성적 단어, 비감성적 단어 모두 포함할 수도 있다)도 색인화의 대상이 될 수 있다.
다음으로 상기의 질의어전송단계(S102)를 설명한다.
상기 중앙서버가 정보검색자로부터 질의어를 입력 전송받는다. 즉 정보검색자는 감성적 단어가 포함된 질의를 정보검색자단말기를 통해 상기 중앙서버로 입력 전송한다.
다음으로 상기의 단어추출단계(S103)를 설명한다.
상기 중앙서버가 전송된 질의어로부터 비감성적 단어와 감성적 단어를 분리하여 추출한다.
즉 종래의 형태소 분석, 워드 스테밍(word stemming)기법 등을 통하여 비감성적 단어와 감성적 단어를 분리 추출하게 된다.
만약 전송된 질의어에 감성적 단어만 존재한다면 감성적 단어만이 분리되어 추출될 것은 자명하다.
다음으로 상기의 콘텐트검색단계(S104)를 설명한다.
상기 중앙서버가 분리 추출된 비감성적 단어와 관련된 콘텐트를 검색용DB로부터 검색한다.
즉 상기 S103단계를 거쳐 분리된 비감성적 단어와 일치하는 색인어에 따라 색인화된 콘텐트를 검색용DB로부터 검색한다. 예를 들어 분리된 비감성적 단어가 '댄스곡'이라면 도6에서 '댄스곡'이라는 단어가 출현하는 웹페이지A와 웹페이지B가 검색된다.
다음으로 상기의 감상종류검색단계(S105)를 설명한다.
상기 중앙서버가 감성적 단어가 속하는 감상종류를 감상분류표로부터 검색한다.
즉 상기 S103단계에서 질의어로부터 분리된 감성적 단어가 감상종류의 어느 항목에 속하는지 검색한다.
예를 들어 중앙서버는 분리된 감성적 단어가 '따분한'인 경우 도3의 감상분류표로부터 '흥미로운/지루한'의 감상항목에 속함을 알게 된다.
다음으로 상기의 감상항목체크단계(S106)를 설명한다.
상기 중앙서버가 상기 콘텐트검색단계(S104)를 거쳐 검색된 콘텐트에 대한 감상 항목들 중 질의한 감상종류에 일치하는 항목이 체크되어 있는지를 판단한다.
즉 상기 콘텐트검색단계(S104단계)에서 비감성적 단어를 기준으로 검색된 콘텐트에 상응하는 감상항목테이블로부터 감성적 단어에 해당하는 감상종류의 항목이 체크되어 있는지를 판단한다.
여기서 해당 감상종류의 항목에 점수가 부여되어 있는 경우도 체크되어 있다고 볼 수 있다.
다만 질의어에 비감성적 단어가 없는 경우에는 상기의 콘텐트검색단계(S104)는 생략될 것이며 감상적 단어가 속하는 해당 감상항목에 체크 또는 점수가 부여된 콘텐트를 모두 검색하게 될 것이다.
다음으로 상기의 순위조정단계(S107)를 설명한다.
상기 중앙서버가 상기 감상항목체크단계(S106)에서 일치하는 항목이 체크되어 있으면 검색결과 순위를 조정한다. 즉 비감성적 단어로 찾아낸 콘텐트들 중에 질의한 감상 종류와 일치한 감상 항목이 체크되어 있으면 연관성이 높다고 보고 그 콘텐트의 결과 순위를 조정한다.
여기서 감상 항목이 체크되어 있어서 결과순위를 조정한다는 것은 감상항목에 점수가 부여되어 그 점수에 따라 결과 순위를 조정하는 경우를 포함하는 개념이다.
이하에서는 순위를 조정하는 방법을 예를 들어 설명한다.
어느 정보검색자가 '귀여운 아기 사진'이라는 검색 질의를 할 경우 먼저 비감성적 문구인 '아기 사진'과 관련된 콘텐트를 찾은 뒤 그 콘텐트의 메타데이터인 감상항목테이블에서 '귀여운'이라는 감상 항목이 체크된 콘텐트들을 더 높은 결과 순위로 조정한다.
그러나 반드시 비감성적 단어(혹은 문구)와 연관된 콘텐트를 먼저 추출하고 그 후에 감성적 단어(혹은 문구)를 이용하여 순위화할 필요는 없다. 반대로 감성적 단어(혹은 문구)와 연관된 콘텐트를 찾은 뒤 그 중 비감성적 단어(혹은 문구)와 연관성이 있는 콘텐트 순서로 결과를 조정할 수 있다. 혹은 감성적/비감성적 단어(혹은 문구)의 색인을 행렬구조로 만들어 놓을 수도 있다.
또한 감성적인 검색 질의에 느낌의 강도가 들어갈 경우 검색결과 순위를 다르게 할 수 있다.
예를 들어 단순히 '우울한 사진'이라는 검색 질의를 한 경우 우울하다는 항목의 점수가 높은 순서대로 순위를 결정하면 되나 '조금 우울한 사진'과 같이 느낌의 강도를 설명하는 부사가 포함된 경우 '조금'에 해당하는 우울함 점수를 가진 콘텐트들이 더 높은 결과 순위로 조정될 수 있다.
즉 다음과 같은 방식으로 구현이 가능하다. 검색 질의에 나타나는 '매우', '상당히', '조금', '별로... 않는', '거의... 않는', '전혀... 않는'과 같이 감성의 정도를 나타내는 부사에 대해 각각 점수를 10, 7, 5, 3, 1, 0점으로 세팅할 수 있다. 그리고 검색용DB를 검색할 때 그 감상 강도 점수에 일치하는(혹은 가까운) 감상 항목 점수를 가진 콘텐트를 상위 순위의 결과로 보여줄 수 있다.
예를 들어 웹페이지A의 감상항목 테이블상의 우울함 점수가 8점이고 웹페이지B의 감상항목 테이블 상의 우울함 점수가 10점이라고 가정하자. 정보검색자가 '상당히 우울한'이라는 감성적 단어가 포함된 질의를 하는 경우 '상당히'라는 부사는 상기 예에서 7점이라고 세팅되어 있기 때문에 우울함 점수가 7점에 가까운 웹페이지A가 웹페이지B보다 순위가 더 높게 조정된다.
이것은 참 혹은 거짓으로만 나누어질 수 없는 아날로그(analog)적인 감성을 검색하는 방법이라 볼 수 있다.
또한 동일 콘텐트라 하더라도 사용자들이 느낀 반응이 여러 가지인 경우(특히 반대되는 감상이 혼재된 경우) 이러한 상태를 검색 결과 순위를 조정하는데 반영할 수 있다.
예를 들어 A와 B라는 동영상 콘텐트가 있는데 A에 대해 사용자 모두 흥미롭다는 반응의 코멘트 10개를 단데 비해 B의 경우 10명은 '흥미롭다', 나머지 3명은 '따분하다'라는 반응을 보였다. 그럴 경우 '흥미로운 동영상'이라는 검색 질의에 대해 A콘텐트는 (+10)의 값만큼 결과 순위를 상향 조정하고 B콘텐트는 (+7=10-3)의 값만큼 결과 순위를 상향 조정할 수 있다.
다음으로 상기의 결과표시단계(S108)를 설명한다.
최종적으로 중앙서버는 상기의 순위조정단계(S107)를 통해 조정된 순위에 따라 검색결과를 정보검색자단말기에 표시한다.
여기서 결과를 표시하는 방법은 여러 가지일 수 있다. 가령 콘텐트에 대한 감상 항목 점수를 정보검색자에게 일목요연하게 시각화하여 보여줄 수도 있다. 예를 들어 각 감상 항목의 각 점수를 한 화면에 막대 그래프의 리스트 형태로 보여줄 수 있다.
또한 이러한 콘텐트에 대한 감상 항목 점수의 시간에 따른 변화추이를 일목요연하게 보여줄 수 있다. 예를 들어 특정 콘텐트에 대한 감상 항목의 점수 변화를 선 모양의 차트(chart)로 보여줄 수 있다.
또한 정보검색자가 질의하면 결과를 순위화하여 보여주는 방식과 달리 감상항목이라는 메타데이터를 가진 콘텐트들을 쉽게 접근, 열람, 브라우징하기 쉽도록 미리 구조적으로 자료를 정리하여 보여줄 수 있다. 예를 들어 디렉토리나 행렬 구조로 자료를 정리해서 상기 단말기의 화면상에 출력해줄 수 있다.
한편 검색 질의문에 비감성적 단어가 존재하지 않고 감성적 단어들만 존재하는 경우(예를 들어 '아름다움', '온화함') 상기의 콘텐트검색단계(S104)는 생략되며 감성적 단어에 해당하는 항목이 체크된 콘텐트들을 순위에 따라 보여줄 수 있다.
또 한편 미리 문서수집(crawling), 색인화, 순위화하는 상기의 검색용DB를 구축하여 이를 이용한 검색방법과는 달리, 온디맨드(on-demand)방식으로 검색 질의를 요청한 순간 즉각적으로 콘텐트와 관련 문헌 그리고 그 감상 코멘트를 순차 탐색하여 순위에 따른 결과를 보여줄 수도 있다.
한편, 상기의 목적을 달성하기 위하여, 본 발명의 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법을 수행하기 위한 시스템은(도9참조), 웹문서제공서버(901), 중앙서버(910), 정보검색자단말기(930), 감상분류표DB(903), 검색용DB(904)를 구비하는 것을 특징으로 한다.
상기의 시스템을 도9를 참조하여 보다 상세히 설명한다.
웹문서제공서버들(901)은 코멘트가 달린 각종 웹 문서들을 유무선 통신망(902)을 통해 중앙서버(910)에 제공한다.
한편 정보검색자단말기(930)은 감성적 단어가 포함된 질의어를 통해 정보를 검색하기 위해 사용하는 단말기로써 개인용 컴퓨터, 휴대폰, PDA(Personal Digital Assistants) 등을 말하며 유무선 통신망(902)을 통하여 중앙서버(910)에 연결되어 있다.
여기서 정보검색자란 상기의 정보검색자단말기(930)을 소유하거나 사용하는 자로서 감성적 단어가 포함된 질의어를 통해 관련정보를 검색하는 자를 말한다.
상기의 중앙서버(910)는 검색서비스제공자가 운영하는 서버이며, 본 발명에 있어서 감상분류표DB(903), 검색용DB(904)를 구비하고 콘텐트에 대한 코멘트를 기반 으로 한 집단 감성 정보 검색방법을 총괄 관리한다.
여기서 검색서비스제공자란 상기 중앙서버(910)를 운영하며 정보검색자가 감성적 단어가 포함된 질의어를 통해 관련정보를 검색하고자 하는 경우 적절한 순위결과를 산출하여 정보검색자단말기상에 그 결과를 보여주는 서비스를 제공하는 자를 말한다.
상기의 중앙서버(910)는 문서수집부(911), 코멘트추출부(912), 감성단어검색부(913), 감상종류검색부(914), 감상항목체크부(915), DB저장부(916), 데이터송수신부(917), 콘텐트검색부(918), 순위조정부(919), 결과표시제어부(920)를 포함한다.
상기의 문서수집부(911)는 종래의 웹 로봇(web robot) 등을 이용해 각종 웹문서제공서버(901)로부터 검색용DB 작성에 필요한 문서를 수집한다.
상기의 코멘트추출부(912)는 문서수집부(911)가 수집한 문서로부터 코멘트 부분을 분리 추출한다.
상기의 감성단어검색부(913)는 콘텐트에 달린 코멘트 또는 감성적 단어가 포함된 질의어로부터 감성적 단어를 검색하여 분리 추출한다.
상기의 감상종류검색부(914)는 분리 추출된 감상적 단어가 감상분류표DB(903)상의 감상분류표로부터 어느 감상 항목에 속하는지를 검색한다.
상기의 감상항목체크부(915)는 감성적 단어가 속하는 감상항목에 체크하거나 점수를 부여한다. 또한 콘텐트에 대한 감상 항목들 중 질의한 감상종류에 일치하는 항목이 체크되어 있거나 점수가 부여되어 있는지를 검색한다.
상기의 DB저장부(916)는 콘텐트 관련정보와 그 메타데이터인 감상 항목 테이블을 검색용DB에 저장한다.
상기의 데이터송수신부(917)는 정보검색자단말기(930)을 통해 질의어를 입력전송받는다.
상기의 콘텐트검색부(918)은 질의어에 포함된 비감성적 단어와 관련된 콘텐트를 검색용DB로부터 검색한다.
상기의 순위조정부(919)는 감상 항목이 체크되어 있으면 검색결과 순위를 조정한다. 즉 비감성적 단어로 찾아낸 콘텐트들 중에 질의한 감상 종류와 일치한 감상 항목이 체크되어 있으면 연관성이 높다고 보고 그 콘텐트의 결과 순위를 조정한다.
상기의 결과표시제어부(920)는 순위조정부(919)에 의해 조정된 순위에 따라 정보검색자단말기(930)에 검색결과를 표시하도록 한다.
한편 상기의 감상분류표DB(903)는 도9와 같이 중앙서버(910)에 구비되어 있으며, 검색서비스제공자가 미리 각각의 감상항목과 그에 해당하는 개개의 감성적 단어를 분류 및 정리해놓은 감상분류표(도3)가 저장된 DB이다.
또한 상기의 검색용DB(904)는 도9와 같이 중앙서버(910)에 구비되어 있으며, 콘텐트 관련정보와 그 메타데이터인 감상항목 테이블이 저장되어 있다.
상기와 같은 구성에 의하면, 본 발명은 소수의 인간관리자가 직접 감상을 다는 방식과 달리 집단 감성을 기반으로 하여 그 결과가 객관적이면서 공식화된 순위화 방법을 통해 구성하였으므로 체계적이고 신뢰할 수 있는 검색결과를 보여줄 수 있는 유리한 효과가 있다. 또한 관리자 인건비 등의 비용이 적게 드는 효과가 있다.
또한 본 발명에 의하면 콘텐트와 관련된 텍스트 정보에만 의지하는 종래의 방식과는 달리 실제 인간 집단의 감성을 반영하여 질의와 관계없는 콘텐트가 검색 결과의 상위에 보여지는 오류를 제거 혹은 감소할 수 있는 효과를 가진다.
이하, 첨부된 도면에 따라서 본 발명을 보다 상세히 설명한다. 여기서 각 도면에 붙여진 도면부호는 일관성을 유지하고 있으므로 다른 도면이라도 동일한 부호로 표기된 것은 동일한 구성 및 작용을 가지는 것으로 해석되어야 한다.
실시예1은 감성적 단어가 포함된 질의어를 통해 정보를 검색하는 일실시예로서 그 흐름도는 도1에 나와 있으며, 실시예2는 검색용DB를 구축하는 일실시예이고 그에 대한 흐름도는 도2에 나와 있다.
<실시예1>
이하에서는 본 발명에 있어서 감성적 단어가 포함된 질의어를 통해 정보를 검색하는 일실시예를 도1과 함께 구체적으로 설명한다.
먼저 본 발명을 통한 검색을 위해서는 검색용DB의 구축이 선행되어야 한다(도1의 S101). 이는 후술하는 실시예2에서 구체적으로 설명한다.
그 후 정보검색자가 '흥겨운 댄스곡'이라는 검색 질의를 하면(S102) 이 질의문을 입력 전송받은 중앙서버는 '흥겨운'의 감성적 단어와 '댄스곡'의 비감성적 단어를 분리 추출한다(S103).
그 후 상기 중앙서버는 '댄스곡'이라는 색인어와 관련된 문헌/콘텐트 정보의 리스트를 검색용DB로부터 검색한다(S104). 이 리스트는 웹페이지A를 가리키는 항 목(item), 웹페이지B를 가리키는 항목의 순서로 저장되어 있다(도6참조).
그리고 상기 중앙서버는 상기의 웹페이지 관련 레코드의 콘텐트URL 필드와 일치하는 키(key)필드(도8의801, 802)를 가진 감상항목 필드 레코드(811)를 검색한다. 여기서 감상항목 필드 레코드(811)는 감상항목 테이블이 기록되어 있는 검색용DB상의 영역을 말한다.
이와 함께 중앙서버는 '흥겨운'이라는 감성적 단어가 속한 감상항목을 감상분류표(도3)에서 찾는다(S105). '흥겨운'은 '신나는/우울한' 항목에서 양의 점수가 부여되는 단어에 속함을 알 수 있다.
그 후 상기 중앙서버는 댄스곡A 및 댄스곡B와 관련된 검색용DB의 감상항목 테이블로부터 각각 '신나는/우울한' 항목이 점수가 부여되어 있는지 검색한다(S106). 여기서 중앙서버는 도7의 '신나는/우울한' 항목으로부터 각각 댄스곡A와 댄스곡B의 점수인 0점과 (+3)점을 얻는다.
상기 중앙서버는 이 점수들을 가지고 각 웹페이지에 부여된 순위 점수를 차감하여 조정한다(S107).
즉 웹페이지A의 경우 1 - 0 = 1 이므로 최종 점수는 1점이고 웹페이지B의 경우 2 - (+3) = (-1)이므로 최종 점수는 (-1)점이 된다. 결국 단순한 '댄스곡'이라는 질의와는 달리 '흥겨운 댄스곡'이라는 질의는 집단 감성이 반영되어 웹페이지B가 웹페이지A보다 더 높은 결과 순위로 보여진다.
이와 동일한 원리로 정보검색자가 '따분한 댄스곡'이라고 질의한 경우 상기 중앙서버는 댄스곡A 및 댄스곡B의 '흥미로운/지루한' 항목의 점수인 (-2), 0점을 각 각 얻는다. 이를 순위 점수에 반영할 때는 그 감성적 단어가 음의 점수를 가진 것이므로 상기 중앙서버는 역부호화하고 차감한다.
즉 웹페이지A는 1 - (-(-2)) = -1, 웹페이지B는 2 - 0 = 2 가 되므로 상기 중앙서버는 정보검색자 단말기의 화면에 웹페이지A를 웹페이지B보다 더 높은 순위로 결정하여 표시한다(S108).
<실시예2>
이하에서는 본 발명에 있어서 검색용DB를 구축하는 일실시예를 도2와 함께 구체적으로 설명한다.
먼저 검색서비스제공자는 도3과 같이 여러 감성적 단어에 대한 분류 기준을 정한 감상분류표가 기록된 감상분류표DB를 미리 준비한다.
예를 들어 '흥미로운'과 '지루한'은 다른 감정과 구별되고 이 두 감정은 서로 반대되므로 '흥미로운/지루한'이라는 하나의 감상 항목이 있다고 정한다. 그리고 '따분한', '지겨운'이라는 단어는 '흥미로운/지루한'이라는 감상항목에 속한다고 정한다.
그래서 코멘트에 '따분한'이라는 단어가 있을 경우 '흥미로운/지루한' 감상항목에 음의 점수를 부여하기로 정한다. 그리고 '신나는', '흥겨운', '경쾌한', '신명 나는'이라는 단어는 '신나는/우울한'이라는 감상항목에 속하고 그 항목에 양의 점수를 부여하기로 정한다.
한편 어느 웹사이트의 관리자 혹은 일반 사용자가 해당 웹사이트에 댄스곡 콘텐트를 링크하고 있는 HTML 파일을 도4와 같이 올린다. 이 두 웹페이지의 소스는 각각 401, 402와 같다. 앵커 텍스트(anchor text)는 콘텐트를 설명하기 위해 '댄스곡A', '댄스곡B'라는 텍스트로 적혀 있고 각각 관련 콘텐트를 링크하고 있다. 이 웹페이지는 인간 사용자 눈에 403, 404와 같이 보인다.
이 웹사이트를 방문하여 웹페이지에 링크된 댄스곡을 감상한 사용자들은 저마다 자신의 감상과 평을 코멘트 란에 적는다(도5). 댄스곡A는 반응이 좋지 않아서 2명이 부정적인 평을 했고(501) 댄스곡B는 이와 반대로 반응이 좋아서 3명의 사용자가 모두 긍정적인 감상을 적었다(502).
이때 상기 중앙서버는 도5의 코멘트가 달린 이 웹사이트의 페이지들에 대해 문서 수집을 한다(도2의S201). 이 경우 수집된 문서를 색인화하고 순위화할 수 있다.
역색인(도6의601)을 만들 때 '댄스곡'이라는 색인어(602)와 그것이 속한 웹페이지의 URL, 관련 콘텐트 URL 등(603)을 검색용DB(904)에 저장한다. 그리고 관련 웹페이지, 콘텐트 URL과 함께 순위화된 순위 점수도 함께 저장한다.
여기서 순위점수는 본 발명에 의해 산출된 순위점수일 수 있고 본 발명과 무관한 별도의 알고리즘에 의한 순위점수일 수 있다.
이 예시에서는 감성적 단어를 고려하지 않고 '댄스곡'이라는 색인어에 대해 웹페이지A는 순위 점수 1점, 웹페이지B는 순위 점수 2점이 주어졌다(이 예시에서는 순위 점수가 낮을수록 우선순위가 높다). 만약 검색질의가 단순히 '댄스곡'이라면 웹페이지A, 웹페이지B의 순서로 결과가 나타날 것이다.
그리고 본 발명에 있어서 중앙서버는 '댄스곡A', '댄스곡B'에 대해 코멘트로 적은 감상을 분석하여 항목별로 분류하고 이를 검색용DB에 저장한다. 여기서 검색용DB의 레코드는 콘텐트 URL, 감상 항목(아름다운/추한, 기쁜/슬픈 등) 필드(field)를 포함하고 있다(도7의 701). 여기서 콘텐트 URL 필드가 이 레코드(record)의 키(key)이다. 보통은 문헌/콘텐트 식별자로 고유의 식별 번호를 사용하나 여기서는 URL을 식별자로 사용하였다.
이를 위해 상기 중앙서버는 상기의 수집된 문서에 달린 코멘트를 추출하고(S202) 추출된 코멘트에서 감성적 단어가 존재하는지 종래의 워드 스테밍(word stemming) 방식 등을 통하여 검색(S203)한다. 그 후 검색된 감성적 단어가 어떠한 감상항목에 속하는지 감상분류표DB상의 감상분류표를 참조하여 검색한다(S204). 그리고 나서 그 단어와 일치하는 감상항목 필드에 점수를 부여한다(S205).
보다 구체적으로 상기 중앙서버는 '댄스곡A'에 대한 코멘트에서 감성적 단어를 추출하여 '지루한', '따분한'이라는 두 단어를 얻는다. 이 단어는 '흥미로운/지루한' 감상항목에 속함을 도3의 감상분류표로부터 알 수 있다.
상기 중앙서버는 이 단어들로 인해 해당 감상항목에 음의 점수를 부여한다. 그리하여 관련 레코드의 '흥미로운/지루한' 감상항목 필드에 (-2)점이 부여된다(도7의702).
한편 상기 중앙서버는 '댄스곡B'에 대한 코멘트로부터 '신나는', '경쾌한', '흥겨운'이라는 단어를 얻는다. 이것들은 '신나는/우울한' 항목에 속함을 감상분류표를 통해 알 수 있다. 상기 중앙서버는 이 단어들로 인해 해당 감상항목에 양의 점 수를 부여한다. 즉 관련 레코드의 '신나는/우울한' 필드에 (+3)이 부여된다(도7의703).
이상과 같은 방법으로 상기 중앙서버는 콘텐트 관련정보와 감상항목 테이블이 기록된 검색용DB를 작성하게 된다(S206).
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 부가 및 변경이 가능하다는 것이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
도1은 감성적 단어가 포함된 질의어를 통해 정보를 검색하는 단계를 나타낸 흐름도이다.
도2는 검색용DB를 구축하는 단계를 나타낸 흐름도이다.
도3은 감상분류표DB상에 저장되어 있는 감상분류표이다.
도4는 어느 웹사이트의 관리자 혹은 일반 사용자가 해당 웹사이트에 올린 댄스곡 콘텐트를 링크하고 있는 HTML 파일의 예시이다.
도5는 어느 웹사이트를 방문하여 웹페이지에 링크된 콘텐트를 감상한 사용자들이 저마다 자신의 감상과 평을 코멘트 란에 적어놓은 예시이다.
도6은 수집한 문서들을 색인화시켜 만든 역색인의 예시이다.
도7은 검색용DB상에 레코드로 저장되어 있는 콘텐트에 대한 감상과 콘텐트 URL의 예시이다.
도8은 검색용DB상에 레코드로 저장되어 있는 콘텐트에 대한 감상과 콘텐트 URL 및 그에 상응하는 역색인의 문헌/콘텐트 관련 정보 리스트의 항목(item)을 나타낸 예시이다.
도9는 본 발명에 있어서 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법을 구현하기 위한 전체 시스템 구성도이다.

Claims (5)

  1. 감상항목 테이블이 기록된 검색용데이터베이스를 구축하는 데이터베이스구축단계(S101),
    정보검색자로부터 질의어를 입력 전송받는 질의어전송단계(S102),
    전송된 질의어로부터 비감성적 단어와 감성적 단어를 분리하여 추출하는 단어추출단계(S103),
    감성적 단어가 속하는 감상종류를 감상분류표로부터 검색하는 감상종류검색단계(S105),
    콘텐트에 대한 감상 항목들 중 질의한 감상종류에 일치하는 항목이 체크되어 있는지 여부 및 점수가 부여되어 있는지 여부 중 적어도 어느 하나를 판단하는 감상항목체크단계(S106),
    상기 감상항목체크단계(S106)에서 체크 및 점수 중 적어도 어느 하나가 존재한다고 판단하면 미리 정해진 방식에 따라 검색결과 순위를 조정하는 순위조정단계(S107) 및,
    상기 순위조정단계(S107)를 거쳐 조정된 순위에 따라 검색결과를 정보검색자단말기에 표시하는 결과표시단계(S108)를
    포함하는 것을 특징으로 하는 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법.
  2. 제 1항에 있어서,
    상기의 단어추출단계(S103)는,
    단어추출단계(S103)를 거쳐 추출된 비감성적 단어와 관련된 콘텐트들로 검색대상을 국한하여 검색용데이터베이스로부터 검색하는 콘텐트검색단계(S104)를 더 수행하는 것을 특징으로 하는 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법.
  3. 제1항에 있어서,
    상기 데이터베이스구축단계(S101)는,
    인터넷 상에서 코멘트가 달린 문서를 수집하는 문서수집단계(S201),
    수집된 문서로부터 코멘트를 추출하는 코멘트추출단계(S202),
    추출된 코멘트로부터 감성적 단어가 있는지 검색하는 감성단어검색단계(S203),
    감성적 단어를 검색하면 감상분류표를 참조하여 해당 콘텐트가 속하는 감상 종류를 검색하는 감상종류검색단계(S204),
    해당 감상 항목에 체크하는 방식 및 점수를 부여하는 방식 중 적어도 어느 하나를 수행하는 감상항목체크단계(S205) 및,
    해당 콘텐트 관련정보와 감상항목 테이블을 검색용데이터베이스에 저장하는 검색용데이터베이스저장단계(S206)를
    포함하는 것을 특징으로 하는 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법.
  4. 중앙서버에 구비되어 있고 감상항목과 그에 해당하는 감성적 단어가 분류된 감상분류표가 저장되어 있는 감상분류표데이터베이스 및,
    상기 중앙서버에 구비되어 있고 콘텐트 관련정보와 감상항목 테이블이 저장되는 검색용데이터베이스와,
    상기의 중앙서버에 유무선 통신망으로 연결되어 각종 웹문서를 제공하는 웹문서제공서버로부터 검색용데이터베이스 작성에 필요한 문서를 수집하는 문서수집부,
    상기의 수집한 문서로부터 코멘트 부분을 분리 추출하는 코멘트추출부,
    콘텐트에 대한 코멘트 및 감성적 단어가 포함된 질의어 중 적어도 어느 하나로부터 감성적 단어를 분리 추출하는 감성단어검색부,
    분리 추출된 감상적 단어가 감상분류표데이터베이스상의 감상분류표로부터 어느 감상 항목에 속하는지를 검색하는 감상종류검색부,
    감성적 단어가 속하는 감상항목에 체크 및 점수부여 중 적어도 어느 하나를 수행하고 콘텐트에 대한 감상 항목들 중 질의한 감상종류에 일치하는 항목에 체크 여부 및 점수가 부여되어 있는지 중 적어도 어느 하나를 검색하는 감상항목체크부 및
    콘텐트 관련정보와 감상 항목 테이블을 검색용데이터베이스에 저장하는 데이터베이스저장부
    를 포함하는 상기의 중앙서버로 이루어진 것을 특징으로 하는 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색 시스템.
  5. 제 4항에 있어서,
    상기 중앙서버에 유무선 통신망으로 연결된 정보검색자단말기로부터 질의어를 입력전송받는 데이터송수신부,
    상기 질의어에 포함된 비감성적 단어와 관련된 콘텐트를 검색용데이터베이스로부터 검색하는 콘텐트검색부,
    상기 콘텐트에 해당하는 감상 항목이 체크 및 점수 부여 중 적어도 어느 하나가 되어 있으면 검색결과 순위를 조정하는 순위조정부 및,
    상기 순위조정부에 의해 조정된 순위에 따라 상기 정보검색자단말기에 검색결과를 표시하도록 하는 결과표시제어부
    가 더 부가되는 상기의 중앙서버로 이루어진 것을 특징으로 하는 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색 시스템.
KR1020070136565A 2007-12-24 2007-12-24 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템 KR100917784B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020070136565A KR100917784B1 (ko) 2007-12-24 2007-12-24 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템
US12/679,011 US20100262597A1 (en) 2007-12-24 2008-12-05 Method and system for searching information of collective emotion based on comments about contents on internet
PCT/KR2008/007228 WO2009082100A2 (en) 2007-12-24 2008-12-05 Method and system for searching information of collective emotion based on comments about contents on internet

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070136565A KR100917784B1 (ko) 2007-12-24 2007-12-24 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20090068803A true KR20090068803A (ko) 2009-06-29
KR100917784B1 KR100917784B1 (ko) 2009-09-21

Family

ID=40801655

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070136565A KR100917784B1 (ko) 2007-12-24 2007-12-24 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템

Country Status (3)

Country Link
US (1) US20100262597A1 (ko)
KR (1) KR100917784B1 (ko)
WO (1) WO2009082100A2 (ko)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009044623A1 (de) 2009-07-28 2011-02-03 Hyundai Motor Co. Kupplungsbetätigungsvorrichtung für Doppelkupplungsgetriebe
WO2011119410A2 (en) * 2010-03-24 2011-09-29 Taykey, Ltd. A system and methods thereof for mining web based user generated content for creation of term taxonomies
WO2013049774A2 (en) * 2011-09-30 2013-04-04 Metavana, Inc. Sentiment analysis from social media content
WO2013059290A1 (en) * 2011-10-17 2013-04-25 Metavana, Inc. Sentiment and influence analysis of twitter tweets
KR101305535B1 (ko) * 2011-08-26 2013-09-06 허순영 동영상 추천 시스템
US8782046B2 (en) 2010-03-24 2014-07-15 Taykey Ltd. System and methods for predicting future trends of term taxonomies usage
KR101465756B1 (ko) * 2013-12-03 2014-12-03 주식회사 그리핀 감정 분석 장치 및 방법과 이를 이용한 영화 추천 방법
US8965835B2 (en) 2010-03-24 2015-02-24 Taykey Ltd. Method for analyzing sentiment trends based on term taxonomies of user generated content
US9183292B2 (en) 2010-03-24 2015-11-10 Taykey Ltd. System and methods thereof for real-time detection of an hidden connection between phrases
WO2016072772A1 (ko) * 2014-11-06 2016-05-12 아주대학교산학협력단 레퍼런스 의미 지도를 이용한 데이터 시각화 방법 및 시스템
US9613139B2 (en) 2010-03-24 2017-04-04 Taykey Ltd. System and methods thereof for real-time monitoring of a sentiment trend with respect of a desired phrase
US9946775B2 (en) 2010-03-24 2018-04-17 Taykey Ltd. System and methods thereof for detection of user demographic information
US10600073B2 (en) 2010-03-24 2020-03-24 Innovid Inc. System and method for tracking the performance of advertisements and predicting future behavior of the advertisement

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9690790B2 (en) 2007-03-05 2017-06-27 Dell Software Inc. Method and apparatus for efficiently merging, storing and retrieving incremental data
US20100107075A1 (en) * 2008-10-17 2010-04-29 Louis Hawthorne System and method for content customization based on emotional state of the user
US20100100827A1 (en) * 2008-10-17 2010-04-22 Louis Hawthorne System and method for managing wisdom solicited from user community
US20110113041A1 (en) * 2008-10-17 2011-05-12 Louis Hawthorne System and method for content identification and customization based on weighted recommendation scores
US20100100826A1 (en) * 2008-10-17 2010-04-22 Louis Hawthorne System and method for content customization based on user profile
US20110016102A1 (en) * 2009-07-20 2011-01-20 Louis Hawthorne System and method for identifying and providing user-specific psychoactive content
US11036810B2 (en) * 2009-12-01 2021-06-15 Apple Inc. System and method for determining quality of cited objects in search results based on the influence of citing subjects
US11113299B2 (en) 2009-12-01 2021-09-07 Apple Inc. System and method for metadata transfer among search entities
US20110154197A1 (en) * 2009-12-18 2011-06-23 Louis Hawthorne System and method for algorithmic movie generation based on audio/video synchronization
US8888497B2 (en) * 2010-03-12 2014-11-18 Yahoo! Inc. Emotional web
WO2011156605A2 (en) 2010-06-11 2011-12-15 Doat Media Ltd. A system and methods thereof for enhancing a user's search experience
US10713312B2 (en) 2010-06-11 2020-07-14 Doat Media Ltd. System and method for context-launching of applications
US9069443B2 (en) 2010-06-11 2015-06-30 Doat Media Ltd. Method for dynamically displaying a personalized home screen on a user device
US9338215B2 (en) 2011-03-14 2016-05-10 Slangwho, Inc. Search engine
US9858342B2 (en) 2011-03-28 2018-01-02 Doat Media Ltd. Method and system for searching for applications respective of a connectivity mode of a user device
US9152697B2 (en) 2011-07-13 2015-10-06 International Business Machines Corporation Real-time search of vertically partitioned, inverted indexes
KR101695014B1 (ko) 2011-08-24 2017-01-10 한국전자통신연구원 감성 어휘 정보 구축 방법 및 장치
US11587172B1 (en) 2011-11-14 2023-02-21 Economic Alchemy Inc. Methods and systems to quantify and index sentiment risk in financial markets and risk management contracts thereon
KR101672349B1 (ko) * 2011-12-27 2016-11-07 한국전자통신연구원 파일 클라우드 서비스 장치 및 방법
US9401097B2 (en) * 2012-06-29 2016-07-26 Jong-Phil Kim Method and apparatus for providing emotion expression service using emotion expression identifier
KR101700820B1 (ko) 2012-07-11 2017-02-01 한국전자통신연구원 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
CN103714063B (zh) * 2012-09-28 2017-08-04 国际商业机器公司 数据分析方法及其系统
CN104239331B (zh) * 2013-06-19 2018-10-09 阿里巴巴集团控股有限公司 一种用于实现评论搜索引擎排序的方法和装置
US10007954B2 (en) * 2013-08-23 2018-06-26 International Business Machines Corporation Managing an initial post on a website
MY184612A (en) 2013-09-27 2021-04-08 Mimos Berhad A system and method for ranking recommendations
CN103559174B (zh) * 2013-09-30 2016-03-09 东软集团股份有限公司 语义情感分类特征值提取方法及系统
KR101602898B1 (ko) 2014-11-07 2016-03-11 아주대학교산학협력단 객체의 코멘트 데이터를 이용한 데이터 시각화 방법 및 시스템
JP5905652B1 (ja) * 2015-01-30 2016-04-20 株式会社Ubic データ評価システム、データ評価方法、およびデータ評価プログラム
US10901945B2 (en) * 2016-01-05 2021-01-26 The grät Network, PBC Systems and methods concerning tracking models for digital interactions
KR101946022B1 (ko) 2016-09-30 2019-02-08 에스케이플래닛 주식회사 댓글을 분석하고 표시할 수 있는 방법 및 이를 위한 장치
US10567844B2 (en) 2017-02-24 2020-02-18 Facebook, Inc. Camera with reaction integration
US10545996B2 (en) * 2017-04-19 2020-01-28 Microsoft Technology Licensing, Llc Impression tagging system for locations
US10225621B1 (en) 2017-12-20 2019-03-05 Dish Network L.L.C. Eyes free entertainment
CN109033433B (zh) * 2018-08-13 2020-09-29 中国地质大学(武汉) 一种基于卷积神经网络的评论数据情感分类方法及系统
US11436292B2 (en) 2018-08-23 2022-09-06 Newsplug, Inc. Geographic location based feed
CN109299226A (zh) * 2018-10-25 2019-02-01 北京奇艺世纪科技有限公司 一种数据处理方法及系统
CN110399481B (zh) * 2019-06-06 2022-04-12 深思考人工智能机器人科技(北京)有限公司 情感实体词的筛选方法和装置
CN111538841B (zh) * 2020-07-09 2020-10-16 华东交通大学 基于知识互蒸馏的评论情感分析方法、装置及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100254803B1 (ko) * 1997-09-19 2000-05-01 윤덕용 컴퓨터 시스템 상에서 한국어 전문 정보 검색을위한 시스템
US6473729B1 (en) * 1999-12-20 2002-10-29 Xerox Corporation Word phrase translation using a phrase index
KR20060093144A (ko) * 2005-02-21 2006-08-24 주식회사 지엑스 인간의 감성요소를 이용한 콘텐츠 뱅크 시스템
KR100697339B1 (ko) * 2005-07-14 2007-03-20 (주)케이테크 감성 기반의 영상 검색 시스템 및 이를 이용한 디자인시뮬레이션 시스템
US8442972B2 (en) * 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
US7930302B2 (en) * 2006-11-22 2011-04-19 Intuit Inc. Method and system for analyzing user-generated content

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009044623A1 (de) 2009-07-28 2011-02-03 Hyundai Motor Co. Kupplungsbetätigungsvorrichtung für Doppelkupplungsgetriebe
US9454615B2 (en) 2010-03-24 2016-09-27 Taykey Ltd. System and methods for predicting user behaviors based on phrase connections
WO2011119410A2 (en) * 2010-03-24 2011-09-29 Taykey, Ltd. A system and methods thereof for mining web based user generated content for creation of term taxonomies
US10268670B2 (en) 2010-03-24 2019-04-23 Innovid Inc. System and method detecting hidden connections among phrases
US8930377B2 (en) 2010-03-24 2015-01-06 Taykey Ltd. System and methods thereof for mining web based user generated content for creation of term taxonomies
US9767166B2 (en) 2010-03-24 2017-09-19 Taykey Ltd. System and method for predicting user behaviors based on phrase connections
WO2011119410A3 (en) * 2010-03-24 2011-11-17 Taykey, Ltd. A system and methods thereof for mining web based user generated content for creation of term taxonomies
US8782046B2 (en) 2010-03-24 2014-07-15 Taykey Ltd. System and methods for predicting future trends of term taxonomies usage
US8965835B2 (en) 2010-03-24 2015-02-24 Taykey Ltd. Method for analyzing sentiment trends based on term taxonomies of user generated content
US10600073B2 (en) 2010-03-24 2020-03-24 Innovid Inc. System and method for tracking the performance of advertisements and predicting future behavior of the advertisement
US9946775B2 (en) 2010-03-24 2018-04-17 Taykey Ltd. System and methods thereof for detection of user demographic information
US9613139B2 (en) 2010-03-24 2017-04-04 Taykey Ltd. System and methods thereof for real-time monitoring of a sentiment trend with respect of a desired phrase
US9165054B2 (en) 2010-03-24 2015-10-20 Taykey Ltd. System and methods for predicting future trends of term taxonomies usage
US9183292B2 (en) 2010-03-24 2015-11-10 Taykey Ltd. System and methods thereof for real-time detection of an hidden connection between phrases
KR101305535B1 (ko) * 2011-08-26 2013-09-06 허순영 동영상 추천 시스템
US8849826B2 (en) 2011-09-30 2014-09-30 Metavana, Inc. Sentiment analysis from social media content
WO2013049774A3 (en) * 2011-09-30 2013-05-23 Metavana, Inc. Sentiment analysis from social media content
WO2013049774A2 (en) * 2011-09-30 2013-04-04 Metavana, Inc. Sentiment analysis from social media content
WO2013059290A1 (en) * 2011-10-17 2013-04-25 Metavana, Inc. Sentiment and influence analysis of twitter tweets
KR101465756B1 (ko) * 2013-12-03 2014-12-03 주식회사 그리핀 감정 분석 장치 및 방법과 이를 이용한 영화 추천 방법
WO2016072772A1 (ko) * 2014-11-06 2016-05-12 아주대학교산학협력단 레퍼런스 의미 지도를 이용한 데이터 시각화 방법 및 시스템

Also Published As

Publication number Publication date
KR100917784B1 (ko) 2009-09-21
WO2009082100A9 (en) 2010-03-25
WO2009082100A2 (en) 2009-07-02
WO2009082100A4 (en) 2009-10-29
US20100262597A1 (en) 2010-10-14
WO2009082100A3 (en) 2009-08-13

Similar Documents

Publication Publication Date Title
KR100917784B1 (ko) 콘텐트에 대한 코멘트를 기반으로 한 집단 감성 정보 검색방법 및 시스템
US8135669B2 (en) Information access with usage-driven metadata feedback
JP5395014B2 (ja) 信頼性ネットワークからのユーザ注釈を一体化したサーチシステム及び方法
US8312022B2 (en) Search engine optimization
US8200649B2 (en) Image search engine using context screening parameters
JP5238418B2 (ja) 情報推薦装置および情報推薦方法
US20090228482A1 (en) Network search method, system and device
US8161056B2 (en) Database constructing apparatus and method
KR20080003309A (ko) 사용자에 의해 입력된 정보를 통합하여 검색하는 방법과시스템
CN112486917A (zh) 从多个微博自动生成信息丰富的内容的方法以及系统
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
KR101984937B1 (ko) 전통문화 3d 디지털 연표 표출 시스템
Hlava The taxobook: Principles and practices of building taxonomies, part 2 of a 3-part series
CN101164067A (zh) 通过合并用户输入信息来进行搜索的方法和系统
KR100902674B1 (ko) 문서 탐색 서비스 제공 방법 및 시스템
KR101122737B1 (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
JP2003316824A (ja) 文書ファイル検索システム、文書ファイル検索プログラムおよび文書ファイル検索方法
Golub et al. Searching for Swedish LGBTQI fiction: challenges and solutions
KR101758219B1 (ko) 수치정보 검색이 가능한 수치정보 관리장치
JP4607798B2 (ja) コミュニティ形成支援装置、コミュニティ形成支援方法およびコミュニティ形成支援プログラム
KR100902673B1 (ko) 제목 클러스터링에 기초한 문서 탐색 서비스 제공 방법 및시스템
Chung et al. Proposal of Classified Music Recommendation Model Based on Social Media
KR100951192B1 (ko) 주관적 검색 결과를 제공하는 검색 결과 제공 방법 및 시스템
JP2023165384A (ja) 検索インテント単位のブロックを生成する方法、コンピュータ装置、およびコンピュータプログラム
CN116956818A (zh) 文本素材的处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee