KR20150040658A - 주제 기반 기사 그룹화 시스템 - Google Patents

주제 기반 기사 그룹화 시스템 Download PDF

Info

Publication number
KR20150040658A
KR20150040658A KR20130119444A KR20130119444A KR20150040658A KR 20150040658 A KR20150040658 A KR 20150040658A KR 20130119444 A KR20130119444 A KR 20130119444A KR 20130119444 A KR20130119444 A KR 20130119444A KR 20150040658 A KR20150040658 A KR 20150040658A
Authority
KR
South Korea
Prior art keywords
group
article
unit
articles
similarity
Prior art date
Application number
KR20130119444A
Other languages
English (en)
Other versions
KR101544141B1 (ko
Inventor
이경일
최광선
이장훈
Original Assignee
주식회사 솔트룩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 솔트룩스 filed Critical 주식회사 솔트룩스
Priority to KR1020130119444A priority Critical patent/KR101544141B1/ko
Publication of KR20150040658A publication Critical patent/KR20150040658A/ko
Application granted granted Critical
Publication of KR101544141B1 publication Critical patent/KR101544141B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

기사 그룹화 시스템이 개시된다. 본 발명의 예시적 실시예에 따른 기사 그룹화 시스템은 데이터 베이스에 저장된 복수개의 기사들의 기사 주제들을 추출하는 주제 추출부, 상기 기사 주제들에 기초하여 상기 복수개의 기사들을 그룹화하여 제1 그룹을 생성하는 그룹 생성부 및 상기 제1 그룹을 사용자에게 제공하는 그룹 제공부를 포함할 수 있다.

Description

주제 기반 기사 그룹화 시스템{System for grouping articles based on subject thereof}
본 발명의 기술적 사상은 기사 그룹화 시스템에 관한 것으로서, 자세하게는 기사로부터 도출된 주제를 이용하여 복수개의 기사들을 그룹화하여 사용자에게 제공하는 주제 기반 기사 그룹화 시스템에 관한 것이다.
본 발명은 지식경제부 산업원천기술개발사업의 일환으로 숭실대학교 산학협력단에서 주관하고 (주)솔트룩스에서 공동연구하여 수행된 연구로부터 도출된 것이다. [연구기간: 2013.03.01~2014.02.28, 연구과제명: 모바일 플랫폼 기반 계획 및 학습 인지 모델 프레임워크 기술 개발, 과제번호: 10035348]
인터넷의 발달로 인하여, 예컨대 온라인 커뮤니티, 영화, 음악, 사진, 문서 등을 포함하는 다양한 컨텐츠들이 인터넷을 통해서 제공되고 있다. 컨텐츠의 일종으로서 종래 텔레비전, 라디오, 잡지 또는 신문등을 통해서 제공되던 기사 또한 인터넷을 통해서 제공되고 있으며, 인터넷의 접근성 및 신속성으로 인하여 많은 인터넷 사용자들은 인터넷을 통해서 제공되는 기사를 열람하고 있다.
한편, 기존 언론 매체들이 인터넷을 통해서 기사를 공급할 뿐만 아니라 인터넷을 기반으로 하는 언론 매체들이 등장하고 있으며, 인터넷을 통해서 기사를 제공하는 언론 매체의 수는 증가하는 추세에 있다. 인터넷을 통해 기사를 제공하는 언론 매체의 수가 증가함에 따라 짧은 시간에 생성된 방대한 양의 기사들이 인터넷 사용자에게 제공되고 있다. 이에 따라, 많은 수의 기사들 중 인터넷 사용자가 원하는 기사를 쉽게 열람할 수는 수단이 필요하다.
본 발명의 기술적 사상은 기사 그룹화 시스템에 관한 것으로서, 인터넷을 통해서 제공되는 기사들의 주제를 추출하고, 추출된 주제에 따라 기사들을 그룹화하여 사용자에게 제공하는 주제 기반 기사 그룹화 시스템에 관한 것이다.
상기와 같은 목적을 달성하기 위하여, 본 발명의 예시적 실시예에 따른 기사 그룹화 시스템은 데이터 베이스에 저장된 복수개의 기사들의 기사 주제들을 추출하는 주제 추출부, 상기 기사 주제들에 기초하여 상기 복수개의 기사들을 그룹화하여 제1 그룹을 생성하는 그룹 생성부 및 상기 제1 그룹을 네트워크를 통하여 사용자에게 제공하는 그룹 제공부를 포함할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 기사 주제들 각각은 적어도 하나의 단어를 포함할 수 있고, 상기 주제 추출부는 상기 복수개의 기사들 각각으로부터 적어도 하나의 주요 단어를 추출하는 단어 추출부 및 상기 주요 단어에 기초하여 상기 복수개의 기사들 각각의 기사 주제를 생성하는 주제 생성부를 포함할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 단어 추출부는 상기 복수개의 기사들 각각에 포함된 단어의 빈도에 기초하여 상기 주요 단어를 추출할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 그룹 생성부는 기사 상기 주제들 사이의 제1 유사도를 연산하는 제1 유사도 연산부, 상기 제1 유사도에 기초하여 중복된 기사를 제거하고 상기 제1 그룹을 생성하는 중복 기사 처리부 및 상기 제1 유사도에 기초하여 상기 제1 그룹의 그룹 주제를 생성하는 그룹 주제 생성부를 포함할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 중복 기사 처리부는 상기 제1 그룹의 그룹 주제와 상기 데이터 베이스에 저장된 제1 기사의 기사 주제 사이의 유사도에 기초하여 상기 제1 기사를 상기 제1 그룹에 선택적으로 포함시킬 수 있다.
본 발명의 예시적 실시예에 따라, 상기 중복 기사 처리부는 상기 제1 유사도 및 상기 제1 그룹에 포함되는 기사들의 개수에 기초하여 상기 제1 그룹을 2개 이상의 그룹들로 분할할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 기사 그룹화 시스템은 상기 제1 그룹에 포함되는 기사들의 기사 주제들 및 상기 제1 그룹의 그룹 주제에 기초하여 상기 제1 그룹에 포함된 적어도 하나의 대표 기사를 식별하는 대표 기사 식별부를 더 포함할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 대표 기사 식별부는 상기 제1 그룹에 포함되는 기사들의 기사 주제들 및 상기 제1 그룹의 그룹 주제 사이의 제2 유사도를 연산하는 제2 유사도 연산부 및 상기 제2 유사도에 기초하여 상기 제1 그룹에 포함되는 기사들의 순위를 결정하는 기사 랭킹부를 포함할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 그룹 제공부는 상기 제1 그룹을 포함하는 복수개의 그룹들을 상기 사용자에게 제공하는 주제별 그룹 제공부 및 상기 제1 그룹에 포함된 대표 기사를 상기 사용자에게 제공하는 대표 기사 제공부를 포함할 수 있다.
본 발명의 예시적 실시예에 따라, 상기 대표 기사 제공부는 상기 제1 그룹에 포함된 기사들에 대한 상기 사용자의 조회수들을 측정하는 기사 조회수 측정부를 더 포함할 수 있고, 상기 기사 랭킹부는 상기 조회수들에 더 기초하여 상기 순위를 결정할 수 있다.
상기 기사 그룹화 시스템에 따르면, 사용자는 방대한 양의 기사들로부터 자신이 원하는 기사를 용이하게 열람할 수 있다. 또한, 사용자는 주요 사건들을 한눈에 확인할 수 있고, 동일한 주제와 관련된 복수개의 기사들을 용이하게 열람할 수 있다.
도 1은 본 발명의 예시적 실시예에 따른 기사 그룹화 시스템의 일 예를 나타내는 도면이다.
도 2는 본 발명의 예시적 실시예에 따른 기사 그룹화 시스템의 구성을 나타내는 도면이다.
도 3은 본 발명의 예시적 실시예에 따라 도 1의 주제 추출부의 구현예를 나타내는 도면이다.
도 4는 본 발명의 예시적 실시예에 따른 도 3의 단어 추출부의 동작을 나타내는 도면이다.
도 5는 본 발명의 예시적 실시예에 따라 도 1의 그룹 생성부의 구현예를 나타내는 도면이다.
도 6a 및 6b는 본 발명의 예시적 실시예들에 따라 도 1의 그룹 생성부가 기사들을 그룹화하는 동작들을 나타내는 도면이다.
도 7은 본 발명의 예시적 실시예에 따라 도 1의 대표 기사 식별부의 구현예를 나타내는 도면이다.
도 8은 본 발명의 예시적 실시예에 따라 도 1의 그룹 제공부의 구현예를 나타내는 도면이다.
도 9는 본 발명의 예시적 실시예에 따라 도 1의 그룹 제공부가 사용자에게 제공하는 그룹들을 나타내는 도면이다.
도 10은 본 발명의 예시적 실시예에 따라 도 1의 그룹 제공부가 사용자에게 제공하는 기사들을 나타내는 도면이다.
이하에서는 본 발명의 바람직한 실시예가, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 본 발명의 철저한 이해를 제공할 의도 외에는 다른 의도 없이, 첨부한 도면들을 참조로 하여 상세히 설명될 것이다.
도 1은 본 발명의 예시적 실시예에 따른 기사 그룹화 시스템의 일 예를 나타내는 도면이다. 도 1에 도시된 바와 같이, 기사 그룹화 시스템(10), 복수개의 데이터 베이스들(22, 24) 및 사용자(30)는 네트워크(40)를 통해서 서로 데이터를 주고 받을 수 있다. 사용자(30)는 네트워크(40)를 통해서 기사 그룹화 시스템(10)에 접속할 수 있다. 예컨대, 사용자(30)는 기사 그룹화 시스템(10)이 제공하는 기사들의 그룹을 제공받을 수 있다. 기사 그룹화 시스템(10)은 네트워크(40)를 통해서 데이터 베이스들(22, 24)에 접속할 수 있다.
데이터 베이스들(22, 24)은 복수개의 기사들을 저장할 수 있다. 예컨대, 제1 데이터 베이스(22)는 제1 언론 매체가 작성한 복수개의 기사들을 저장할 수 있고, 제2 데이터 베이스(24)는 제1 언론 매체와 다른 제2 언론 매체가 작성한 복수개의 기사들을 저장할 수 있다. 제1 및 제2 언론 매체가 새롭게 작성한 기사들은 제1 및 제2 데이터 베이스(22, 24) 각각에 업데이트될 수 있다. 한편, 사용자(30)는 네트워크(40)를 통해서 기사를 열람할 수 있고, 네트워크(40)에 접속할 수 있는 단말기, 예컨대 퍼스널 컴퓨터, 휴대용 통신 기기 등을 이용할 수 있다.
도 1에 도시된 바와 같이, 기사 그룹화 시스템(10)은 주제 추출부(100), 그룹 생성부(200), 그룹 제공부(300) 및 대표 기사 식별부(400)를 포함할 수 있다. 본 발명의 예시적 실시예에 따라, 주제 추출부(100)는 네트워크(40)를 통해서 데이터 베이스들(22, 24)에 저장된 기사들을 엑세스할 수 있고, 기사들의 기사 주제를 추출할 수 있다. 그룹 생성부(200)는 주제 추출부(100)가 추출한 기사 주제에 기초하여 기사들을 그룹화하여 제1 그룹을 생성할 수 있다. 그룹 제공부(300)는 그룹 생성부가 생성시킨 제1 그룹 및 제1 그룹에 포함되는 기사를 네트워크(40)를 통해서 사용자(30)에게 제공할 수 있다. 대표 기사 식별부(400)는 그룹 생성부(200)가 생성시킨 제1 그룹에 포함된 기사들 가운데 적어도 하나의 대표 기사를 식별할 수 있고, 식별된 대표 기사 또는 대표 기사에 대한 정보를 그룹 제공부(300)에 전달할 수 있다. 그룹 제공부(300)는 제1 그룹과 함께 제1 그룹의 대표 기사를 네트워크(40)를 통해서 사용자(30)에게 제공할 수 있다.
도 2는 본 발명의 예시적 실시예에 따른 기사 그룹화 시스템의 구성을 나타내는 도면이다. 도 2에 도시된 바와 같이, 기사 그룹화 시스템(10)은 주제 추출부(100), 그룹 생성부(200), 그룹 제공부(300) 및 대표 기사 식별부(400)가 접근할 수 있는 내부 데이터 베이스(500)를 포함할 수 있다. 도 1을 함께 참조하면, 내부 데이터 베이스(500)는 언론 매체들이 기사를 저장하는 데이터 베이스들(22, 24)에 저장된 기사들 중 일부, 주제 추출부(100)가 추출한 기사들의 주제, 그룹 생성부(200)가 저장한 복수개의 그룹들 또는 그룹들에 대한 정보를 저장할 수 있다. 예컨대, 그룹 생성부(200)는 이미 생성된 제1 그룹을 내부 데이터 베이스(500)에 저장할 수 있고, 내부 데이터 베이스(500)에 저장된 제1 그룹에 기초하여 외부의 데이터 베이스들(22, 24)에 저장된 기사들이 제1 그룹에 포함되는지 여부를 판단할 수 있다.
도 3은 본 발명의 예시적 실시예에 따라 도 1의 주제 추출부(100)의 구현예를 나타내는 도면이다. 도 3에 도시된 바와 같이, 주제 추출부(100)는 단어 추출부(120) 및 주제 생성부(140)를 포함할 수 있다. 도 1을 함께 참조하면, 데이터 베이스들(22, 24)에 저장된 기사로부터 추출되는 기사 주제는 적어도 하나의 단어를 포함할 수 있다. 단어 추출부(120)는 기사에 포함된 단어들 가운데 적어도 하나의 주요 단어를 추출할 수 있다. 예컨대, 단어 추출부(120)는 기사에 포함된 단어의 빈도에 기초하여 주요 단어를 추출하거나, 제목에 포함된 단어를 주요 단어로서 추출할 수 있다. 이를 위하여, 단어 추출부(120)는 문장의 구조를 분석하여 개별적인 단위로 분류할 수 있는 파서(parser)를 포함할 수 있다. 단어 추출부(120)는 파서가 분류한 단위들에 기초하여 단어의 빈도를 카운트할 수 있다. 이때, 문장에 포함된 부수적인 요소들, 예컨대 조사 및 관용어 등은 배제될 수 있다.
주제 생성부(140)는 단어 추출부(120)가 추출한 주요 단어에 기초하여 기사의 기사 주제를 생성할 수 있다. 본 발명의 예시적 실시예에 따라, 주제 생성부(140)는 단어 추출부(120)가 추출한 주요 단어들을 분석하여 미리 정해진 개수의 단어들을 미리 정해진 순서로서 배열하여 기사 주제를 생성할 수 있다. 예컨대, 주제 생성부(140)는 단어 추출부(120)로부터 인물의 실명이 주요 단어로서 추출된 경우, 상기 실명이 기사 주제의 가장 앞에 위치하도록 주요 단어들을 배열할 수 있다. 또한, 주제 생성부(140)는 기사가 포함하는 단어의 빈도에 기초하여 단어 벡터들을 생성할 수 있다. 단어 벡터에 대한 자세한 내용은 후술한다.
한편, 본 발명의 예시적 실시예에 따라 주제 생성부(140)는 데이터 베이스들(22, 24)에 저장된 기사의 분야에 따라 기사 주제를 분류할 수 있다. 언론 매체들은 데이터 베이스들(22, 24)에 기사들을 저장할 때 기사의 분야, 예컨대 정치, 경제, 사회, 스포츠 또는 연예등을 분류하여 저장할 수 있다. 이에 따라, 주제 생성부(140)는 데이터 베이스들(22, 24)에 저장된 기사의 분야를 나타내는 단어를 기사 주제에 포함시킬 수 있다. 기사 주제에 포함된 기사의 분야를 나타내는 단어는 서로 다른 분야의 기사들이 동일한 그룹으로 그룹화되는 것을 방지할 수 있다.
도 4는 본 발명의 예시적 실시예에 따른 도 3의 단어 추출부(120)의 동작을 나타내는 도면이다. 도 4에 도시된 2개의 표들은 각각 2개 기사를 분석한 데이터를 나타낸다. 도 3에서 설명한 바와 같이, 단어 추출부(120)는 기사에 포함된 단어의 빈도에 기초하여 주요 단어를 추출할 수 있다. 또한, 제목에 포함된 단어를 주요 단어로서 추출할 수 있다. 도 4에 도시된 표에서 좌측 열은 단어를 나타내고, 가운데 열은 기사에 포함된 단어의 수를 나타내며, 우측 열은 기사의 제목에 단어가 포함되었는지 여부를 나타낸다. 도 4는 각각의 기사에서 5개의 단어에 대한 빈도 및 제목에 포함 여부만을 도시하였으나, 본 발명의 예시적 실시예는 이에 제한되지 않는다.
도 4에 도시된 바와 같이, 제1 기사(A1)에서 “홍길동”은 5회, “PGA”및 “우승”은 각각 3회, “캘리포니아” 및 “골프”는 각각 1회 등장한다. 또한, “홍길동”, “PGA” 및 “우승”은 제1 기사(A1)의 제목에 포함되어 있다. 한편, 제2 기사(A2)에서 “홍길동”은 6회, “PGA”는 4회, “4회”는 2회, “캘리포니아”는 1회 등장하며, “홍길동”, “우승”, “PGA” 및 “4회”는 제2 기사(A2)의 제목에 포함되어 있다.
본 발명의 예시적 실시예에 따라, 단어 추출부(120)는 제1 기사(A1) 및 제2 기사(A2)로부터 도 4에 도시된 표들과 같은 데이터를 생성할 수 있고, 생성된 데이터에 기초하여 제1 기사(A1) 및 제2 기사(A2)의 주요 단어를 각각 추출할 수 있다. 예컨대, 단어 추출부(120)는 기사의 제목에 포함된 단어를 주요 단어로 추출하고, 빈도 상위 3개 또는 그 이상의 의 단어를 주요 단어로 추출할 수 있다. 즉, 도 4에 도시된 예시에서, 단어 추출부(120)는 제1 기사(A1)의 주요 단어로서 “홍길동”, “PGA” 및 “우승”은 주요 단어로서 추출할 수 있다. 또한, 단어 추출부(120)는 제2 기사(A2)의 주요 단어로서 “홍길동”, “우승”, “PGA” 및 “4회”를 주요 단어로서 추출할 수 있다.
도 5는 본 발명의 예시적 실시예에 따라 도 1의 그룹 생성부(200)의 구현예를 나타내는 도면이다. 도 5에 도시된 바와 같이, 그룹 생성부(200)는 제1 유사도 연산부(220), 중복 기사 처리부(240) 및 그룹 주제 생성부(260)를 포함할 수 있다. 도 3을 함께 참조하면, 제1 유사도 연산부(220)는 주제 추출부(100)의 주제 생성부(140)가 생성한 복수개의 기사들에 대한 기사 주제들에 기초하여, 기사들 간의 제1 유사도를 연산할 수 있다. 제1 유사도 연산부(220)가 기사들 간의 제1 유사도를 연산하는 것에 대한 자세한 내용은 후술한다.
중복 기사 처리부(240)는 제1 유사도 연산부(220)가 연산한 제1 유사도에 기초하여 중복된 기사들을 처리하여 제1 그룹을 생성할 수 있다. 중복 기사 처리부(240)는 제1 유사도에 기초하여 유사한 주제를 구비하는 기사들을 그룹화할 수 있다. 또한, 중복 기사 처리부(240)는 그룹화된 기사들 가운데 중복되는 기사들을 제거함으로써 제1 그룹을 생성할 수 있다.
사용자(30)는 하나의 사건에 대해서, 동일한 내용을 포함하는 기사들을 열람하기보다 동일한 사건에 대해 서로 다른 내용을 포함하는 기사들을 열람하기를 원할 수 있다. 따라서, 중복 기사 처리부(240)는 제1 유사도 연산부(220)가 연산한 제1 유사도에 기초하여, 중복되는 기사들을 제거할 수 있다. 예컨대, 중복 기사 처리부(240)는 제1 유사도가 미리 정해진 문턱값을 초과하는 경우, 둘 중 하나의 기사만을 제1 그룹에 포함시킬 수 있다.
또한, 중복 기사 처리부(240)는 제1 그룹에 포함되는 기사의 개수에 기초하여 제1 그룹을 2개 이상의 하위 그룹으로 분할할 수 있다. 예컨대, 제1 유사도 연산부(220)는 제1 그룹에 포함되는 기사의 개수가 미리 정해진 개수를 초과하는 경우, 제1 그룹에 포함된 기사들의 유사도에 기초하여 제1 그룹을 2개 이상의 그룹들로 분할 할 수 있다. 중복 기사 처리부(240)가 생성한 제1 그룹에 포함된 기사들은 서로 동일 또는 유사한 주제를 갖는 기사들로서 사용자(30)에게 제공될 수 있다.
그룹 주제 생성부(260)는 중복 기사 처리부(240)가 생성한 제1 그룹의 그룹 주제를 생성할 수 있다. 예컨대, 그룹 주제 생성부(260)는 제1 그룹에 포함된 기사들의 기사 주제들에 기초하여 그룹 주제를 생성할 수 있다. 본 발명의 예시적 실시예에 따라, 그룹 주제 생성부(260)가 생성한 제1 그룹의 그룹 주제는 데이터 베이스들(22, 24)에 저장된 기사들이 제1 그룹에 포함되는지 여부를 판단, 제1 그룹의 대표 기사를 식별 또는 제1 그룹과 다른 제2 그룹과 유사한지 여부를 판단하는데 사용될 수 있다.
도 6a 및 6b는 본 발명의 예시적 실시예들에 따라 도 1의 그룹 생성부(200)가 기사들을 그룹화하는 동작들을 나타내는 도면이다. 도 5에서 설명한 바와 같이, 제1 유사도 연산부(220)는 복수개의 기사들 사이의 제1 유사도를 연산할 수 있고, 중복 기사 처리부(240)는 연산된 제1 유사도에 따라 기사들을 그룹화하여 제1 그룹을 생성할 수 있다. 도 6a 및 6b는 6개의 기사들(A1 내지 A6)에 대한 제1 유사도를 연산하는 방법들을 예시적으로 나타내며, 6개의 기사들(A1 내지 A6)로부터 제1 그룹(G1) 및 제2 그룹(G2)을 생성하는 것을 나타낸다.
도 6a는 본 발명의 예시적 실시예에 따라 제1 유사도 연산부(220) 및 중복기사 처리부(240)가 기사들을 그룹화하는 동작을 나타내는 도면이다. 도 2를 참조하면, 단어 추출부(120)가 생성한 데이터, 예컨대 단어의 빈도 및 제목에 포함여부에 대한 정보는 그룹 생성부(200)의 제1 유사도 연산부(220)가 기사들 사이의 제1 유사도를 연산하는데 사용될 수도 있다. 예컨대, 제1 유사도 연산부(220)는 제1 기사(A1) 및 제2 기사(A2)의 제1 유사도를 판단하기 위하여, 단어 추출부(120)가 추출한 주요 단어 가운데 제1 기사(A1) 및 제2 기사(A2)에 공통적으로 포함되는 주요 단어의 빈도를 연산할 수 있다. 즉, 도 4에 도시된 실시예에서, 제1 유사도 연산부(220)는 아래와 같은 수학식을 통해서 제1 기사(A1) 및 제2 기사(A2)의 제1 유사도를 연산할 수 있다.
[수학식 1]
(5×6) + (3×3) + (3×4) = 51
상기 수학식 1에서, 첫 번째 항은 제1 기사(A1) 및 제2 기사(A2)에 각각 포함된 “홍길동”의 개수들의 곱이고, 두 번째 및 세 번째 항은 각각 “우승” 및 “PGA”의 개수들의 곱이다. 한편, 제1 유사도 연산부(220)는 제목에 포함된 주요 단어의 경우 가중치를 더하거나 곱할 수 있다. 이에 따라 계산된 값이 높을 수록 기사들 사이의 유사도가 높은 것으로 판단될 수 있다.
도 6a에서 6개의 기사들(A1 내지 A6)은 6개의 노드들로 표현된다. 6개의 노드들은 각각 5개의 에지들을 통해서 자신과 다른 5개의 노드들에 연결될 수 있다. 예컨대, 제1 기사(A1)를 나타내는 노드는 제2 기사(A2) 내지 제6 기사(A6)를 나타내는 노드들과 5개의 에지들을 통해서 연결될 수 있다. 도 6a에 도시된 에지들은 각각 고유한 값을 가지고 있으며, 에지들이 갖는 값은 2개 기사들 사이의 제1 유사도를 나타낼 수 있다. 예컨대, 도 2를 함께 참조하면, 제1 기사(A1)를 나타내는 노드와 제2 기사(A2)를 나타내는 노드를 연결하는 에지는 상기 수학식 1에 따라 51의 값을 가질 수 있다.
제1 유사도 연산부(220)는 도 6a에 도시된 에지들에 대응하는 제1 유사도들을 각각 연산할 수 있다. 중복 기사 처리부(240)는 에지들이 갖는 값에 기초하여 기사들을 그룹화할 수 있다. 예컨대, 중복 기사 처리부(240)는 미리 정해진 문턱값 보다 높은 값(또는 제1 유사도)을 갖는 기사들을 그룹화할 수 있다. 이에 따라, 도 6a에 도시된 바와 같이, 중복 기사 처리부(240)는 제1 기사(A1), 제2 기사(A2) 및 제6 기사(A6)를 제1 그룹으로 그룹화할 수 있고, 제2 기사(A2) 및 제3 기사(A3)를 그룹화할 수 있다. 도 6a에 도시된 바와 같이, 제1 그룹(G1) 및 제2 그룹(G2)은 상호 배타적이지 않을 수 있다. 또한, 중복 기사 처리부(240)는 하나의 그룹에 포함된 기사들 가운데 중복되는 기사들을 제거함으로써 최종적으로 제 1그룹(G1) 및 제2 그룹(G2)를 생성할 수 있다.
도 6b는 본 발명의 예시적 실시예에 따라 제1 유사도 연산부(220) 및 중복기사 처리부(240)가 기사들을 그룹화하는 동작을 나타내는 도면이다. 제1 유사도 연산부(220)는 주제 생성부(140)가 생성한 기사 주제에 따라 기사를 좌표에 나타낼 수 있다. 예컨대, 도 6b의 2차원 좌표에서 X축은 제1 단어의 빈도를 나타내고, Y축은 제2 단어의 빈도를 나타낸다. 6개의 기사들(A1 내지 A6)은 각각 주제 생성부(140)가 생성한 기사 주제에 포함된 제1 단어 및 제2 단어가 각각의 기사에서 나타난 빈도(또는 각각의 기사에 포함된 제1 단어 및 제2 단어의 개수)에 따라 2차원 좌표에서 하나의 지점으로 나타날 수 있다. 다시 말해서, 기사는 원점에서부터 자신의 좌표에 이르는 벡터로서 정의 될 수 있으며, 이러한 벡터를 단어 벡터라고 부른다. 기사는 단어 벡터로서 인덱싱 될 수 있다. 예컨대, 도 6b에 도시된 바와 같이, 제3 기사(A3)는 단어 벡터(V3)로서 인덱싱될 수 있다.
중복 기사 처리부(240)는 좌표에 표시된 기사들의 상대적인 거리에 기초하여 기사들을 그룹화할 수 있다. 즉, 중복 기사 처리부(240)는 미리 정해진 문턱값 보다 가까운 거리에 있는 기사들을 그룹화할 수 있다. 예컨대, 도 6b에 도시된 바와 같이, 제1 유사도 연산부(220)는 제1 기사 내지 제6 기사(A1 내지 A6)를 좌표에 표시할 수 있다. 제1 유사도 연산부(220)는 제1 기사(A1) 및 제6 기사(A6)를 제1 그룹(G1)으로 그룹화할 수 있고, 제2 기사(A2), 제4 기사(A4) 및 제5 기사(A5)를 제2 그룹(G2)으로 그룹화할 수 있다. 그 다음에, 중복 기사 처리부(240)는 제1 그룹(G1) 및 제2 그룹(G2) 내에서 중복된 기사들을 제거함으로써 최종적으로 제1 그룹(G1) 및 제2 그룹(G2)를 생성할 수 있다. 비록 도 6b는 축을 포함하는 2차원의 좌표를 도시하였지만, 본 발명의 예시적 실시예는 이에 제한되지 않으며 중복 기사 처리부(240)는 3차원 이상의 좌표에 표시된 복수개의 기사들에 대하여 상대적인 거리를 미리 정해진 문턱값과 비교하여 기사들을 그룹화할 수 있다.
도 7은 본 발명의 예시적 실시예에 따라 도 1의 대표 기사 식별부(400)의 구현예를 나타내는 도면이다. 도 7에 도시된 바와 같이, 대표 기사 식별부(400)는 제2 유사도 연산부(420) 및 기사 랭킹부(440)를 포함할 수 있다. 제2 유사도 연산부(420)는 그룹 생성부(200)의 그룹 주제 생성부(260)가 생성한 제1 그룹의 그룹 주제와 제1 그룹에 포함된 기사들의 기사 주제들 사이의 제2 유사도를 연산할 수 있다. 비록 도 1에서는 그룹 생성부(200)가 제1 유사도 연산부(220)를 포함하고 대표 기사 식별부(400)가 제2 유사도 연산부(420)를 포함하는 것으로 도시되었으나, 본 발명의 예시적 실시예는 이에 제한되지 않으며 하나의 유사도 연산부를 그룹 생성부(200) 및 대표 기사 식별부(400)가 공유할 수도 있다.
기사 랭킹부(440)는 제2 유사도 연산부(420)가 연산한 제2 유사도에 따라, 제1 그룹에 포함된 기사들의 순위를 결정할 수 있다. 예컨대, 기사 랭킹부(440)는 제1 그룹의 그룹 주제와 가장 제2 유사도가 높은 기사의 순위를 가장 높게 지정할 수 있다. 본 발명의 예시적 실시예에 따라, 기사 랭킹부(440)는 제1 그룹에 포함된 기사들 가운데 미리 정해진 수의 기사들에 대해서 순위를 결정할 수 있고, 이러한 미리 정해진 수의 기사들을 대표 기사라고 부른다. 또한, 기사 랭킹부(440)는 제2 유사도 연산부(420)가 연산한 제2 유사도 뿐만 아니라, 그룹 제공부(300)로부터 제공되는 피드백 정보에 더 기초하여 제1 그룹에 포함된 기사들의 순위를 결정할 수 있다. 예컨대, 도 8을 함께 참조하면, 그룹 제공부(300)의 기사 조회수 측정부(360)는 사용자(30)가 기사를 열람하는 횟수(조회수)에 대한 정보를 대표 기사 식별부(400)로 전달할 수 있고, 대표 기사 식별부(400)의 기사 랭킹부(440)는 제2 유사도 연산부(420)가 연산한 제2 유사도 뿐만 아니라 상기 조회수에 기초하여 제1 그룹에 포함된 기사들의 순위를 결정할 수 있다.
도 8은 본 발명의 예시적 실시예에 따라 도 1의 그룹 제공부(300)의 구현예를 나타내는 도면이다. 도 8에 도시된 바와 같이, 그룹 제공부(300)는 주제별 그룹 제공부(320), 대표 기사 제공부(340) 및 기사 조회수 측정부(360)를 포함할 수 있다. 주제별 그룹 제공부(320)는 대표 기사 식별부(400)의 기사 랭킹부(440)가 결정한 제1 그룹의 기사들에 대한 순위에 따라 미리 정해진 개수의 기사들을 네트워크(40)를 통해서 사용자(30)에게 제공할 수 있다. 예컨대, 주제별 그룹 제공부(320)는 제1 그룹의 기사들 중 최고 순위의 기사를 다른 기사들 보다 부각되도록 나타낼 수 있다. 또한, 그룹 생성부(200)가 생성한 제1 그룹과 다른 제2 그룹의 대표 기사들을 기사 랭킹부(440)가 결정한 순위에 따라 네트워크(40)를 통해서 사용자(30)에게 제공할 수 있다.
대표 기사 제공부(340)는 그룹 생성부(200)가 생성한 제1 그룹에 포함된 기사들을 네트워크(40)를 통해서 사용자(30)에게 제공할 수 있다. 예컨대, 대표 기사 제공부(340)는 제1 그룹에 포함된 기사들의 제목 및 본문의 일부를 나열할 수 있고, 사용자(30)가 하나의 기사를 선택한 경우 선택한 기사의 제목 및 본문을 사용자(30)에게 제공할 수 있다. 또한, 대표 기사 제공부(340)는 사용자(30)가 선택한 기사를 제공하는 동시에, 제1 그룹의 그룹 주제와 유사한 그룹을 사용자(30)에게 제공할 수도 있다. 예컨대, 대표 기사 제공부(340)는 사용자(30)가 선택한 기사의 제목 및 본문을 화면의 넓은 공간에 나타내는 동시에, 나머지 일부 공간에서 제1 그룹의 그룹 주제와 유사한 그룹 주제를 갖는 그룹들의 대표 기사들의 제목들을 사용자(30)에게 제공할 수 있다.
기사 조회수 측정부(360)는 대표 기사 제공부(340)가 제공하는 기사들에 대한 사용자(30)의 열람 횟수(조회수)를 측정할 수 있다. 많은 수의 사용자(30)가 열람한 기사는 상대적으로 사용자(30)의 관심도가 높은 내용을 포함할 수 있는 것으로 추정될 수 있다. 따라서, 도 7을 참조하면 기사 조회수 측정부(360)가 측정한 기사의 조회수는 대표 기사 식별부(400)의 기사 랭킹부(440)에 전달될 수 있고, 기사 랭킹부(440)는 상기 조회수에 더 기초하여 제1 그룹에 포함된 기사들의 순위를 결정할 수 있다. 즉, 기사 랭킹부(440)는 기사의 조회수를 기사들의 순위를 결정하는데 반영할 수 있다.
도 9는 본 발명의 예시적 실시예에 따라 도 1의 그룹 제공부(300)가 사용자(30)에게 제공하는 그룹들을 나타내는 도면이다. 도 1 및 8을 함께 참조하면, 그룹 제공부(300)는 그룹 생성부(200)가 생성한 그룹 및 대표 기사 식별부(400)가 식별한 대표 기사를 네트워크(40)를 통해서 사용자(30)에게 제공할 수 있다. 예컨대, 도 9에 도시된 바와 같이, 그룹 제공부(300)의 주제별 그룹 제공부(320)는 복수개의 그룹들의 대표 기사들(1100, 1200, 1300, 1400)을 나열하여 사용자(30)에게 제공할 수 있다. 본 발명의 예시적 실시예에 따라, 주제별 그룹 제공부(320)는 대표 기사의 제목(1120, 1220, 1320, 1420) 및 본문의 일부(1140, 1240, 1340, 1440)를 표시함으로써 그룹들의 대표 기사들(1100, 1200, 1300, 1400)을 나열할 수 있다. 사용자(30)는 네트워크(40)를 통해서 복수개의 그룹들 각각의 대표 기사들을 한눈에 볼 수 있으며, 대표 기사의 제목(1120, 1220, 1320, 1420) 및 본문의 일부(1140, 1240, 1340, 1440)를 통해서 사용자(30) 자신이 관심 있는 주제와 관련된 기사들의 그룹을 용이하게 선택할 수 있다.
한편, 도 9는 주제별 그룹 제공부(320)가 각 그룹의 대표 기사로서 하나의 대표 기사를 사용자에게 제공하는 실시예를 도시하였으나, 주제별 그룹 제공부(320)는 각 그룹에 대응하는 복수개의 대표 기사들을 사용자(30)에게 제공할 수 있다. 예컨대, 주제별 그룹 제공부(320)는 대표 기사 식별부(400)의 기사 랭킹부(440)가 결정한 순위에 따라 미리 정해진 개수의 기사들을 그룹의 대표 기사들로서 사용자에게 제공할 수 있다. 또한, 주제별 그룹 제공부(320)는 최고 순위의 기사를 다른 기사들 보다 부각되도록 나타낼 수 있다.
본 발명의 예시적 실시예에 따라, 그룹 제공부(300)의 주제별 그룹 제공부(320)는 사용자(30)에게 제공되는 그룹들의 순서(또는 그룹들의 대표 기사들의 순서)를 결정할 수 있다. 예컨대, 주제별 그룹 제공부(320)는 사용자(30)에 의해서 그룹(또는 대표 기사)이 선택되는 횟수를 측정할 수 있고, 그룹이 선택되는 횟수에 기초하여 사용자(30)에게 제공하는 복수개의 그룹들을 나열할 수 있다. 이에 따라, 주제별 그룹 제공부(320)는 사용자(30)에 의해서 빈번하게 선택되는 그룹을 최상위에 나타낼 수 있다. 뿐만 아니라, 주제별 그룹 제공부(320)는 사용자(30)가 미리 설정한 정보에 따라 그룹들의 순서를 결정할 수 있다. 즉, 사용자(30)는 미리 적어도 하나의 관심분야, 예컨대 정치, 경제, 스포츠 또는 연예 등을 설정할 수 있고, 주제별 그룹 제공부(320)는 사용자(30)의 관심분야에 대응하는 그룹을 최상위에 나타낼 수 있다.
도 10은 본 발명의 예시적 실시예에 따라 도 1의 그룹 제공부(300)가 사용자(30)에게 제공하는 기사들을 나타내는 도면이다. 도 8을 함께 참조하면, 그룹 제공부(300)의 주제별 그룹 제공부(320)가 도 9에 도시된 바와 같이 각 그룹의 대표 기사를 사용자(30)에게 제공하고, 사용자(30)가 하나의 그룹을 선택한 경우 그룹 제공부(300)의 대표 기사 제공부(340)는 선택된 그룹에 포함된 기사들을 사용자(30)에게 제공할 수 있다.
도 10에 도시된 바와 같이, 대표 기사 제공부(340)는 대표 기사 식별부(400)의 기사 랭킹부(440)에 따라 최고 순위의 대표 기사(2200)가 포함하는 제목(2220) 및 본문(2240)을 가장 넓은 공간에 나타낼 수 있다. 또한, 대표 기사 제공부(340)는 선택된 그룹에 포함된 다른 기사들의 제목들에 대한 목록(2400)을 나열할 수 있고, 사용자(30)가 목록(2400)의 기사들 중 하나를 선택하는 경우, 선택된 기사의 제목 및 본문이 대표 기사(2200)의 제목(2220) 및 본문(2240)을 대체하여 표시될 수 있다.
본 발명의 예시적 실시예에 따라, 대표 기사 제공부(340)는 사용자(30)가 선택한 그룹과 유사한 그룹 주제를 갖는 적어도 하나의 그룹들을 사용자(30)에게 제공할 수 있다. 예컨대, 도 5에서 설명한 바와 같이, 그룹 생성부(200)의 그룹 주제 생성부(260)를 통해서 생성된 복수개의 그룹들의 그룹 주제들 사이의 유사도에 따라서, 대표 기사 제공부(340)는 사용자(30)가 선택한 그룹과 그룹 주제가 유사한 복수개의 그룹들의 대표 기사들에 대한 목록(2600)을 사용자(30)에게 제공할 수 있다.
한편, 본 발명의 예시적 실시예에 따라, 그룹 제공부(300)의 기사 조회수 측정부(360)는 대표 기사 제공부(340)가 제공하는 기사에 대한 사용자(30)의 열람 횟수(조회수)를 측정할 수 있다. 기사 조회수 측정부(360)는 기사에 대한 사용자(30)의 열람 횟수를 대표 기사 식별부(400)의 기사 랭킹부(440)에 전달할 수 있다. 기사 랭킹부(440)는 그룹 주제와 기사의 기사 주제 사이의 제2 유사도 뿐만 아니라 기사의 열람 횟수에 기초하여 기사의 순위를 결정할 수 있다. 이에 따라, 기사 랭킹부(440)가 기사의 열람 횟수에 따라 기사의 순위를 변경한 경우, 그룹 제공부(300)의 대표 기사 제공부(340)가 나열하는 기사들의 순서도 변경될 수 있다.
상기한 실시예의 설명은 본 발명의 더욱 철저한 이해를 위하여 도면을 참조로 예를 든 것에 불과하므로, 본 발명을 한정하는 의미로 해석되어서는 안될 것이다. 또한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기본적 원리를 벗어나지 않는 범위 내에서 다양한 변화와 변경이 가능함은 명백하다 할 것이다.

Claims (10)

  1. 데이터 베이스에 저장된 복수개의 기사들의 기사 주제들을 추출하는 주제 추출부;
    상기 기사 주제들에 기초하여 상기 복수개의 기사들을 그룹화하여 제1 그룹을 생성하는 그룹 생성부; 및
    상기 제1 그룹을 네트워크를 통하여 사용자에게 제공하는 그룹 제공부를 포함하는 기사 그룹화 시스템.
  2. 제1항에 있어서,
    상기 기사 주제들 각각은 적어도 하나의 단어를 포함하고,
    상기 주제 추출부는
    상기 복수개의 기사들 각각으로부터 적어도 하나의 주요 단어를 추출하는 단어 추출부; 및
    상기 주요 단어에 기초하여 상기 복수개의 기사들 각각의 기사 주제를 생성하는 주제 생성부를 포함하는 것을 특징으로 하는 기사 그룹화 시스템.
  3. 제2항에 있어서,
    상기 단어 추출부는 상기 복수개의 기사들 각각에 포함된 단어의 빈도에 기초하여 상기 주요 단어를 추출하는 것을 특징으로 하는 기사 그룹화 시스템.
  4. 제1항에 있어서,
    상기 그룹 생성부는
    상기 기사 주제들 사이의 제1 유사도를 연산하는 제1 유사도 연산부;
    상기 제1 유사도에 기초하여 중복된 기사들을 제거하고, 상기 제1 그룹을 생성하는 중복 기사 처리부; 및
    상기 제1 유사도에 기초하여 상기 제1 그룹의 그룹 주제를 생성하는 그룹 주제 생성부를 포함하는 것을 특징으로 하는 기사 그룹화 시스템.
  5. 제4항에 있어서,
    상기 중복 기사 처리부는 상기 제1 그룹의 그룹 주제와 상기 데이터 베이스에 저장된 제1 기사의 기사 주제 사이의 유사도에 기초하여 상기 제1 기사를 상기 제1 그룹에 선택적으로 포함시키는 것을 특징으로 하는 기사 그룹화 시스템.
  6. 제5항에 있어서,
    상기 중복 기사 처리부는 상기 제1 유사도 및 상기 제1 그룹에 포함되는 기사들의 개수에 기초하여 상기 제1 그룹을 2개 이상의 그룹들로 분할하는 것을 특징으로 하는 기사 그룹화 시스템.
  7. 제4항에 있어서,
    상기 제1 그룹에 포함되는 기사들의 기사 주제들 및 상기 제1 그룹의 그룹 주제에 기초하여 상기 제1 그룹에 포함된 적어도 하나의 대표 기사를 식별하는 대표 기사 식별부를 더 포함하는 기사 그룹화 시스템.
  8. 제7항에 있어서,
    상기 대표 기사 식별부는
    상기 제1 그룹에 포함되는 기사들의 기사 주제들 및 상기 제1 그룹의 그룹 주제 사이의 제2 유사도를 연산하는 제2 유사도 연산부; 및
    상기 제2 유사도에 기초하여 상기 제1 그룹에 포함되는 기사들의 순위를 결정하는 기사 랭킹부를 포함하는 것을 특징으로 하는 기사 그룹화 시스템.
  9. 제7항에 있어서,
    상기 그룹 제공부는
    상기 제1 그룹을 포함하는 복수개의 그룹들을 상기 사용자에게 제공하는 주제별 그룹 제공부; 및
    상기 제1 그룹의 대표 기사를 상기 사용자에게 제공하는 대표 기사 제공부 를 포함하는 것을 특징으로 하는 기사 그룹화 시스템.
  10. 제9항에 있어서,
    상기 대표 기사 제공부는 상기 제1 그룹에 포함된 기사들에 대한 상기 사용자의 조회수들을 측정하는 기사 조회수 측정부를 더 포함하고,
    상기 기사 랭킹부는 상기 조회수들에 더 기초하여 상기 순위를 결정하는 것을 특징으로 하는 기사 그룹화 시스템.
KR1020130119444A 2013-10-07 2013-10-07 주제 기반 기사 그룹화 시스템 KR101544141B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130119444A KR101544141B1 (ko) 2013-10-07 2013-10-07 주제 기반 기사 그룹화 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130119444A KR101544141B1 (ko) 2013-10-07 2013-10-07 주제 기반 기사 그룹화 시스템

Publications (2)

Publication Number Publication Date
KR20150040658A true KR20150040658A (ko) 2015-04-15
KR101544141B1 KR101544141B1 (ko) 2015-08-12

Family

ID=53031943

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130119444A KR101544141B1 (ko) 2013-10-07 2013-10-07 주제 기반 기사 그룹화 시스템

Country Status (1)

Country Link
KR (1) KR101544141B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190055027A (ko) * 2018-06-01 2019-05-22 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 이벤트 발견 방법, 장치, 기기 및 저장 매체
JP2019113945A (ja) * 2017-12-21 2019-07-11 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR102095022B1 (ko) * 2019-10-02 2020-03-30 김근수 기사 분석을 이용한 주식 자동 매매 방법, 장치 및 프로그램
KR20200046279A (ko) * 2018-10-24 2020-05-07 네이버 주식회사 언론사 별 뉴스 공통 문구 수집 방법 및 장치
CN111581967A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种联合LW2V与Triplet网络的新闻主题事件检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025443B2 (ja) 1998-12-04 2007-12-19 富士通株式会社 文書データ提供装置及び文書データ提供方法
JP2000259666A (ja) 1999-03-11 2000-09-22 Nippon Hoso Kyokai <Nhk> トピック抽出装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019113945A (ja) * 2017-12-21 2019-07-11 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR20190055027A (ko) * 2018-06-01 2019-05-22 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 이벤트 발견 방법, 장치, 기기 및 저장 매체
US11210469B2 (en) 2018-06-01 2021-12-28 Beijing Baidu Netcom Science Technology Co., Ltd. Method, apparatus for event detection, device and storage medium
KR20200046279A (ko) * 2018-10-24 2020-05-07 네이버 주식회사 언론사 별 뉴스 공통 문구 수집 방법 및 장치
KR102095022B1 (ko) * 2019-10-02 2020-03-30 김근수 기사 분석을 이용한 주식 자동 매매 방법, 장치 및 프로그램
CN111581967A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种联合LW2V与Triplet网络的新闻主题事件检测方法
CN111581967B (zh) * 2020-05-06 2023-08-11 西安交通大学 一种联合LW2V与Triplet网络的新闻主题事件检测方法

Also Published As

Publication number Publication date
KR101544141B1 (ko) 2015-08-12

Similar Documents

Publication Publication Date Title
KR101544141B1 (ko) 주제 기반 기사 그룹화 시스템
JP6293642B2 (ja) 推薦エンジンに基づく汎用グラフ、ルール及び空間構造
CN102110135B (zh) 使用信息处理装置估计信息元之间的关联度的系统和方法
US20100138428A1 (en) Keyword output apparatus and method
CN102968413B (zh) 一种用于提供搜索结果的方法与设备
RU2014138615A (ru) Интерактивный сравнительный информационный дисплей
CN106686460B (zh) 一种视频节目推荐方法及视频节目推荐装置
CN103744887B (zh) 一种用于人物搜索的方法、装置和计算机设备
CN104050243B (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
Grabovitch-Zuyev et al. On the correlation between textual content and geospatial locations in microblogs
US20240134914A1 (en) Content based related view recommendations
US20140039875A1 (en) Visual analysis of phrase extraction from a content stream
CN103412880B (zh) 一种用于确定多媒体资源间隐式关联信息的方法与设备
EP3824427A1 (en) Determining item relevancy
CN104331490B (zh) 网络数据处理方法及装置
KR101902460B1 (ko) 문서 분류 장치
JP2016110185A (ja) 話題提示方法、装置及びコンピュータ・プログラム。
KR20150041267A (ko) 주제 기반 기사 연대기 생성 시스템
CN104462055B (zh) 一种名称相似度获取方法及装置
Hiramoto et al. Web information retrieval based on user operation on digital maps
CN104077366B (zh) 一种在网络设备中用于确定特征信息的方法和装置
CN102982072A (zh) 一种可视化概念检测器及构造语义场的方法
Lappas et al. STEM: A spatio-temporal miner for bursty activity
Ali et al. A novel approach for ensuring location privacy using sentiment analysis and analysis for health-care and its effects on humans health
JP2012160107A5 (ko)

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190805

Year of fee payment: 5