KR20170114321A - 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법 - Google Patents

키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법 Download PDF

Info

Publication number
KR20170114321A
KR20170114321A KR1020160040854A KR20160040854A KR20170114321A KR 20170114321 A KR20170114321 A KR 20170114321A KR 1020160040854 A KR1020160040854 A KR 1020160040854A KR 20160040854 A KR20160040854 A KR 20160040854A KR 20170114321 A KR20170114321 A KR 20170114321A
Authority
KR
South Korea
Prior art keywords
content
news
keyword
keywords
genre
Prior art date
Application number
KR1020160040854A
Other languages
English (en)
Inventor
한승현
Original Assignee
(주)어반트시스템
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)어반트시스템 filed Critical (주)어반트시스템
Priority to KR1020160040854A priority Critical patent/KR20170114321A/ko
Publication of KR20170114321A publication Critical patent/KR20170114321A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F17/30038
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • G06F17/30029
    • G06F17/30554
    • G06F17/30699
    • G06F17/30867
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법에 관한 것으로서, 온라인 뉴스 콘텐츠들을 대상으로 수치적인 계산에 의한 키워드 간의 연관성 측정, 콘텐츠 적합성 검증, 콘텐츠 선호도 측정을 수행하고 요청한 키워드에 대해 적합한 뉴스 콘텐츠만을 필터링하여 제시하는 시스템 및 그 방법을 제공한다.
본 발명의 실시예는, 수많은 뉴스 콘텐츠들에 대한 장르, 키워드 정보를 유지관리하고 수치적 계산에 의한 분석을 수행하여 뉴스콘텐츠들의 필터링을 수행하는 뉴스콘텐츠 개인화 필터링 시스템; 뉴스콘텐츠에 대한 필터링된 정보이용을 요구하는 일반 구독자용 사용자 단말 시스템; 뉴스콘텐츠의 작성에 사용하는 기사작성 시스템을 포함한다. 이러한 구성에 의하여 수많은 뉴스콘텐츠에 대한 필터링된 정보를 원하는 일반 사용자뿐 아니라 뉴스콘텐츠를 직접 생산하는 기자들도 개인의 취재분야, 관심 키워드에 대한 기사들을 생산해야 하는 입장에서 관심정보에 대하여 필터링된 뉴스 콘텐츠만을 제공받고, 관심 장르와 관심키워드들 및 연관 키워드들의 정보를 이용하여 온라인상의 뉴스 콘텐츠들의 동향을 쉽게 파악하고 관심 키워드들에 대한 변화의 흐름을 제공받을 수 있도록 한다.

Description

키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법 {Personalized news contents filtering system and method using the Keyword analysis}
본 발명은 수많은 온라인 뉴스 콘텐츠들 중 개인의 관심 키워드와 연관되는 키워드들을 분석하여 장르별 키워드 간의 연관성 측정, 생성된 콘텐츠의 적합성 검증, 콘텐츠 선호도 측정을 통해 요청한 키워드에 대해 적합한 뉴스 콘텐츠만을 필터링하여 제시하는 키워드 분석을 이용한 뉴스 콘텐츠 필터링 시스템 및 그 방법에 관한 것이다.
온라인 상의 뉴스정보의 제공자는 각종 신문사, 미디어지, 방송국들과 이들로부터 정보를 취합 제공하는 다음, 네이버, 구글, 네이트, MSN과 같은 검색포털이 대표적이며, 개인들은 뉴스정보의 제공자가 공급하는 기사의 표출형식에 따른 일방적인 정보의 공급을 구독하는 형태가 대부분이다.
이러한 형태의 기사 제공은 이슈가 되는 내용들을 전반적으로 훑어보는 경우에는 유리하지만 개인의 관심분야가 반영된 정보의 표출을 우선 하지 않는 일괄적인 정보의 제공방식이다.
또 다른 기사의 구독형태는 개인들이 직접 검색어를 입력하여 검색된 방대한 검색결과 중에 개인이 관심이 가는 내용을 직접 클릭하여 기사내용을 확인하는 형태가 있다.
검색엔진을 활용한 뉴스의 검색은 개인이 키워드를 입력하여 검색엔진 고유의 알고리즘에 의해 제공되는 수많은 결과물을 개인 스스로 필터링하여 내용을 확인해야 하기 때문에 관심 콘텐츠를 찾아서 관심 키워드와 연관된 흐름과 정보의 동향을 찾는데 많은 시간이 소모된다.
KR1020130161025 A KR1020130132977 A KR1020120081279 A KR1020120058619 A
한승현, 숭실대학교 대학원, 2008.8, xi,123p., 국내박사 '키워드 분석을 이용한 모바일 웹 뉴스 콘텐츠의 실시간 생성에 관한 연구'
본 발명은 상기와 같은 문제점을 해결하기 위하여 착안된 것으로, 시시각각 변하는 수많은 뉴스 콘텐츠 중 개인의 관심정보가 반영된 뉴스콘텐츠를 필터링하기 위해 종래의 상관관계 계산식이나 가중치 설정에 의한 필터링 방법보다 명확한 분류결과를 얻을 수 있는 수학식들을 사용한 키워드 분석을 과정을 통해 뉴스콘텐츠들을 개인화하여 제공하기 위한 시스템 및 그 방법을 제공하고자 한다.
또한, 본 발명의 키워드 분석을 이용한 뉴스콘텐츠 개인화 필터링 시스템(200)과 그 방법은 필터링된 뉴스콘텐츠 정보를 제공받는 사용자는 개인의 관심 뉴스장르, 관심 키워드와 관련된 연관 키워드들의 정보의 동향을 제공받을 수 있어, 이를 통해 시시각각 변하는 뉴스콘텐츠의 흐름과 관심대상과 관계된 정보의 흐름, 최근의 이슈들의 동향을 빠르게 판단하는데 도움을 주는 기능을 제공하여, 뉴스의 구독자는 물론, 뉴스를 생산하는 생산자에 이르기까지 최근의 동향과 이슈를 파악하는데 기여하는 시스템적인 설계와 방법을 제공하고자 한다.
상술한 과제를 해결하기 위해 뉴스콘텐츠 개인화 필터링 시스템(200)은 사용자 정보를 관리하는 사용자 관리부(210), 사용자의 관심키워드를 입력정보 및 콘텐츠 정보의 관심도를 모니터링하는 사용자 요청 수집부(220), 키워드 요청에 의한 콘텐츠 수집 대상 주소를 관리하고 해당 콘텐츠를 수집하는 콘텐츠 수집부(260), 수집된 콘텐츠에 대한 관계 분석을 수행하는 콘텐츠 분석부(270), 수집된 콘텐츠들의 콘텐츠 장르를 결정하고 관리하는 장르 관리부(240), 사용자들에 의해 입력된 키워드들을 콘텐츠 장르별로 관리하고 장르내의 키워들 간의 연관계수를 관리하며 새로이 대두 되는 연관 키워드들을 도입하며 관심이 약해지는 키워드들을 도태시키는 키워드 관리부(250), 수집된 콘텐츠들과 필터링된 콘텐츠들을 저장관리하는 콘텐츠 저장부(280), 필터링 결과를 포괄전송하거나 또는 사용자가 읽지 않은 콘텐츠에 대해서 사용자 단말로 전달하는 정보 전송부(230)를 포함하는 시스템을 제공할 수 있다.
상술한 과제를 해결하기 위한 다른 실시예로, 키워드 관리부(250)와 콘텐츠 분석부(270)는 수집된 결과를 기반으로 하여 사용자 또는 관리자의 개입이 이뤄지는 감독 학습기법이 아닌 비감독 학습에 의한 키워드 장르분석, 등장키워드 분석, 연관성 분석, 뉴스 콘텐츠의 적합성 검증에 의한 콘텐츠 필터링을 수행할 수 있다.
또한, 상술한 과제를 해결하기 위한 다른 실시예로, 콘텐츠 수집부(260)는 뉴스 콘텐츠 수집을 위하여, 각종 미디어지, 언론사 또는 검색포털, SNS(Social Network Service)사에서 제공하는 공개형 API(Application Programming Interface), RSS(Really Simple Syndication), NewsML(News Markup Language)과 같은 여러 가지 수집 방식을 적용할 수 있는 데이터 수집기와 이를 해석하기 위한 해석기, 이미지와 영상파일 정보를 판별하여 관리하는 미디어정보 수집기와 같은 모듈 기능을 포함할 수 있다.
상술한 과제를 해결하기 위한 다른 실시예로, 도 1에 묘사한 기사작성 시스템(300)을 사용하는 뉴스콘텐츠의 생산자인 기자들은 뉴스 콘텐츠 개인화 필터링 시스템(200)과 연동 기능인 키워드 콘텐츠 검색부(350)에 간단한 사용자 정보 및 관심 수신처, 관심장르, 관심 키워드 설정을 통해 개인의 관심장르와 관심키워드들과 관계된 연관키워드들의 정보의 동향 및 외부 뉴스콘텐츠들에 대한 개인화 필터링된 정보를 제공받을 수 있는 모듈 기능을 포함할 수 있다.
전술한 본 발명에 의하면, 시스템의 사용자는 수많은 뉴스콘텐츠 중 자신의 관심 분야 또는 특정 키워드 중심의 뉴스 콘텐츠를 제공받을 수 있으며, 관련성이 떨어지는 콘텐츠는 도 6에 묘사한 흐름을 이용하여 시스템이 적합성 체크과정을 통해 걸러냄으로 인해, 제공되는 콘텐츠에 대한 사용자 만족도를 높일 수 있다.
또한, 시시각각 바뀌는 뉴스콘텐츠 환경에서 관심분야, 관심 키워드와 연계하여 새롭게 등장하는 키워드들의 흐름을 파악할 수 있어, 뉴스를 구독하는 개인들을 비롯하여 뉴스를 생산하는 기자들에 이르기까지 관심대상 위주의 변화하는 흐름을 파악할 수 있는 장점을 갖는 키워드 분석에 의한 뉴스콘텐츠들의 개인화 필터링 시스템 및 그 방법을 제공할 수 있다.
도 1은 본 발명의 실시 예에 의한 뉴스콘텐츠 개인화 필터링 시스템(200)을 포함하는 뉴스 콘텐츠 제공을 위한 시스템 구성을 도시한 구성도이다.
도 2는 본 발명의 실시 예에 의한 사용자 단말 시스템(100)의 기능 구성 블럭도이다.
도 3은 본 발명의 실시 예에 의한 뉴스 콘텐츠 개인화 필터링 시스템(200)의 기능 구성 블럭도이다.
도 4는 본 발명의 실시 예에 의한 사용자 단말 시스템(100)의 기능을 갖는 키워드 콘텐츠 검색부(350)를 포함한 뉴스 콘텐츠를 생성하는 기자들이 사용하는 기사작성 시스템(300)의 기능 구성 블럭도이다.
도 5는 본 발명의 실시 예에 의한 뉴스콘텐츠의 장르, 키워드 및 연관 키워드간의 정보의 갱신을 위한 관리 방법을 도시한 흐름도이다.
도 6은 본 발명의 실시 예에 의한 적합한 뉴스콘텐츠만을 필터링하는 과정을 도시한 흐름도이다.
이하, 본 발명의 실시 예들을 첨부한 도면을 참조하여 상세히 설명한다. 첨부한 도면을 참조하여 설명함에 있어 동일하거나 대응하는 구성요소는 동일한 도면부호를 부여하고, 본 발명을 설명함에 있어 관련된 내용에 대해 중복되는 설명은 생략한다.
본 발명의 실시 예들을 설명함에 있어, 뉴스 콘텐츠 개인화 필터링 시스템(200)에 의해 수집된 하나의 뉴스 콘텐츠에서 불필요한 요소들을 모두 걸러낸 정제된 형태의 기사본문을 Full Text Feed의 약칭인 FTF라 하며, 기사 본문이나 제목에 발생하는 키워드의 발생횟수를 빈도수라 하여 Frequency의 약칭인 freq로 사용하였다. 또한, 본 발명의 실시예를 설명함에 있어 사용되는 용어인 '채널'이란 동일한 장르 내에서 요청키워드들로 생성되는 콘텐츠들의 집합을 의미하며 하나의 뉴스 장르를 구성하는 채널은 요청키워드의 중복이 발생할 수 있으므로 해당 장르에 대하여 요청된 키워드들의 갯수 보다 작거나 같게 된다.
도 1은 본 발명의 실시예에 의한 뉴스콘텐츠 개인화 필터링 시스템(200)을 포함하는 뉴스 콘텐츠 제공을 위한 시스템 구성도이다.
본 발명의 실시예에 따라 뉴스콘텐츠를 제공하기 위한 시스템 구성도(도 1)는 사용자 단말 시스템(100)과, 수많은 뉴스 콘텐츠들로부터 키워드 분석을 이용한 뉴스콘텐츠 개인화 필터링 시스템(200) 및 기자들이 뉴스콘텐츠를 작성할 때 사용하는 기사작성 시스템(300)을 포함한다. 이러한 시스템 구성에 의하여 기사작성 시스템(300)을 이용하는 뉴스콘텐츠를 생산하는 기자들도 개인의 담당 파트와 관련하여 관심 키워드에 대한 기사들을 생산해야 하는 입장에서 본 발명의 시스템 구성도에 포함된 뉴스콘텐츠 개인화 필터링 시스템(200)의 제공 정보를 이용하여 다른 외부 뉴스 콘텐츠들의 취재 흐름을 파악하고 관심 키워드들에 대한 변화의 흐름을 제공받을 수 있다.
도 2는 본 발명의 실시 예에 의한 사용자 단말 시스템(100)의 기능 구성 블럭도이다.
본 발명의 실시예에 따라 통신망을 통해 뉴스콘텐츠의 개인화 필터링 시스템에 접속하는 사용자 단말 시스템(100)은 사용자 기본정보 설정부(110), 단말 디스플레이부(120), 관심 수신처 설정부(130), 관심 장르 설정부(140), 관심키워드 설정부(150), 사용자 액션 전송부(160)을 포함한다.
도 3은 본 발명의 실시 예에 의한 뉴스 콘텐츠 개인화 필터링 시스템(200)의 기능 구성 블럭도이다.
본 발명의 실시예에 따라 통신망을 통해 수많은 뉴스 콘텐츠 중 사용자의 관심대상에 적합하게 필터링된 뉴스콘텐츠를 제공하는 뉴스 콘텐츠 개인화 필터링 시스템(200)은 개인화 구성을 위한 사용자의 일반 정보를 포함하는 사용자 관리부(210), 사용자가 요청하는 키워드 정보 및 액션정보를 관리하는 사용자 요청 수집부(220), 수집하는 뉴스 콘텐츠의 장르정보를 관리하는 장르 관리부(240), 콘텐츠 장르내에서 사용자가 요청하는 키워드 및 연관 키워들간의 관계를 관리하는 키워드 관리부(250), 사용자가 요청한 키워드에 따른 뉴스 콘텐츠를 다양한 웹사이트에서 수집하는 콘텐츠 수집부(260), 수집된 콘텐츠에 대해 장르별 키워드 및 연관 키워드들에 대한 분석을 실시하는 콘텐츠 분석부(270), 수집된 뉴스 콘텐츠를 저장하고 주기적인 삭제처리를 담당하고, 필터링된 뉴스콘텐츠들을 재배포 하기 위한 콘텐츠 저장부(280), 필터링된 뉴스 목록을 전송하고 사용자가 요청한 콘텐츠를 전송하거나 사용자가 미확인한 콘텐츠 또는 새로운 관련 콘텐츠 등장시 이에 대한 알림기능을 전송하는 정보 전송부(230)을 포함한다.
도 4는 본 발명의 실시 예에 의한 사용자 단말 시스템(100)의 기능을 갖는 키워드 콘텐츠 검색부를 포함한 뉴스 콘텐츠를 생성하는 기자들이 사용하는 기사작성 시스템(300)의 기능 구성 블럭도이다.
본 발명의 실시예에 따라 뉴스콘텐츠를 생성하는 기자들이 사용하는 기사작성 시스템(300)은 뉴스콘텐츠를 생산하기 위한 시스템으로, 작성된 콘텐츠를 관리하고 통신망을 통해 배포하기 위하여 시스템에서 사용하는 코드체계를 관리하는 공통코드 관리부(310), 시스템에 접속하여 사용하는 사용자 정보를 관리하는 사용자 관리부(320), 기자 및 데스커, 파워데스커, 편집자, 작가 등의 분류에 따라 사용자가 속한 그룹의 권한을 관리하는 그룹권한 관리부(325), 뉴스기사를 생산하는 방송 본부가 지역별로 나뉘어져 있는 경우, 각 지역 방송본부의 정보를 관리하는 방송본부 관리부(330), 방송본부별 뉴스 방송 프로그램을 관리하는 프로그램 관리부(335), 연합뉴스나 외부 뉴스정보제공자에 의해 생산되는 뉴스콘텐츠를 수집하는 연합뉴스 수신부(340), 기자가 취재하는 분야나 관심 분야에 따른 장르별 뉴스 콘텐츠 동향과, 취재 대상이나 관심 키워드에 대한 필터링된 개인화된 뉴스 콘텐츠를 조회하고 관심키워드와 연관 키워드들 간의 관련성 및 새로이 대두 되는 키워드 정보의 흐름을 파악하기 위한 키워드 콘텐츠 검색부(350), 기사작성 시스템 내에서 작성된 뉴스콘텐츠들을 확인하기 위한 기사 검색부(360), 뉴스 콘텐츠를 생성하기 위한 기사 작성부(365), 작성된 뉴스 기사에 대해 데스커에 의한 승인처리기능을 수행하기 위한 데스크 편집부(370), 승인된 뉴스콘텐츠를 방송 프로그램에 편성하기 위한 뉴스대장 관리부(380), 이미지나 동영상 편집에 대한 정보를 공유하거나 뉴스 콘텐츠 제작에 필요한 요소들을 관리하기 위한 제작관리부(390)와 같은 기능을 포함한다.
도 5는 본 발명의 실시 예에 의한 뉴스콘텐츠의 장르, 키워드 및 연관 키워드 간의 정보의 갱신을 위한 관리 방법을 도시한 흐름도이다.
본 발명의 실시예에 따라 도 5에 도시하는 것처럼 뉴스콘텐츠 개인화 필터링 시스템(200)의 장르관리부(240), 키워드 관리부(250)에 의한 장르, 키워드 및 연관 키워드간의 정보 갱신을 위한 관리방법은 사용자가 입력한 뉴스콘텐츠 요청키워드(S100)가 사용자 요청 수집부(220)에 의해 인입되는 시점을 기준으로 시작된다.
요청된 키워드에 따라 콘텐츠 수집부(260)은 뉴스콘텐츠 개인화 필터링 시스템이 수집 가능한 각종 미디어지, 언론사 또는 검색포털, SNS사에서 제공하는 공개형 API, RSS, NewsML과 같이 접근 가능한 다양한 수집 가능한 방식을 이용하여 콘텐츠 수집부(260)에 의해 기사 본문 수집(S110)이라는 과정을 수행한다.
상기 방법에 의해 수집된 뉴스콘텐츠들의 기사 본문부를 파싱해서 걸러내는 기사본문 파싱(S120), 파싱한 기사의 뉴스콘텐츠 장르의 판단(S130), 장르별 연관키워드 분석(S140)은 콘텐츠 분석부(270)에 의해 수행되며, 콘텐츠 장르의 존재 여부에 대한 정보를 콘텐츠 분석부(270)에 전달하고 신규 추가가 필요한 경우 장르추가(S135)를 장르그룹(S180)에 추가하는 역활은 장르 관리부(240)가 담당한다.
콘텐츠 분석부(270)는 수집된 뉴스콘텐츠에 대해 장르별 연관키워드 분석(S140)을 수행하면서 키워드들에 대한 정보 갱신의 판단(S150)을 내리고 이에 대한 처리 정보를 키워드 관리부(250)에 전달하며, 키워드관리부(250)는 처리해야 할 정보에 언급된 키워드 정보의 갱신(S160), 키워드와 연관된 연관키워드의 재구성(S170)을 키워드 저장소(S190)에 반영하여 키워드와 연관키워드들의 정보를 유지하는 기능을 수행한다.
도 6은 본 발명의 실시 예에 의한 적합한 뉴스콘텐츠만을 필터링을 수행하기 위한 방법을 도시한 흐름도이다.
본 발명의 실시예에 따라 도 6에 도시하는 것처럼 뉴스콘텐츠 개인화 필터링 시스템의 콘텐츠 필터링 과정은 사용자가 입력한 뉴스콘텐츠 요청키워드(S200)가 사용자 요청 수집부(220)에 의해 인입되는 시점을 기준으로 시작된다.
요청된 키워드에 따라 뉴스콘텐츠 개인화 필터링 시스템(200) 내의 콘텐츠 수집부(260)에 의해 수집된 뉴스 콘텐츠는 콘텐츠 분석부(270)의 분석과정을 거치면 기사본문 분석기록(S210)이 결과물로 생성된다. 콘텐츠 분석부(270)는 이러한 분석기록을 토대로 콘텐츠적합성 측정(S220)을 수행하며, 이에 따라 선 필터링 처리(S230)을 수행한다.
선 필터링된 뉴스콘텐츠들은 콘텐츠 분석부(270)에 의해 해당 뉴스 장르에 적합한 콘텐츠인지 여부를 필터링 수준 판단(S240)에 의해 다시 한번 검증하게 된다. 이 과정에서 장르 콘텐츠 목록(S280)에 포함된 뉴스콘텐츠의 콘텐츠 선호지수 측정 데이터(S245)를 활용하여 필터링 수준이 뉴스콘텐츠 개인화 필터링 시스템(200)에 설정된 적정수치 값 이상인 경우 필터링된 콘텐츠만으로 콘텐츠 목록 재구성(S260)을 수행하며, 필터링 수준이 적정수치 값 미만인 경우 최종 필터링(S250)을 수행하여 기준치 이하의 뉴스콘텐츠를 다시 한번 필터링하여 콘텐츠 목록 재구성(S260)을 수행하게 된다.
콘텐츠 목록 재구성(S260) 프로세스가 목록페이지 생성(S270) 프로세스에 전달한 정보들로 최종 필터링된 개인화 뉴스 콘텐츠의 목록이 생성되는 처리 흐름을 갖으며 시스템을 이용하는 최종 사용자는 개인의 관심 장르와 요청한 키워드에 대해 최종 필터링된 목록페이지들로 구성된 뉴스 콘텐츠를 제공받을 수 있다.
일반적으로 항목그룹 간의 상관관계 계산에 자주 사용되는 피어슨 상관관계 계산식(수학식 1)은 항목 간 상관관계가 높으면 '1'에 가깝게 나타나고 상관관계가 반대의 성향을 띄면 '-1'에 가깝게 나타난다. 수학식 1을 키워드 간의 연관성 계산에 사용하는 경우 음수값의 상관계수가 자주 등장하고 수치편차가 높지 않으며, 0에 가까운 데이터가 많아 사용할 수 없는 데이터가 많아지기 때문에 연관성 계산에 적용하기 어렵다는 문제점이 발생한다.
Figure pat00001
본 발명의 실시예에 따라 뉴스콘텐츠 개인화 필터링 시스템(200)의 콘텐츠 분석부(270)는 아래의 수학식 2를 이용하여 임의의 키워드(m)과 동일 뉴스 콘텐츠 장르상의 다른 키워드(r) 사이의 연관 계수를 구하기 위한 전 단계로 본 발명에서 제안하는 수학식 2를 사용하여 사용자의 요청키워드(S200)인 키워드(m)과 임의의 다른 키워드(r)의 연관비율(Rratio, Relation Ratio)값의 계산을 수행한다.
Figure pat00002
연관비율 Rratio(km, kr)은 사용자의 요청키워드(S200)에 의해 수집된 모든 뉴스콘텐츠의 기사본문(FTF, Full Text Feed) 내에서 요청키워드(S200)인 키워드(m)의 빈도수에 대한 임의의 키워드(r)의 빈도수와 등장횟수의 비율을 의미하며, freq(km,∑FTF)은 모든 기사본문(FTF) 내의 키워드(m)의 빈도수, freq(kr,∑FTF)은 모든 기사본문(FTF) 내의 키워드(r)의 빈도수, apper(kr,∑FTF)은 요청키워드(S200)에 의해 수집된 모든 기사본문(FTF) 내의 키워드(r)의 등장횟수로 1개의 콘텐츠 안에 키워드(r)의 빈도수가 여러 번 발생하여도 등장횟수는 1로 계산한다. 예를 들어, 요청에 의해 수집된 콘텐츠가 100개이면 등장횟수는 최대 100개를 넘지 않는다.
콘텐츠 분석부(270)는 상기 수학식 2를 통해 특정 콘텐츠 장르 내의 키워드 간의 연관비율(Rratio) 값이 계산되면 본 발명에서 제안하는 수학식 3을 이용하여 최종적으로 키워드(m)과 키워드(r)의 연관 계수 RC(km, kr)을 계산한다.
Figure pat00003
상기 수학식 3에 의한 키워드(m)과 키워드(r)의 연관 계수 RC(km, kr)의 계산 결과값은 0이상 1이하의 값을 갖는다. 또한 동일 콘텐츠 장르 내의 동일한 키워드는 상호간의 연관계수 RC(km, kr) 값이 항상 1로 나타난다. 본 발명에서 제안하는 수학식 3을 이용하면 키워드 간의 연관계수는 0부터 1사이의 수치값으로 일목요연하게 정리가 된다는 장점을 가진다. 반면, 상기 수학식 1의 피어슨 상관계산식은 콘텐츠 내 등장하는 키워드 간의 빈도수와 등장횟수를 고려하지 않고 단순히 빈발 항목이 나타나는 트랜잭션이 일치하게 되면 유사도 계산 결과값이 극단적으로 높아짐으로 인하여 연관관계 계산효율이 현저히 낮아지는 문제점을 갖는다.
본 발명의 실시예에 따라 뉴스콘텐츠 개인화 필터링 시스템(200)은 콘텐츠 분석부(270)에서 수학식 2, 수학식 3에 의해 계산된 특정 콘텐츠 장르를 구성하는 키워드 간의 연관성 정보인 장르 내의 키워드 간의 연관비율(Rratio) 값, 장르 내의 키워드 간의 연관 계수 RC(km, kr) 정보를 키워드 관리부(250)에서 유지 관리한다.
도 6에 묘사된 필터링 수준 판단(S220)을 위하여 사용자가 요청한 요청키워드(S200)에 대해 생성된 콘텐츠의 적합성 측정(S220)은 본 발명에서 제안하는 다음 수학식 4에 의해 콘텐츠 적합성 체크(CSC, Content Suitability Check)값의 계산을 수행하여 선 필터링처리(S230) 과정의 단계를 진행한다.
Figure pat00004
사용자가 요청한 요청키워드(S200)인 키워드(m)에 대한 콘텐츠 적합성 측정(S220)과정은 상기 수학식 4의 콘텐츠 적합성 체크 CSC(km)에 의하여 콘텐츠 적합성이 높은지 여부에 대한 1차적인 계산을 수행하게 된다.
상기 수학식 4에 의해 계산되는 콘텐츠 적합성 체크 CSC(km)을 위해 사용되는 freq(km,SJ)는 생성된 콘텐츠 한 개에 대한 제목(Subject)내의 키워드(m)의 빈도수, freq(km, FTF)는 생성된 콘텐츠 한 개에 대한 기사본문(Full Text Feed) 내의 키워드(m)의 빈도수, ∑FTF(HRk)은 한 개의 기사본문 내의 키워드(m)과의 동일 장르 내 연관계수 RC(km, kr)의 수치가 '0.3'이상의 값을 갖는 연관계수가 높은 키워드의 수의 합을 이용하여 측정한다.
본 발명의 실시예에 따라 상기 수학식 4의 콘텐츠 적합성 체크 CSC(km)의 계산값이 적어도 '1' 이상인 경우가 콘텐츠 적합성이 높은 콘텐츠들로 판별되며, 이러한 과정을 수행하여 사용자의 요청키워드(S200)로 뉴스 콘텐츠들을 수집하였을 때, 뉴스 기사의 제목에 질의 키워드가 나타나지 않는 경우와 기사 본문 내에서 요청 키워드와 연관성이 높은 키워드들이 나타나지 않는 경우의 연계성을 조사하여 뉴스 콘텐츠의 내용이 전혀 상이한 경우를 적합성 기준에 의해 필터링 할 수 있다.
도 6에 묘사된 콘텐츠 선호지수 측정 데이터(S245)를 측정하기 위하여 본발명은 제안하는 아래 수학식 5를 사용하였다. 수학식 5의 CCP(km)은 키워드(m)에 대한 동일 장르 내 생성된 콘텐츠 채널의 콘텐츠 선호지수(CCP, Channel Contents Preference)를 의미한다.
본 발명의 실시예에 따라 '채널'이란 동일한 장르 내에서 요청키워드들로 생성되는 콘텐츠들의 집합을 의미한다.
따라서, 채널은 한 개의 뉴스 장르에 대하여 여러 개의 하위 집합이 구성될 수 있다. 예를 들어 '스포츠'라는 뉴스 장르에 대해서, 축구, 배구, 농구, 올림픽과 같은 서브 채널이 구성될 수 있으며, 각 채널들은 해당 장르 내에서 상호 독립적인 연관키워드 집합을 유지할 수 있다.
사용자 여러 명이 상호 연관 키워드를 요청한 경우 수집되거나 필터링되는 뉴스콘텐츠들은 키워드 간의 연관성에 따라 채널을 구성하는 뉴스 콘텐츠들 간의 중복된 콘텐츠 구성이 발생할 수 있으며 상호 연관성이 현저히 낮은 키워드인 경우 동일 장르를 구성하는 키워드라고 하더라도, 채널을 구성하는 뉴스콘텐츠들이 타 채널과는 전혀 다른 콘텐츠들로 구성될 수 있다.
Figure pat00005
상기 수학식 5는 본 발명에서 제안하는 채널 콘텐츠 선호지수(CCP)를 계산하기 위한 수식으로, ∑RRkr는 사용자들이 해당 장르 내에서 특정 채널에서 최근 빈번히 요청(Recently Requested)한 키워드의 갯수를 의미하며, ∑CCkg 는 특정 뉴스 장르내에 요구키워드에 의해 생성된 채널의 개수, ∑GTk는 특정 장르를 구성하는 전체 키워드의 수, freq(km, ∑FTF)는 생성된 하나의 채널 상의 모든 기사본문 내의 키워드(m)의 빈도수, MaxCCP는 현재 생성된 채널에서 채널 콘텐츠 선호지수의 최대값을 의미한다.
상기 수학식 5를 통해 채널 콘텐츠 선호지수 측정데이터(S245)는 모든 기사본문 내의 키워드(m)의 빈도수, 해당 뉴스 콘텐츠 장르 내에서 요청키워드(S200)에 의해 생성된 수집된 채널의 수와 사용자 그룹들이 해당 뉴스 장르에 대해 최근에 빈번히 요청한 키워드, 사용자가 선택한 선호 키워드의 수에 따라 그 채널이 사용자가 선호하는 내용이 많이 담겨 있는지 측정할 수 있다.
본 발명의 실시예에 따라 뉴스콘텐츠 장르의 구성은 정치, 경제, 스포츠 등과 같은 1차 대분류보다 2차, 3차, 4차까지의 Depth를 가지도록 세분화하여, 스포츠 중에 '프로야구', 그중에 'MLB', '국내프로야구'와 같이 세분화된 장르의 구성이 될수록 본 연구에서 제시하는 방법에 의한 뉴스 콘텐츠 필터링 효과의 효율성을 극대화할 수 있다.
이상에서 본 발명의 실시예는 한정된 실시예와 도면에 의하여 설명하였으나, 본 실시예가 속한 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술과 사상의 본질적인 특성을 벗어나지 않는 범위에서 다양한 수정과 변형이 가능할 것이다. 따라서, 본 발명의 실시예는 본 발명의 실시예의 기술과 사상을 설명하기 위한 것이고, 본 발명의 실시예로 기술 사상의 범위가 한정되는 것이 아니다. 본 실시예의 보호범위는 아래 기록된 청구범위에 의해 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 실시예의 권리범위에 포함하는 것으로 해석되어야 할 것이다.
100 : 사용자 단말 시스템 110: 사용자 기본정보 설정부
120 : 단말 디스플레이부 130: 관심 수신처 설정부
140 : 관심 장르 설정부 150: 관심 키워드 설정부
160 : 사용자 액션 전송부 200: 뉴스콘텐츠 개인화 필터링 시스템
210 : 사용자 관리부 220: 사용자 요청 수집부
230 : 정보 전송부 240: 장르 관리부
250 : 키워드 관리부 260: 콘텐츠 수집부
270 : 콘텐츠 분석부 280: 콘텐츠 저장부
300 : 기사작성 시스템 310: 공통코드 관리부
320 : 사용자 관리부 325: 그룹권한 관리부
330 : 방송본부 관리부 335: 프로그램 관리부
340 : 연합뉴스 수신부 350: 키워드 콘텐츠 검색부
360 : 기사 검색부 365: 기사 작성부
370 : 데스크 편집부 380: 뉴스대장 관리부
390 : 제작 관리부

Claims (21)

  1. 키워드 분석을 이용한 뉴스콘텐츠들의 개인화 필터링 시스템에 있어서,
    뉴스 콘텐츠 개인화 필터링 시스템이 수집 가능한 각종 미디어지, 언론사 또는 검색포털, SNS(Social Network Service)사에서 제공하는 공개형 API(Application Programming Interface), RSS(Really Simple Syndication), NewsML(News Markup Language)과 같은 형태의 수신처를 정보를 사용자 단말 시스템에 설정하는 관심 수신처 설정부;
    상기 사용자 단말 시스템에서 선택한 관심 수신처들로부터 수집된 내용들을 뉴스 콘텐츠 개인화 필터링 시스템이 사용자 단말 시스템으로 제공해야 할 뉴스콘텐츠에 대한 사용자 관심 장르를 설정하는 관심장르 설정부;
    상기 관심장르 설정부에 선택한 관심장르 내의 사용자의 관심 키워드들을 입력하거나 선택 설정하는 관심키워드 설정부;
    개인화 필터링 된 뉴스콘텐츠들과 요청키워드와 연관 키워드들 간의 관계를 사용자 단말 시스템에 디스플레이하는 단말 디스플레이부; 및
    필터링되어 제공된 뉴스콘텐츠들에 대한 사용자의 액션정보를 전송하는 사용자 액션 전송부를 포함하는 사용자 단말 시스템.
  2. 제 1 항에 있어서,
    상기 관심 수신처 설정부는 뉴스 콘텐츠 개인화 필터링 시스템의 콘텐츠 수집부에 유지관리되는 수집 가능한 외부 뉴스콘텐츠 제공자의 정보에 의거하여 사용자가 개인의 관심 수신처 정보를 설정할 수 있도록 하는 기능을 특징으로 하는 사용자 단말 시스템.
  3. 제 1 항에 있어서,
    상기 관심장르 설정부는 뉴스 콘텐츠 개인화 필터링 시스템의 장르 관리부에 유지관리되는 뉴스콘텐츠 장르정보 체계에 의거하여 사용자가 뉴스콘텐츠의 관심장르를 설정할 수 있도록 하는 기능을 특징으로 하는 사용자 단말 시스템.
  4. 제 1 항에 있어서,
    상기 관심키워드 설정부는 뉴스 콘텐츠 개인화 필터링 시스템의 키워드 관리부에 유지관리되는 사용자의 뉴스콘텐츠 관심 장르 내의 키워드 구성 정보 및 연관키워드 정보 또는 사용자가 새로 추가하는 관심키워드들의 정보를 입력, 변경할 수 있도록 사용자가 뉴스콘텐츠의 관심 키워드들을 설정할 수 있도록 하는 기능을 특징으로 하는 사용자 단말 시스템.
  5. 제 1 항에 있어서,
    상기 사용자 액션 전송부는 사용자가 단말 시스템에 로그인하여 기 등록한 관심키워드 또는 신규 요청키워드에 의해 뉴스 콘텐츠 개인화 필터링 시스템이 필터링 하여 제공한 뉴스콘텐츠 정보들에 대한 사용자의 요청 순서, 만족도 설정, 콘텐츠 재방문 횟수 등의 사용자의 액션 정보를 뉴스 콘텐츠 개인화 필터링 시스템의 사용자 관리부 및 사용자 요청 수집부에 전송하는 기능을 특징으로 하는 사용자 단말 시스템.
  6. 제 1 항에 있어서,
    상기 단말 디스플레부는 사용자가 기 등록한 관심키워드 또는 신규 요청키워드에 의해 뉴스 콘텐츠 개인화 필터링 시스템이 필터링하여 제공한 뉴스콘텐츠 정보들의 목록을 디스플레이하는 기능, 목록의 기사제목을 클릭 시 기사내용을 디스플레이하는 기능, 제공되는 뉴스 콘텐츠와 뉴스 콘텐츠의 장르를 구성하는 키워드들의 정보, 사용자의 관심키워드로 설정된 키워드로 생성된 뉴스콘텐츠에 대한 관심키워드와 연관키워드의 연관계수들을 디스플레이 화면에 표현하는 기능을 특징으로 하는 사용자 단말 시스템.
  7. 키워드 분석을 이용한 뉴스콘텐츠들의 개인화 필터링 시스템에 있어서,
    사용자의 관심장르와 관심 키워드에 따른 요청키워드를 관리하며 요청에 따른 하위 처리과정들에 대한 수행 여부의 결정 및 요청에 따라 제공된 뉴스콘텐츠들과 연관키워드들에 대한 사용자 액션정보를 수집하는 사용자 요청 수집부;
    상기 사용자 요청 수집부로 수집된 요청키워드에 대한 하위 프로세스들의 일련의 처리과정 중 수집 가능한 각종 미디어지, 언론사 또는 검색포털, SNS사에서 제공하는 공개형 API, RSS, NewsML과 같은 형태의 수신처로부터 요청키워드와 관련된 뉴스 콘텐츠의 정보를 수집하는 콘텐츠 수집부;
    상기 콘텐츠 수집부가 수집한 뉴스콘텐츠들에서 기사장르, 세부장르, 작성자정보, 기사제목 및 기사본문영역을 파싱하여 추출하고, 추출된 내용에 대한 요청키워드 및 연관 키워드들에 대한 분석을 담당하며, 분석 결과에 따른 키워드간 연관계수를 산출하고, 콘텐츠 적합성을 계산하여 콘텐츠 필터링을 수행하는 콘텐츠 분석부;
    상기 콘텐츠 수집부가 수집한 뉴스콘텐츠들을 저장관리하고, 보유기간이 지난 수집 콘텐츠들을 삭제 정리하며, 콘텐츠 분석부에 의해 필터링 된 요청키워드로 생성된 채널구성 뉴스콘텐츠들을 유지관리하는 콘텐츠 저장부;
    상기 사용자 요청 수집부로 요청된 키워드들에 대한 장르 구성을 결정 짓고, 콘텐츠 수집부가 수집한 콘텐츠들의 분석 정보를 바탕으로 장르 정보를 유지관리하는 장르 관리부;
    상기 장르 관리부의 세부 장르 구성에 따른 소속 키워드들의 정보와 요청 키워드에대한 뉴스콘텐츠 채널구성 정보, 요청키워드와 연관키워드들의 정보 및 상호간의 연관계수들을 정보의 흐름에 따라 유지관리하는 키워드 관리부; 및
    상기 콘텐츠 저장부에 저장된 필터링된 뉴스콘텐츠 정보, 장르 구성 정보, 장르와 그 하위에 생성된 뉴스콘텐츠 채널의 구성 키워드들의 정보 및 사용자 요청키워드와 연관 키워드들에 대한 정보들을 전송하는 정보 전송부를 포함하는 뉴스 콘텐츠 개인화 필터링 시스템.
  8. 제 7 항에 있어서,
    상기 사용자 요청 수집부는 뉴스 콘텐츠 개인화 필터링 시스템에 인입된 사용자의 관심장르 선택 정보와 관심 키워드에 따른 요청키워드를 관리하며 요청에 따른 하위 처리과정들에 대한 수행 여부를 장르관리자에 유지관리되는 장르정보 존재 여부 비교, 키워드관리자에 유지관리 되는 키워드 정보와 비교 및 중복 요청의 여부, 앞 선 다른 요청에 의해 이미 수집되고 필터링되어 기생성된 콘텐츠 채널(=콘텐츠 집합)이 존재하는지 여부, 기생성된 콘텐츠 채널의 생성된 시간을 종합 비교하여 결정하는 것을 기능을 특징으로 하는 뉴스 콘텐츠 개인화 필터링 시스템.
  9. 제 7 항에 있어서,
    상기 콘텐츠 수집부는 수집된 요청키워드에 대한 하위 프로세스들의 일련의 처리과정 중 하나인 자료 수집을 담당하는 기능으로, 통신망을 통해 접근 가능한 각종 미디어지, 언론사 또는 검색포털, SNS사에서 제공하는 공개형 API, RSS, NewsML과 같은 형태의 다양한 수신처로부터 요청키워드와 관련된 뉴스 콘텐츠의 정보룰 수집하는 것을 기능을 특징으로 하는 뉴스 콘텐츠 개인화 필터링 시스템.
  10. 제 7 항에 있어서,
    상기 콘텐츠 분석부는 콘텐츠 수집부가 수집한 뉴스콘텐츠들에서 기사장르, 세부장르, 작성자정보, 기사제목 및 기사본문영역을 파싱하여 추출하고, 추출된 내용에 대한 요청키워드 및 연관 키워드들에 대한 분석, 분석 결과에 따른 키워드간 연관계수를 수학식 2, 수학식 3을 이용한 수치적인 계산에 의해 수행하며 수학식 4를 이용하여 콘텐츠 적합성을 측정하여 뉴스 콘텐츠의 선 필터링 처리하고, 생성된 필터링 결과물들에 대한 콘텐츠 선호지수를 수학식 5를 통해 수행하여 결과물들에 대한 필터링 수준을 재검증하여 최종 필터링을 수행하는 기능을 특징으로 하는 뉴스 콘텐츠 개인화 필터링 시스템.
  11. 제 7 항에 있어서,
    상기 콘텐츠 저장부는 콘텐츠 수집부가 수집한 뉴스콘텐츠들을 저장관리하고, 보유기간이 일정기간 지난 수집 콘텐츠들을 삭제 정리하며, 사용자의 요청키워드에 대해 콘텐츠 분석부에 의해 필터링 된 최종적인 채널구성 뉴스콘텐츠들을 유지관리하는 기능을 특징으로 하는 뉴스 콘텐츠 개인화 필터링 시스템.
  12. 제 7 항에 있어서,
    상기 장르 관리부는 사용자 요청 수집부로 요청된 뉴스장르 및 키워드들에 대한 장르 구성을 결정 짓고, 콘텐츠 수집부가 수집한 콘텐츠들의 장르 정보를 유지관리하며, 콘텐츠 분석부에 의한 수집된 뉴스콘텐츠들의 분석과정에서 새로 추가되는 뉴스 장르에 대한 장르 추가, 장기간 동안 사용자 요청이 없는 장르에 대한 삭제 관리 등 뉴스 콘텐츠의 장르에 대한 유지관리 기능을 특징으로 하는 뉴스 콘텐츠 개인화 필터링 시스템.
  13. 제 7 항에 있어서,
    상기 키워드 관리부는 세부 뉴스 콘텐츠 장르 구성에 따른 소속 키워드들의 정보와 사용자 요청키워드에 의한 뉴스콘텐츠 채널구성 정보, 연관키워드들의 정보 및 상호 간의 연관계수들을 정보들을 시간의 흐름에 따라 지속적인 변경 및 유지관리를 담당하는 기능을 특징으로 하는 뉴스 콘텐츠 개인화 필터링 시스템.
  14. 제 7 항에 있어서,
    상기 정보 전송부는 콘텐츠 저장부에 저장된 필터링된 뉴스콘텐츠 정보, 장르 관리부에 의해 유지관리되는 뉴스콘텐츠들의 장르정보, 장르 내 구성 키워드들의 정보, 사용자 요청키워드에 생성된 장르내에 생성된 뉴스콘텐츠 채널의 정보, 생성된 채널 콘텐츠집합에서의 사용자 요청키워드와 연관 키워드들에 대한 정보들을 전송하는 기능을 특징으로 하는 뉴스 콘텐츠 개인화 필터링 시스템.
  15. 키워드 분석을 이용한 뉴스콘텐츠들의 개인화 필터링 시스템에 있어서,
    뉴스콘텐츠를 생산하는 기자들이 개인의 취재분야에 대한 관심 장르 및 관심 취재대상을 관심 키워드로 설정하여 제 1항의 사용자 단말시스템의 기능을 포괄하는 키워드 콘텐츠 검색부; 및
    상기 키워드 콘텐츠 검색부에 의해 개인화 필터링되어 제공되는 뉴스 콘텐츠들을 기사 작성화면으로 불러오기 하여 불러온 기사를 작성, 편집, 저장, 송고할 수 있는 인용보도 기능이 포함된 기사 작성부를 포함하는 기사작성 시스템.
  16. 제 15 항에 있어서,
    상기 키워드 콘텐츠 검색부는 뉴스콘텐츠를 생산하는 기자들이 개인의 취재분야에 대한 관심수신처를 설정하고, 관심 장르 및 관심 취재대상을 관심 키워드로 설정하여 수분 단위로 갱신되는 관심 장르의 주요 이슈와 관심 키워드에 대한 필터링된 뉴스콘텐츠 정보를 제공 받을 수 있도록 하는 제 1 항의 사용자 단말시스템의 기능을 모두 포괄하는 기능을 특징으로 하는 기사작성 시스템.
  17. 제 15 항에 있어서,
    상기 기사 작성부는 연합뉴스 수신부에 의해 수신된 기사를 기사작성 창으로 불러오기 하여 인용보도를 작성할 수 있는 기능 외에 키워드 콘텐츠 검색부의 조회기능을 통하여 외부 관심 수신처들로부터 수집된 뉴스 콘텐츠들을 제 7 항의 뉴스콘텐츠 개인화 필터링 시스템에 의해 관심 장르, 관심 키워드 및 요청키워드들에 대하여 필터링된 뉴스콘텐츠들을 기사 작성화면으로 불러오기 하여 불러온 기사를 작성, 편집, 저장, 송고할 수 있는 인용보도 작성기능이 포함된 것을 특징으로 하는 기사작성 시스템.
  18. 키워드 분석을 이용한 뉴스콘텐츠들의 개인화 필터링 시스템에 있어서,
    뉴스 콘텐츠들의 분석을 위한 과정으로 사용자의 요청키워드에 의해 수집된 모든 뉴스콘텐츠의 기사본문 내에서 요청키워드인 키워드의 빈도수에 대한 임의의 키워드의 빈도수와 등장횟수의 비율을 계산하여 요청키워드로 수집된 정보 내에서 임의의 키워드의 발생 빈도수 외 등장횟수를 이용하여 상호 간의 연관비율을 측정하는 방법; 및
    수학식 2를 활용한 요청키워드와 임의의 키워드 간 연관비율(Relation Ratio)의 계산하는 방법;
  19. 키워드 분석을 이용한 뉴스콘텐츠들의 개인화 필터링 시스템에 있어서,
    뉴스 콘텐츠들의 분석을 위한 과정으로 사용자의 요청키워드에 의해 수집된 모든 뉴스콘텐츠의 기사본문 내에서 요청키워드의 빈도수 합, 모든 기사본문 내의 요청키워드와 동일 장르 구성을 갖는 임의의 키워드의 빈도수 합, 요청키워드에 의해 수집된 모든 기사본문 내의 임의의 키워드의 등장횟수로 하나의 요청키워드에 의해 수집되는 모든 콘텐츠들을 조사하여 요청키워드와 임의의 키워드간의 연관계수를 측정하여 요청키워드들과 임의의 키워드들간의 연관계수를 0부터 1사이의 값으로 정량화 하는 방법; 및
    수학식 3에 의한 요청 키워드와 임의의 다른 등장 키워드의 연관 계수를 계산하는 방법.
  20. 키워드 분석을 이용한 뉴스콘텐츠들의 개인화 필터링 시스템에 있어서,
    뉴스 콘텐츠들의 분석을 위한 과정으로 사용자의 요청키워드에 의해 수집된 모든 뉴스콘텐츠들에 대하여 콘텐츠 적합성을 측정하기 위하여 생성된 콘텐츠 한 개에 대한 제목(Subject)내의 요청키워드의 빈도수, 생성된 콘텐츠 한 개에 대한 기사본문내의 요청키워드의 빈도수, 한 개의 기사본문 내의 요청키워드와 동일 장르 내 임의의 키워드간의 연관계수를 이용한 콘텐츠 적합성 체크 값을 계산하여 수치적으로 정량화 하여 콘텐츠 적합성을 검증하기 위한 방법 및 이를 이용한 콘텐츠 필터링 방법;
    수학식 4에 의해 콘텐츠 적합성 체크를 수행하여 콘텐츠를 필터링 하는 방법.
  21. 키워드 분석을 이용한 뉴스콘텐츠들의 개인화 필터링 시스템에 있어서,
    뉴스 콘텐츠들의 분석을 위한 과정으로 특정 뉴스콘텐츠 장르 및 장르내에 세분화되어 생성된 특정 뉴스콘텐츠 채널에서 사용자들이 최근 빈번히 요청한 키워드의 갯수, 특정 뉴스콘텐츠 장르 내에 요구키워드에 의해 생성된 채널의 개수, 특정 장르를 구성하는 전체 키워드의 수, 생성된 하나의 채널 상의 모든 기사본문 내의 요청키워드의 빈도수, 현재 생성된 채널에서 채널 콘텐츠 선호지수의 최대값을 사용하여 채널 콘텐츠 선호지수 측정데이터를 계산하는 방법 및 이를 이용하여 요청키워드에 의해 생성된 뉴스콘텐츠 채널이 사용자가 선호하는 내용이 많이 담겨 있음을 측정하는 방법 이를 이용하여 콘텐츠 필터링을 수행하는 방법;
    수학식 5에 의해 개별 콘텐츠의 콘텐츠 선호지수를 측정하여 필터링 하는 방법;
KR1020160040854A 2016-04-04 2016-04-04 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법 KR20170114321A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160040854A KR20170114321A (ko) 2016-04-04 2016-04-04 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160040854A KR20170114321A (ko) 2016-04-04 2016-04-04 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법

Publications (1)

Publication Number Publication Date
KR20170114321A true KR20170114321A (ko) 2017-10-16

Family

ID=60295938

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160040854A KR20170114321A (ko) 2016-04-04 2016-04-04 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR20170114321A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190105276A (ko) * 2018-03-05 2019-09-17 네이버 주식회사 검색어 기반 컨텐츠 구독을 지원하는 방법 및 시스템
KR102228737B1 (ko) * 2020-06-17 2021-03-17 주식회사 푸시뉴스 Ai를 이용한 가짜뉴스 판독 방법 및 장치
KR20210052604A (ko) * 2019-10-29 2021-05-11 한국전자기술연구원 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법
CN117216132A (zh) * 2023-11-09 2023-12-12 厦门达宸信教育科技有限公司 一种数学试题相似性判断方法、系统和应用

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190105276A (ko) * 2018-03-05 2019-09-17 네이버 주식회사 검색어 기반 컨텐츠 구독을 지원하는 방법 및 시스템
KR20210052604A (ko) * 2019-10-29 2021-05-11 한국전자기술연구원 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법
KR102228737B1 (ko) * 2020-06-17 2021-03-17 주식회사 푸시뉴스 Ai를 이용한 가짜뉴스 판독 방법 및 장치
WO2021256884A1 (ko) * 2020-06-17 2021-12-23 주식회사 푸시뉴스 Ai를 이용한 가짜뉴스 판독 방법 및 장치
CN117216132A (zh) * 2023-11-09 2023-12-12 厦门达宸信教育科技有限公司 一种数学试题相似性判断方法、系统和应用
CN117216132B (zh) * 2023-11-09 2024-02-23 厦门达宸信教育科技有限公司 一种数学试题相似性判断方法、系统和应用

Similar Documents

Publication Publication Date Title
Yin et al. LCARS: A spatial item recommender system
US9552555B1 (en) Methods, systems, and media for recommending content items based on topics
Szomszor et al. Semantic modelling of user interests based on cross-folksonomy analysis
TWI636416B (zh) 內容個人化之多相排序方法和系統
KR101166130B1 (ko) 컨텐츠 태그를 이용하여 사용자 프로파일을 구성하는 방법및 장치, 그리고 생성된 사용자 프로파일을 이용하여컨텐츠를 추천하는 방법
RU2627717C2 (ru) Способ и устройство для автоматического генерирования рекомендаций
Khabiri et al. Summarizing user-contributed comments
Hopfgartner et al. Semantic user profiling techniques for personalised multimedia recommendation
CN110232126B (zh) 热点挖掘方法及服务器和计算机可读存储介质
KR20170114321A (ko) 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법
KR101450453B1 (ko) 컨텐츠 추천 방법 및 장치
KR100836877B1 (ko) 연구개발 환경정보를 이용한 미래 시그널 및 이슈 도출시스템 및 그 방법
KR101567551B1 (ko) 콘텐츠 추천을 위한 소셜 데이터 분석 시스템
CN103842997A (zh) 搜索和创建自适应内容
Sánchez-Moreno et al. Inferring user expertise from social tagging in music recommender systems for streaming services
JP3964728B2 (ja) 情報検索方法及びその装置、並びに該方法の実行プログラム及び該方法の実行プログラムを記録した記録媒体
Billsus et al. Revising user profiles: The search for interesting web sites
Yeung et al. Context-aware news recommender in mobile hybrid P2P network
Jain et al. Video recommendation system based on human interest
Alotaibi et al. Trust-based recommendations for scientific papers based on the researcher’s current interest
Zhu et al. User interest modeling and self-adaptive update using relevance feedback technology
US20150058307A1 (en) Device for rapid provision of information
JP4745993B2 (ja) 意識体系構築装置および意識体系構築プログラム
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
KR101547912B1 (ko) 진화하는 지식지도 서비스 제공 방법 및 시스템