KR20050074058A - 인터넷상에서 기사를 자동분류하여 타 웹사이트에자동송출하는 시스템 및 그 제어방법 - Google Patents

인터넷상에서 기사를 자동분류하여 타 웹사이트에자동송출하는 시스템 및 그 제어방법 Download PDF

Info

Publication number
KR20050074058A
KR20050074058A KR1020040002276A KR20040002276A KR20050074058A KR 20050074058 A KR20050074058 A KR 20050074058A KR 1020040002276 A KR1020040002276 A KR 1020040002276A KR 20040002276 A KR20040002276 A KR 20040002276A KR 20050074058 A KR20050074058 A KR 20050074058A
Authority
KR
South Korea
Prior art keywords
article
module
metadata
automatically
data
Prior art date
Application number
KR1020040002276A
Other languages
English (en)
Other versions
KR100616152B1 (ko
Inventor
채광기
Original Assignee
주식회사 이뉴스네트웍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이뉴스네트웍 filed Critical 주식회사 이뉴스네트웍
Priority to KR1020040002276A priority Critical patent/KR100616152B1/ko
Publication of KR20050074058A publication Critical patent/KR20050074058A/ko
Application granted granted Critical
Publication of KR100616152B1 publication Critical patent/KR100616152B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0272Period of advertisement exposure
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 오프라인상의 기사를 데이터화하여 상기 기사를 자동으로 분류, 편집하여 타 웹사이트에 전송하는 것으로 오프라인의 기사를 입력하는 기사입력 클라이언트와, 상기 기사입력 클라이언트에 입력된 기사정보를 메타데이터로 변환하고 코드매핑하는 연동서버와, 상기 연동서버의 메타데이터를 가공서버에서 분류, 편집 프로그램을 이용하여 가공하는 가공서버와, 상기 가공서버에서 가공된 기사데이터를 타 웹사이트에 전송하는 송출모듈과, 상기 송출모듈을 통하여 메타데이터를 전송받는 웹사이트로 구성됨으로써 1일 수천건 이상 대량의 뉴스 콘텐츠를 실시간으로 업데이트가 가능한 효과가 있고 콘텐츠를 자동 분류하고 편집하여 시간, 비용이 절감하는 효과가 있고, 다양한 포맷의 콘턴츠를 쉽게 조합 가능한 효과가 있고 기사정보를 체계적으로 관리하고 활용하는 뛰어난 효과가 있다.

Description

인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 시스템 및 그 제어방법 {System for automatically sending to other web site news automatically classified on internet, and control method thereof}
본 발명은 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 시스템 및 그 제어방법에 관한 것으로 더욱 상세하게는 각종 사건에 대한 기사를 개인용 컴퓨터의 기사작성기 프로그램에 의하여 기사 작성 및 웹 상에서 기사를 작성하여 작성된 자료를 수집하고 수집된 기사데이터를 분석해 메타데이터를 생성한 다음 용도에 맞게 토픽, 키워드, 시소러스로 분류하여 편집하고 편집된 기사데이터를 타 웹사이트에 송출하는 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 시스템 및 그 제어방법에 관한 것이다.
종래의 온라인상의 기사 수집 및 평가 시스템 및 그 제어방법에 관한 대한민국공개특허공보 10-2003-0089026호는 특정 사건에 대한 기사 또는 보도내용을 담은 컨텐츠를 수집, 관리하여 인터넷을 통해 불특정인에게 제공하고 그에 대한 항목별 평가를 통하여 기사내용, 언론기관의 비평 및 평가를 수행함으로써, 언론에 대한 감시 및 공정한 평가를 가능하게 하는 시스템 및 그 방법에 관한 것으로 기사수집자 클라이언트 시스템으로부터의 요청에 따라 상기 언론기관 서버로부터 해당되는 기사정보를 추출하여 저장하는 기사 검색/수집 모듈과; 상기 검색/수집된 기사정보를 저장하는 기사정보 데이터베이스와; 상기 평가대상 선정자 클라이언트 시스템으로부터의 입력을 기초로 상기 수집된 기사 중 평가대상 기사를 특정하는 평가대상 선정 모듈과; 상기 평가대상 기사정보를 디스플레이하고 상기 평가자 클라이언트 시스템으로부터의 평가입력을 기초로 각 기사정보에 대한 평가결과를 산출하여 디스플레이하는 평가 모듈; 및 상기 평가결과를 저장하는 평가결과 데이터베이스로 구성되는 기사수집 및 평가 시스템이 있었다.
그러나 상기 종래의 기술은 단편적인 기사 내용을 웹상에 등록하여 기사내용을 웹페이지로 표현하는 것에 불과하여 검색의 정확도가 떨어지는 문제점이 있고 기사내용을 타 웹사이트에 동시에 배포하지 못하는 문제점이 있고 기사를 분류하는 기준이 명확하지 못하여 기사내용을 추출하는데 어려운 문제점이 있었다.
따라서, 본 발명은 상기 문제점을 해결하기 위하여 안출된 것으로 본 발명의 목적은 특정 토픽에 대한 정확도를 높여 상기 토픽을 자동분류하고 언론사로부터 전송받은 기사를 코드화하고 키워드 자동추출기를 이용하여 기존의 검색엔지과 차별적인 다중조건으로 정확성이 보장되는 기사를 타 웹사이트에 전송하는 기사전송 시스템 및 그 제어방법을 제공하는데 있다.
상기 본 발명의 목적을 달성하기 위한 본 발명은 기사입력 프로그램이 설치되고 상기 기사입력 프로그램을 수단으로 기사정보를 입력하여 기사데이터를 생성하는 기사입력 클라이언트와, 상기 기사데이터를 전송받아 분류, 편집, 송출하기 유용한 메타데이터로 변환하는 연동서버와, 자동분류 프로그램, 자동편집 프로그램, 자동 뉴스셋 데몬, 자동 모듈 갱신 데몬이 설치되어 상기 메타데이터를 가공하는 가공서버와, 상기 가공서버에서 가공된 메타데이터를 검색키에 맞게 모듈화시켜 데이터를 구축하여 다수의 타 웹페이지에 전송하는 송출모듈과, 상기 송출모듈에서 데이터를 전송받아 기사내용을 웹페이지에 실시간 배치 및 표현하는 웹 페이지로 이루어지고 상기 구성요소를 이용하여 기사작성 프로그램이 설치된 기사입력 클라이언트를 수단으로 기사정보를 입력하여 연동서버에 전송하는 단계와, 연동서버는 수신받은 기사데이터를 메타데이터로 변환하여 코드메핑하여 가공서버로 전송하는 단계와, 가공서버에 전송된 메타데이터는 가공서버에 설치된 분류프로그램, 편집프로그램에 의해서 메타데이터를 가공하는 단계와, 가공된 메타데이터는 송출모듈에서 검색키에 맞게 모듈별로 분류되어 타 웹사이트에 실시간 웹페이지 지면을 변경 및 기사정보를 표현하는 단계(S40)로 이루어져 인터넷상에서 기사를 자동분류하여 타 웹페이지에 자동송출하는 시스템 및 그 제어방법을 제공함으로써 달성하였다.
우선, 본 발명은 컴퓨터, 서버, 인터넷, 네트워크를 이용하여 기사라는 특정분야에 관한 발명으로 본 발명을 이해하기 위한 특정 용어를 설명하면 하기와 같다.
토픽 : 기사 분류의 최소 단위로 모든 기사가 반드시 가져야 하는 속성으로서 분류의 최소 단위이며 토픽은 토픽의 내용에 따라 레벨을 가지고 최대 3레벨까지 구성한다.
토픽셋 : 토픽의 분류 집합으로 토픽셋은 특정 부류의 토픽을 포함하고 최초의 분류 단계를 나타내는 것이다.
사이트 : 고객사를 1레벨 디렉토리로 뉴시스, 네이트와 같은 하나의 독립적으로 운영되는 사이트를 나타내는 것이다.
디렉토리 : 논리적인 파일 저장소(Registry)의 개념으로 사이트에 종속적이므로 사이트(고객사)별로 디렉토리가 관리되고 트리구조로 생성되며, 구조로 파일 시스템에 폴더가 생성되는 것이다.
링크 라이브러리 : 여러개의 사이트에서 모듈을 공유할 경우 동적링크가 가능해야 하며 모듈과 폴더 사이에 연결고리가 필요하고 상기 연결고리 역할을 링크 라이브러리가 담당한다. 그 관계는 폴더 →링크라이브러리 →뉴스셋 →모듈이며 링크유형은 모듈 →아이템, 제목 →아이템, 타이틀 →아이템인 것이다.
모듈 : 아이템의 최소구성단위로 프리젠테이션 부분이고 모듈을 타입별로 나누면 뉴스모듈, 인터페이스모듈, 사용자정의모듈로 구성되고 상기 뉴스모듈, 인터페이스모듈, 사용자정의모듈은 HTML소스를 그대로 등록한다. 보다 상세히 설명하면 상기 뉴스모듈은 뉴스와 관련되는 모듈로서 다른 모듈과 여러 가지 면에서 구분되는 모듈이고, 인터페이스 모듈은 로고와 같이 인터페이스와 관련된 모듈이고, 메뉴모듈은 메뉴와 관련된 모듈이고, 사용자정의모듈은 프로그램이 들어가는 모듈로서 사용자 필요에 의해 정의한 모듈인 것이다.
아이템 : 아이템 = 섹션 = 모듈 컨테이너라는 등식이 성립하고 그 관계는 아이템 - 디렉토리 - 사이트이고 아이템(페이지)을 생성하고, 모듈들을 적절한 위치에 배치한다.
또한, 상기 아이템은 껍질파일이 존재하고 상기 껍질파일은 타입별로 존재하며 껍질파일의 링크는 상기 껍질파일 사이에서 이루어지고 껍질파일에서는 LinkID, ArticleID 값을 받아서 동적으로 링크하는 것이다.
데스크 : 기사를 편집/분류하는 작업을 수행할 수 있는 부분을 말하고 본 발명에서는 iDesk나라는 메뉴로 존재한다.
이하, 본 발명의 구성을 바람직한 실시예를 들어 첨부된 도면을 참고로 상세히 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 전체 시스템 블록도로 기사 입력 클라이언트(100)와, 연동서버(200)와, 가공서버(300)와, 송출모듈(400)과, 웹사이트(500)로 구성되어 있다.
상기 기사 입력 클라이언트(100)는 각종 기사를 입력하기 위한 기사 작성기 즉, 기사 입력 프로그램이 설치되어 기사를 기사 입력 프로그램 툴에 맞추어 기사를 작성하는 것이다. 이러한 기사 입력프로그램은 온라인상에서 작성하도록 구형된 온라인 기사작성기와, 클라이언트에 프로그램을 설치하여 파일로 전송하는 클라이언트 기사작성기가 있다.
상기 연동서버(200)는 기사 연동 프로그램이 설치되어 상기 기사 입력 클라이언트의 기사작성기에 의하여 들어오는 여러가지 기사 포맷을 규격에 맞게 재구성해서 DB에 저장하는 하는 것이다. 또한 기사를 연동하기 위한 방식은 소켓으로 기사를 받고 특정 IP와 Port를 사용해서 소켓으로 연결 후에 데이터를 전송하고 받으며 받은 데이터를 텍스트 파일로 저장하는 소켓 방식과, 기사 입력 클라이언트에서 미리 기사의 텍스트 파일을 만들어 놓고 언론사의 FTP 사이트에 올려놓으면 상기 텍스트 파일을 가지고 오는 FTP 방식과, 기사 입력 클라이언트에서 약속된 웹사이트에 기사 파일을 올려놓고 주기적으로 그 웹사이트 접속하여 파일을 복사하여 저장하는 HTTP 방식을 사용한다.
또한, 연동서버(200)는 도 2에 도시된 바와 같이 기사입력 클라이언트(100)에서 전송된 기사데이터(210)를 메타데이터(220)로 변환하는데 상기 기사데이터(210)와 메타데이터(220)를 기사 입력 클라이언트(100)로부터 들어온 기사를 코드매핑하여 가공서버(300)로 전송한다. 이때 코드매핑은 각 연론사의 기사 입력 클라이언트(100)에 입력한 기사정보를 모두 코드번호를 부여하는 것이다. 여기서 코드번호를 부여하는 이유는 기사를 분류를 원활하게 하기 위함이고 또한, 기사를 검색하기 위하여 검색어를 기사 제목에서 찾을 것인가, 본문에서 찾을 것인가를 나누고 특히, 동일한 단어가 몇 회 이상 나올 경우 상기 단어를 키워드로 자동등록하도록 설정하여 기사검색을 용이하게 하는 것이다.
상기 가공서버(300)는 연동서버(200)에서 받아들인 기사데이터(210)를 자동분류 프로그램과, 자동편집 프로그램과, 자동 뉴스셋 데몬, 자동 모듈 갱신 데몬을 수단으로 가공한다.
상기 자동분류 프로그램은 들어온 기사를 각 토픽에 맞추어 자동으로 배치하는 프로그램이고 상기 자동편집 데몬은 주기적으로 최신 기사를 기사 요약, 상세보기 파일을 생성하고 상기 자동 뉴스셋 데몬은 주기적으로 최신기사를 뉴스셋에 자동으로 배치하고 상기 자동 모듈개신 데몬은 주기적으로 뉴스셋과 관련된 모듈들을 업데이트하는 것이다.
특히, 자동분류 프로그램은 키워드와 토픽에 할당된 키워드를 비교하는 형태소분석기와, 기사입력 클라이언트(100)에서 들어온 기사데이터(210)를 매핑하는 토픽으로 구분되면 상기 형태소 분석기는 국문으로 된 문장을 분석하고 명사/형용사/동사 등을 추출하고 자동분류에서는 명사만을 처리하는 것을 기준으로 한 것이고 상기 토픽은 기사 분류의 최소 단위로 토픽의 내용에 따라 레벨을 가진다.
또한, 자동분류 프로그램은 도 3에 도시된 바와 같이 토픽(310), 키워드(320), 시소러스(330)를 분류하는 데이터분류툴을 포함하고 있으며 상기 토픽(310), 키워드(320), 시소러스(330)는 연동서버(200)로부터 입력된 기사데이터를 분류하기 위하여 도 3의 실시예와 같이 기사정보의 토픽(310)을 정치, 경제, 사회, 문화 등으로 분류하고 분류된 정치 밑의 세부항목을 키워드(320)에서 정치단체, 한나라당, 민주당 등으로 분류하며 시소러스(330)에서 상기 정치단체를 다시 정치정당, 당파 등으로 분류하여 토픽(310), 키워드(320), 시소러스(330)로 분류하는 것이다.
상기와 같이 분류하면 키워드(320)와 시소러스(330)가 늘어남에 따라 너무 많은 토픽(310)에 기사가 매핑됨으로 정확도를 높이기 위하여 콘텐츠내 키워드 위치에 대한 가중치, 토픽내 키워드에 대한 가중치, 키워드 자체에 대한 가중치, 특정 언론사를 특정 토픽을 제외하고 분류, 정확도 값에 따른 자동분류를 고려하여 자동분류 정확도를 선정해야 함으로 하기와 같이 실시예를 들어 설명한다.
실시예)
1. 정확도 값에 따른 자동분류
기사 내용 : 히딩크 감독을 내세운 한국 축구가 월드컵에서 4강에 드는 신화를 이룩했다. 한국 축구 만세!!
정확도 계산법
정확도 = 토픽에 매핑된 키워드의 출현회수/기사에서 추출된 총 키워드의 수 ×10000
즉, 상기 기사에서 형태소 분석기를 통한 키워드 추출은 히딩크라는 단어가 1회, 감독이라는 단어가 1회, 한국이라는 단어가 2회, 축구라는 단어가 2회, 월드컵이라는 단어가 1회, 4강이라는 단어가 1회, 신화라는 단어가 1회, 만세라는 단어가 1회 총 10개의 키워드를 추출하여 토픽 '월드컵'에 할당된 키워드가 되는 것이다.
만약 상기 기사를 검색할 경우 검색어를 히딩크, 축구, 월드컵을 넣었을 경우 정확도 계산은 히딩크 단어가 1회, 축구 단어가 2회, 월드컵 단어가 1회가 나타나 총 키워드 수는 4가되고 총 키워드 수는 10이 되어 정확도 계산은 하기와 같다.
4/10 ×10000 = 4000
상기와 같은 계산법에 의하여 주제는 500이상, 지역은 50이상, 장르는 50이상, 기관은 50이상, 인물은 0이상의 설정치를 두어 계산된 정확도 값에 따라 분류여부를 결정하는 것이다.
2. 기사내용중 기워드 위치에 대한 가중치
기사내용중 키워드의 위치가 제목에 있으면 10점을 주고, 부제목에 있으면 5점을 주고 본문 첫 문단에 있으면 3점을 주고, 나머지 문단에 있으면 1점 주도록 설정함으로써 기사를 분류하는 것이다.
3. 토픽내 키워드에 대한 가중치
동일한 키워드일지라도 토픽에 따라 가중치가 다를 수 있음으로 토픽과 키워드의 관련도가 매우 높으면 5점을 주고, 토픽과 키워드의 관련도가 보통이면 3점을 주고, 토픽과 키워드가 관련은 없지만 자주 나타나면 1점을 주고, 토픽내 키워드를 사용하지 않으면 0점을 주도록 설정함으로써 기사를 분류하는 것이다.
4. 키워드 자체에 대한 가중치
토픽에 관계없이 키워드 자체에 가중치를 부여 하는 하는 것으로 매우 중요한 키워드면 5점을 주고, 중요한 키워드는 3점을 주고, 일반적인 키워드는 1점을 주도록 설정함으로써 기사를 분류하는 것이다.
5. 특정 언론사의 기사 입력 클라이언트를 특정 토픽에 분류 제외
특정 언론사의 기사 입력 클라이언트에 대하여 지정된 토픽에 분류를 하지 않도록 설정하여 상기 정확도 계산과 별도로 동작하도록 설정하여 기사를 분류하는 것이다.
이와같이 키워드(320)는 토픽(310)을 나타내는 주요단어이고 자동분류와 토픽(310)을 연결해주는 매개체이고 시소러스(330)는 키워드(320)의 동의어로서 키워드(320)를 보완하고 자동분류에서 키워드(320)와 시소러스(330)를 동급으로 처리한다.
한편, 기사내용의 자동분류를 위해 키워드추출 및 등록, 관리와 자동분류를 위한 가중치 관리를 하는 것이 키메니저툴(Key manager tool)이고 상기 키메니저툴은 지정된 날짜 사이의 기사를 기반으로 키워드 추출 및 추출된 키워드를 MDB에 저장 후, 실제 DB에 반영하는 키워드 자동 추출툴과, 하루동안 들어온 기사를 토대로 키워드를 추출 및 추출된 키워드를 실제 DB에 직접 저장하는 투데이 기사 추출툴과, 키워드와 시소러스를 가공서버와 동일하게 관리할 수 있는 툴과, 제목에 꺽쇠(<, >, [, ])가 포함된 기사를 자동분류툴을 포함하고 있고 도 4는 키메니저툴의 실시예를 도시한 것으로 도시된 (a)는 키워드 자동추출기 예시도이고 (b)는 키워드, 시소러스 관리 예시도이고 (c)는 새로운 키워드 추출 예시도이고 (d)는 자동분류 가중치 관리 예시도인 것이다.
더욱이, 상기 가공서버(300)중에서 자동편집 프로그램은 멀티 사이트를 지원하고 사이트의 기본정보를 관리하는 사이트툴과, 사이트의 구조를 트리형태로 등록 및 관리하는 디렉토리툴과, 다양한 토픽의 뉴스를 하나로 묶어내는 뉴스셋을 등록 및 관리하고 자동편집 프로그램과 기사작성 프로그램의 접점이 되는 뉴스셋툴과, 멀티사이트 운영시 모듈을 공유하기 위한 링크시스템을 관리하는 링크라이브러리툴과, 화면구성의 한 단위인 기사와 실제 사용자에게 보여지는 페이지인 껍질파일을 생성하는 아이템툴과, 웹페이지구성의 최소단위인 모듈을 생성 및 관리하는 모듈로 구성되는 것이다.
상기 자동편집 프로그램의 사이트툴은 멀티사이트 지원 및 사이트의 기본정보를 관리하고 1레벨 디렉토리로 이는 기사데이터를 편집, 분류하여 전송할 고객사의 사이트인 것이며 도 5에 도시된 바와 같이 자동편집 프로그램의 사이트툴은 한글 이름을 입력하는 사이트한글명프레임과, ID처럼 한번 등록하면 수정할 수 없으며 디렉토리 이름으로 사용되는 사이트영문명프레임과, 아이템 등의 미리보기에 사용되는 사이트URL프레임과, 사이트폴더가 생성될 루트폴더 경로인 루프패스프레임과, 사이트 전체적으로 적용되는 HTML 문서의 타이틀인 사이트타이틀프레임과, 메타태그의 Description 정보인 사이트설명프레임과, 메타태그의 키워드 정보인 사이트키워드프레임과, 경로를 입력하는 스타일시트프레임으로 구성된다.
상기 자동편집 프로그램의 디렉토리툴은 도 6에 도시된 바와 같이 사이트맵과 비슷한 개념으로 사이트의 구조를 디렉토리로 등록하여 복잡한 사이트의 경우 관리를 편리하게 하다.
또한, 디렉토리는 사이트에 종속되는 트리구조를 이루고 사이트입력란, 링입력란, 폴더한글명입력란, 폴더코드입력란, 폴더레벨입력란, 폴더패스입력란으로 구성되고 특히, 폴더영문명이 파일시스템상의 폴더명이 되며 아이템, 링크라이브러리와 함께 링크시스템의 한 축을 이루며 더욱이 디렉토리는 링크라이브러리를 기반으로 아이템을 디렉토리 기반으로 생성한다.
상기 자동편집 프로그램의 뉴스셋툴은 도 7에 도시된 바와 같이 도면의 좌측 Topiclist(340)에서 토픽셋을 선택하여 해당 토픽들의 리스트를 보도록 구성하고 추가하고자 하는 토픽을 클릭함으로 우측의 토픽매칭 단(350)에 추가됨을 확인하고 매치된 토픽을 수정하거나 제거할 경우 삭제, 리셋 클릭버튼을 눌려 실행하며 토픽은 같은 뉴스셋끼리 OR 조건으로 연결되며 다른 뉴스셋과는 AND 조건으로 연결된다.
도시된 우측의 토픽매칭 단(350)은 일반적속성을 설정하는 아이템의 기본 성격인 이름, 자동편집유무, 편집주기를 수정하고 숫자형식으로 Max기사지정을 하여 편집단에서 편집 개수를 수동하며 해당 뉴스셋의 긴급성 여부와, 기사타입을 지정한다.
따라서 뉴스셋은 기사취합 조건을 나타내는 것이며 기사성격은 이미지나 스트림파일 혼합 여부와, 긴급성, 편집주기설정, 자동편집 등의 기사 조건과 특정 제공사를 포함, 제외할 수 있는 조건, 토픽설정 조건을 가지도록 한다.
상기 자동편집 프로그램의 링크라이브러리툴은 도 8에 도시된 바와 같이 멀티 사이트 운영시 모듈의 공유를 위한 링크시스템의 근간을 이루고 링크명입력란, 링크설명입력란, 링크코드입력란, 링크레벨입력란, 뉴스셋입력란으로 입력하도록 구성하여 링크라이브러리를 수행하는 논리적 개념을 지니고 있다.
상기 자동편집 프로그램의 아이템툴은 도 9에 도시된 바와 같이 아이템(344)은 하나의 웹페이지이고 디렉토리 폴더 하나에 여러 종류의 아이템을 생성하며 디렉토리 폴더 하나당 아이템 종류별(340)로 하나의 아이템만 서비스할 수 있다. 즉, 여러개의 레이아웃으로 아이템(344)을 만들고 번갈아가며 서비스를 보내는 것이다.
아이템 종류(340)는 커스트마이징이 가능하고 개수도 증가할 수 있고 이름도 수정이 가능하며 디폴트 페이지(343) 기능은 사이트 URL을 치고 들어왔을 때의 첫페이지로 등록하는 것이다.
아이템 등록은 해당 페이지의 HTML을 등록하는 것으로 재사용이 가능하게 모듈화된 부분을 제외한 레이아웃 부분을 등록한다. 모듈화 되는 부분은 도 9에 도시된 <!--module--><!-#include virtual="/Module/0/Module[4].inc"-><!--/module--> (341)의 실시예와 같이 식별자를 처리하여 <!--module--> <!--/module-->을 앞뒤로 삽입해주고 디자인된 HTML 파일을 직접 불러들이며 모듈매치 클릭버튼(342)을 눌러서 나온 모듈 매치 화면에서 모듈추가, 수정, 삭제, 등록정보를 확인하는 것이다.
상기 자동편집 프로그램의 모듈은 도 10에 도시된 바와 같이 모듈은 아이템의 최소구성단위이며 프리젠테이션 부분이고 좌측에 도시된 타입별 모듈(350)은 뉴스모듈, 인터페이스모듈, 메뉴모듈, 사용자정의모듈로 나누어지면 상기 뉴스모듈은 웹사이트에 표현되는 뉴스와 관련된 내용의 모듈이고 상기 인터페이스모듈은 웹사이트에 표현되는 로고 등 인터페이스와 관련되는 모듈이고 상기 메뉴모듈은 웹사이트에 표현되는 메뉴와 관련되는 모듈이고 사용자정의모듈은 프로그램에 들어가는 설정과 관련된 모듈이다.
한편, 도 11은 도 10의 우측에 도시된 모듈셋팅에 관한 것으로 그중 모듈복사 클릭버튼(351)은 이미 선택한 모듈과 똑 같은 셋팅으로 이름만 다르게 하여 모듈을 하나 생성하고 보다 상세하게 모듈셋팅는 도 11에 도시된 실시예 뉴스모듈은 기본세팅으로 뉴스셋, 뉴스갯수, 뉴스선택, 날짜별 파일생성여부 옵션, 디자인세팅으로 구분되고 특히, 뉴스선택은 세팅한 뉴스셋의 기사가 나열되었을 때 중간 부분의 기사 몇 개를 가져올 수 있도록 셋팅하고 날짜별 파일생성은 날짜별 내비게이션용 파일을 생성할 것인지 여부를 묻고 뉴스모듈의 디자인세팅은 도 12과 같다.
상기 도 13에 도시된 모듈디자인내용 편집창(360)은 사용자가 직접 디자인내용 소스를 수정하는 프레임을 구성하고, 미리보기창(361)은 웹페이지에 등록될 기사를 미리보는 프레임을 구성하고, 엘리머트 세팅창(362)은 디자인 기본값을 설정하는 프레임을 구성하여 해당 콘텐트에 대한 디자인을 설정하는 것이다.
결과적으로 타 웹사이트에 지면을 생성하고 콘테트를 배치하는 것은 도 13에 도시된 바와 같고 도시된 '가'는 마우스 클릭 또는 소스의 원하는 위치에 상기 도 9에 도시된 <!--module-->삽입하여 편집하고 도시된 '나'는 웹페이지의 위치에 따른 모듈 삽입 방법을 선택하는 것이며 도시된 '다'는 가동서버(300)에서 가공된 기사데이터를 모듈을 선택하여 즉시 적용하는 것으로 이는 실시간 웹페이지의 지면을 변경할 수 있다.
이상 설명한 가공서버(300)는 메타데이터를 자동으로 편집, 분류하여 웹사이트로 전송하기 위한 송출모듈(400)로 전송되는데 상기 송출모듈(400)은 도 7에 도시된 바와 같이 키워드, 주제, 지역, 장르, 기관, 교육기관, 보도자료, 시리즈에 의하여 자동분류된 콘텐트의 메타데이터를 참조해 다양한 용도의 출판을 위해 무한대의 조건설정이 가능하므로 이러한 조건이 설정이 된 것을 모듈화시켜 웹페이지에 전송하기 위하여 각각 구분하여 검색키에 맞게 모듈별로 분류되어 데이터를 구축하고 상기 데이터를 웹페이지에 전송하는 것을 송출모듈(400)에서 하는 것이다.
상기 송출모듈(400)에서 기사데이터를 전송받는 웹사이트는(500) 최종적으로 도 14에 도시된 바와 같이 기사정보를 메타데이터로 변환하여 가동서버(300)에서 기사정보를 분류, 편집하여 타 웹사이트에 유동적인 기사정보(501)를 전송하는 것이다.
이상 설명한 구성요소를 이용한 본 발명의 개념과 원리를 설명하면 최초 기사 입력 클라이언트(100)에서 기사를 작성하여 작성된 기사데이터는 연동서버(200)에 입력하고 입력된 기사들은 연동서버(200)에서 각 기사데이터별로 코드를 부여하는 코드매핑한 후에 코드매핑된 기사데이터는 가공서버(300)로 전송되어 가공서버(300) 내의 자동분류 프로그램에 의하여 기사데이터는 작성된 기사 내용 중에서 토픽, 키워드, 시소러스를 이용하여 기사를 분류하고 자동편집 프로그램에 의하여 편집한 후 최종적으로 가공된 기사정보를 송출모듈(400)로 전송하여 송출모듈(400)에서 검색키에 맞게 모듈별로 분류되어 각 웹사이트에 전송하는 것이다.
도 15는 본 발명의 바람직한 실시예에 따른 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 방법은 하기와 같은 단계로 이루어져 있다.
기사작성 프로그램이 설치된 기사입력 클라이언트를 수단으로 기사정보를 입력하여 연동서버에 전송하는 단계(S10)와;
연동서버는 수신받은 기사데이터를 메타데이터로 변환하여 코드메핑하여 가공서버로 전송하는 단계(S20)와;
가공서버에 전송된 메타데이터는 가공서버에 설치된 분류프로그램, 편집프로그램에 의해서 메타데이터를 가공하는 단계(S30)와;
가공된 메타데이터는 송출모듈에서 검색키에 맞게 모듈별로 분류되어 타 웹사이트에 실시간 웹페이지 지면을 변경 및 기사정보를 표현하는 단계(S40)로 이루어져 있다.
이상에서 설명한 바와 같이, 본 발명은 1일 수천건 이상 대량의 뉴스 콘텐츠를 실시간으로 업데이트가 가능한 효과가 있고 콘텐츠를 자동 분류하고 편집하여 시간, 비용이 절감하는 효과가 있고, 다양한 포맷의 콘턴츠를 쉽게 조합 가능한 효과가 있고 기사정보를 체계적으로 관리하고 활용하는 효과가 있으므로 인터넷을 이용한 전자상거래산업상 매우 뛰어난 발명인 것이다.
도 1은 본 발명의 바람직한 실시예에 따른 인터넷상에서 기사를 자동분류하여 타 웹사이트에서 자동송출하는 시스템의 전체 블록도,
도 2는 본 발명의 바람직한 실시예에 따른 기사 입력클라이언트에서 전송된 기사데이터를 메타데이터로 변환하는 예시도,
도 3은 본 발명의 바람직한 실시예에 따른 자동분류 프로그램의 토픽, 키워드, 시소러스를 분류하는 데이터분류툴,
도 4는 본 발명의 바람직한 실시예에 따른 기사내용의 자동분류를 위한 키메니저툴의 예시도,
도 5는 본 발명의 바람직한 실시예에 따른 자동편집 프로그램의 사이트 툴 웹페이지,
도 6은 본 발명의 바람직한 실시예에 따른 자동편집 프로그램의 디렉토리 툴 웹페이지,
도 7은 본 발명의 바람직한 실시예에 따른 자동편집 프로그램의 뉴스셋툴 웹페이지,
도 8은 본 발명의 바람직한 실시예에 따른 자동편집 프로그램의 링크라이브러리툴 웹페이지,
도 9는 본 발명의 바람직한 실시예에 따른 자동편집 프로그램의 아이템툴 웹페이지,
도 10은 본 발명의 바람직한 실시예에 따른 자동편집 프로그램의 모듈 웹페이지,
도 11은 본 발명의 바람직한 실시예에 따른 뉴스모듈 기본 세팅 웹페이지,
도 12는 본 발명의 바람직한 실시예에 따른 해당 콘텐트에 대한 디자인 설정 웹페이지,
도 13은 본 발명의 바람직한 실시예에 따른 웹사이트에 지면을 생성하고 콘텐트를 배치하는 예시도,
도 14는 본 발명의 바람직한 실시예에 따른 타 웹사이트에 기사를 전송한 예시도이다.
* 도면의 주요부분에대한 부호설명 *
100 : 기사입력 클라이언트 200 : 연동서버
210 : 기사 Data 220 : 메타 Data
300 : 가공서버 310 : 토픽
320 : 키워드 330 : 시소러스
340 : 아이템 종류 341 : <!--module-->
342 : 모듈매치 클릭버튼 343 : 디폴트 페이지
344 : 아이템 350 : 타입별 모듈
351 : 모듈복사 클릭버튼 360 : 모듈디자인내용 편집창
361 : 미리보기창 362 : 엘리멘트 세팅창
400 : 송출모듈 500 : 웹사이트
501 : 유동적 기사정보

Claims (3)

  1. 기사입력 프로그램이 설치되고 상기 기사입력 프로그램을 수단으로 기사정보를 입력하여 기사데이터를 생성하는 기사입력 클라이언트(100)와;
    상기 기사데이터를 전송받아 분류, 편집, 송출하기 유용한 메타데이터로 변환하는 연동서버(200)와;
    자동분류 프로그램, 자동편집 프로그램, 자동 뉴스셋 데몬, 자동 모듈 갱신 데몬이 설치되어 상기 메타데이터를 가공하는 가공서버(300)와;
    상기 가공서버(300)에서 가공된 메타데이터를 검색키에 맞게 모듈화시켜 데이터를 구축하여 다수의 타 웹페이지에 전송하는 송출모듈(400)과;
    상기 송출모듈(400)에서 데이터를 전송받아 기사내용을 웹페이지에 실시간 배치 및 표현하는 웹 페이지(500)로 이루어진 것을 특징으로 하는 인터넷상에서 기사를 자동분류하여 타 웹페이지에 자동송출하는 시스템.
  2. 제 1항에 있어서, 상기 송출모듈(400)은 자동분류 프로그램과, 자동편집 프로그램에 의하여 자동분류 및 편집된 콘텐트의 메타데이터를 OR 및 AND로 조합된 무한대 조건을 모듈화시켜 검색키에 맞게 분류되는 것을 특징으로 하는 인터넷상에서 기사를 자동분류하여 타 웹페이지에 자동송추하는 시스템.
  3. 기사작성 프로그램이 설치된 기사입력 클라이언트를 수단으로 기사정보를 입력하여 연동서버에 전송하는 단계(S10)와;
    연동서버는 수신받은 기사데이터를 메타데이터로 변환하여 코드메핑하여 가공서버로 전송하는 단계(S20)와;
    가공서버에 전송된 메타데이터는 가공서버에 설치된 분류프로그램, 편집프로그램에 의해서 메타데이터를 가공하는 단계(S30)와;
    가공된 메타데이터는 송출모듈에서 검색키에 맞게 모듈별로 분류되어 타 웹사이트에 실시간 웹페이지 지면을 변경 및 기사정보를 표현하는 단계(S40)로 이루어진 것을 특징으로 하는 인터넷상에서 기사를 자동분류하여 타 웹페이지에 자동송출하는 방법.
KR1020040002276A 2004-01-13 2004-01-13 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법 KR100616152B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020040002276A KR100616152B1 (ko) 2004-01-13 2004-01-13 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040002276A KR100616152B1 (ko) 2004-01-13 2004-01-13 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법

Publications (2)

Publication Number Publication Date
KR20050074058A true KR20050074058A (ko) 2005-07-18
KR100616152B1 KR100616152B1 (ko) 2006-08-25

Family

ID=37262916

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040002276A KR100616152B1 (ko) 2004-01-13 2004-01-13 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법

Country Status (1)

Country Link
KR (1) KR100616152B1 (ko)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100719308B1 (ko) * 2004-06-30 2007-05-17 에스케이 텔레콤주식회사 다양한 서비스 지원을 위한 컨텐츠 릴레이 방법
WO2009088871A1 (en) * 2007-12-31 2009-07-16 United Communications Corporations Community information and news flow network
GB2459476A (en) * 2008-04-23 2009-10-28 British Telecomm Classification of posts for prioritizing or grouping comments.
KR100942047B1 (ko) * 2007-10-08 2010-02-11 최한겸 디지털 신문기사의 제작 및 그 제공방법
CN101980204A (zh) * 2010-11-04 2011-02-23 上海银杏界信息科技有限公司 静态网页自动更新方法
US8255402B2 (en) 2008-04-23 2012-08-28 British Telecommunications Public Limited Company Method and system of classifying online data
CN105068991A (zh) * 2015-07-30 2015-11-18 成都鼎智汇科技有限公司 一种基于大数据的舆情发现方法
CN105183765A (zh) * 2015-07-30 2015-12-23 成都鼎智汇科技有限公司 一种基于大数据的话题抽取方法
KR102078505B1 (ko) * 2019-05-28 2020-02-17 주식회사 에이플에이디 기사 생성 시스템 및 그 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102368823B1 (ko) * 2019-10-29 2022-03-03 한국전자기술연구원 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100719308B1 (ko) * 2004-06-30 2007-05-17 에스케이 텔레콤주식회사 다양한 서비스 지원을 위한 컨텐츠 릴레이 방법
KR100942047B1 (ko) * 2007-10-08 2010-02-11 최한겸 디지털 신문기사의 제작 및 그 제공방법
WO2009088871A1 (en) * 2007-12-31 2009-07-16 United Communications Corporations Community information and news flow network
GB2459476A (en) * 2008-04-23 2009-10-28 British Telecomm Classification of posts for prioritizing or grouping comments.
US8255402B2 (en) 2008-04-23 2012-08-28 British Telecommunications Public Limited Company Method and system of classifying online data
US8825650B2 (en) 2008-04-23 2014-09-02 British Telecommunications Public Limited Company Method of classifying and sorting online content
CN101980204A (zh) * 2010-11-04 2011-02-23 上海银杏界信息科技有限公司 静态网页自动更新方法
CN101980204B (zh) * 2010-11-04 2013-07-10 上海银杏界信息科技有限公司 静态网页自动更新方法
CN105068991A (zh) * 2015-07-30 2015-11-18 成都鼎智汇科技有限公司 一种基于大数据的舆情发现方法
CN105183765A (zh) * 2015-07-30 2015-12-23 成都鼎智汇科技有限公司 一种基于大数据的话题抽取方法
KR102078505B1 (ko) * 2019-05-28 2020-02-17 주식회사 에이플에이디 기사 생성 시스템 및 그 방법

Also Published As

Publication number Publication date
KR100616152B1 (ko) 2006-08-25

Similar Documents

Publication Publication Date Title
US20220164401A1 (en) Systems and methods for dynamically creating hyperlinks associated with relevant multimedia content
US11874894B2 (en) Website builder with integrated search engine optimization support
US8352487B2 (en) Identifier vocabulary data access method and system
US7246316B2 (en) Methods and apparatus for automatically generating presentations
CN110597981B (zh) 一种采用多策略自动生成摘要的网络新闻概要系统
US20020049705A1 (en) Method for creating content oriented databases and content files
US20070220415A1 (en) Excel spreadsheet parsing to share cells, formulas, tables or entire spreadsheets across an enterprise with other users
KR20070048761A (ko) 인라인 문맥 질의들을 사용하는 검색 시스템들 및 방법들
JP2002230035A (ja) 情報整理方法、情報処理装置、情報処理システム、記憶媒体、およびプログラム伝送装置
US7024405B2 (en) Method and apparatus for improved internet searching
US9081767B2 (en) Browsing of contextual information
WO2000054185A1 (en) Method and apparatus for building a user-defined technical thesaurus using on-line databases
KR100616152B1 (ko) 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법
US20100082594A1 (en) Building a topic based webpage based on algorithmic and community interactions
US8904272B2 (en) Method of multi-document aggregation and presentation
JP2000231570A (ja) インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
KR100495034B1 (ko) 인포박스를 이용한 정보제공 시스템 및 방법
Kolli et al. A Novel Nlp and Machine Learning Based Text Extraction Approach from Online News Feed
Grüblbauer et al. Social media monitoring tools as instruments of strategic issues management
Geel et al. Sift: an end-user tool for gathering web content on the go
JP2000231569A (ja) インターネット情報検索装置、インターネット情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Dave et al. Dynamically growing hypertext collections
Abdulmunim et al. Links Evaluation and Ranking Based on Semantic Metadata Analysis
KR20220146923A (ko) 검색키워드 다중 표기에 따른 우선순위 중심 선별문서 채택 시스템 및 그 구동방법
KR101132393B1 (ko) 폭소노미와 링크 기반 랭킹 기법을 이용한 집단지성 기반 웹 페이지 검색 방법 및 이를 수행하기 위한 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120809

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20130917

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141118

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150817

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee