KR101426482B1 - 트위터 기록물 장기보존 시스템 - Google Patents

트위터 기록물 장기보존 시스템 Download PDF

Info

Publication number
KR101426482B1
KR101426482B1 KR1020120137439A KR20120137439A KR101426482B1 KR 101426482 B1 KR101426482 B1 KR 101426482B1 KR 1020120137439 A KR1020120137439 A KR 1020120137439A KR 20120137439 A KR20120137439 A KR 20120137439A KR 101426482 B1 KR101426482 B1 KR 101426482B1
Authority
KR
South Korea
Prior art keywords
aip
information
collecting
module
unit
Prior art date
Application number
KR1020120137439A
Other languages
English (en)
Other versions
KR20140069756A (ko
Inventor
차주용
이규철
Original Assignee
대한민국(국가기록원)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(국가기록원) filed Critical 대한민국(국가기록원)
Priority to KR1020120137439A priority Critical patent/KR101426482B1/ko
Publication of KR20140069756A publication Critical patent/KR20140069756A/ko
Application granted granted Critical
Publication of KR101426482B1 publication Critical patent/KR101426482B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 행정기관에서 운영하고 있는 트위터 기록물을 대상으로 장기 보존하고 재현 가능한 메타데이터 및 포맷을 제공하는 시스템에 관한 것으로서, 트위터 기록물을 수집하는 수집부, 상기 수집부에서 수집한 정보를 구조적 메타데이터 문서로 생성하는 보관부, 상기 보관부에서 생성된 메타데이터를 트윗 문서로 재현하는 재현부, 상기 수집부, 보관부 및 재현부를 모니터하고 제어하는 콘솔부 및 상기 수집부에서 수집한 데이터를 저장하는 DB부를 포함하는 것을 특징으로 한다.

Description

트위터 기록물 장기보존 시스템{System of preserving twitter records}
본 발명은 트위터 기록물 장기보존을 위한 시스템에 관한 것으로서, 상세하게는 우리나라 모든 행정기관에서 운영하고 있는 트위터 기록물을 대상으로 장기 보존하고 재현 가능한 메타데이터 및 포맷을 제공하는 시스템에 관한 것이다.
2006년 미국의 벤처기업 오비어스(Obvious)사가 처음 개설한 트위터(twitter)는 블로그의 인터페이스에 미니홈페이지의 친구맺기 기능, 메신저의 신속성을 갖춘 소셜 네트워크 서비스(Social network Service: SNS)로서, 젊은 세대들만의 교류 수단으로 사용하던 기존 서비스와는 달리 국내외 저명인사들도 다수의 팔로워(follower)를 보유하면서 일반 대중과 소통하는데 이용하는 등 사용자 범위가 다양화되고 정보의 빠른 공유와 확산력으로 전 세계적 트렌드로 자리잡아, 선거나 기업들의 홍보 등에 활용되고 있으며 우리나라의 행정기관에서도 정책을 홍보하고 국민들의 의견을 수렴하기에 이르렀다.
국민들의 의견 수렴 및 각 행정기관의 정책을 국민들에게 홍보하기 위한 목적으로 사용되는 각 행정기관의 트위터 기록물은 미래에 역사적 기록 및 법적 증거로 활용될 수 있다. 그러나 SNS 제공업체가 영구히 서비스를 제공한다는 보장이 없어 서비스를 중단하거나, 현재의 트위터사처럼 정책에 따라 최대 보관건수(현재부터 3,200건)를 제한하는 경우 수많은 과거의 기록은 사라지게 되므로 SNS 기록물들을 장기적으로 보존할 필요성이 대두되었다.
미국의 경우 국가정보 인프라 스트럭쳐 및 보존계획(NDIIPP)를 중심으로 트위터 기록물에 대한 아카이빙(achieving) 프로젝트가 진행되고 있으며, 미국 아카비스트협회(SAA)를 통해 트위터 기록물 아카이빙 방법론을 연구 중에 있다. 국내의 경우 국가기록원을 중심으로 SNS 기록물 아카이빙 방법을 연구하고 있으나 현재는 SNS 데이터를 백업하는 초기 단계이며 보다 발전된 체계적인 아카이빙 방법이 필요하다.
주요 선행기술로는 특허문헌 1에 제시된 트윗 북 서비스 제공시스템으로서, SNS인 트위터에 자신이 남긴 글인 트윗(tweet)과 타인의 글을 자신의 트위터로 옮겨온 리트윗(retweet) 등의 글을 추출하여 자신만의 책으로 소유할 수 있도록 다양한 조건에 의하여 추출하고 다양한 템플릿을 이용하여 레이아웃을 형성하여 책으로 제공하는 것을 특징으로 한다. 이러한 종래의 기술은 자신이 남긴 기록물을 정리하여 책으로 만드는 것으로서 개인 기록물에 국한되고 개인 취향에 초점이 맞추어지기 때문에 국가적 기록물로 영구보존을 위한 체계적 방법으로는 부족한 점이 있다.
1. 한국공개특허 제2012-0046806호(2012. 5. 11. 공개)
상기의 필요성에 따라 본 발명에 따른 발명은, 우리나라 모든 행정기관에서 운영하고 있는 트위터 기록물을 대상으로 장기 보존하는데 필요한 메타데이터 및 포맷을 생성하는 시스템을 제공하고자 한다.
또한, ISO 표준(ISO 14271)인 OAIS 참조모형을 따르고 있는 기존 전자기록물과 웹 기록물 장기보존 메타데이터 및 호환을 고려하고, 재현 가능한 포맷 및 메타데이터를 제공하고자 한다.
상기의 해결하고자 하는 과제의 해결 수단으로서 트위터 기록물 장기보존 시스템은, 트위터 기록물을 수집하는 수집부, 상기 수집부에서 수집한 정보를 구조적 메타데이터 문서로 생성하는 보관부, 상기 보관부에서 생성된 메타데이터를 트윗 문서로 재현하는 재현부, 상기 수집부, 보관부 및 재현부를 모니터하고 제어하는 콘솔부 및 상기 수집부에서 수집한 데이터를 저장하는 DB부를 포함하는 것을 특징으로 한다.
본 발명의 바람직한 실시예로서, 상기 수집부는 일괄수집모듈, 일일수집모듈 및 최신데이터수집모듈로 구성되고, 상기 일괄수집모듈은 행정기관에서 등록한 예전 자료를 최초로 수집하는 모듈이고, 트윗 정보는 트위터사의 서버에 보관된 현재부터 3,200건의 예전 자료를 일괄적으로 수집하고, DM 정보는 현재부터 800건의 예전 자료를 일괄적으로 수집하는 것을 특징으로 한다.
본 발명의 바람직한 실시예로서, 상기 일일수집모듈은 행정기관에서 등록한 최근의 트윗과 DM을 일일로 수집하고, 팔로잉하고 있는 사용자 정보인 FriendID, 팔로워 하고 있는 사용자 정보인 FollowerID 및 사용자정보를 수집하고, 일일수집 대상이 되는 자료는 스케줄러(cron)에 의하여 일별 및 월별로 주기적으로 수집하는 것을 특징으로 한다.
본 발명의 바람직한 실시예로서, 상기 최신데이터수집모듈은 아카이빙 직전의 최신 정보를 일회 수집하는 모듈이고, 행정기관의 계정정보, FriendID, FollowerID, 트윗을 리트윗하는 사용자 정보인 Retweet_of_Me, 관심글로 등록한 트윗 정보인 Favorite 및 그룹별 관리를 위해 등록한 List를 수집하는 것을 특징으로 한다.
본 발명의 바람직한 실시예로서, 상기 보관부는 상기 수집부에서 수집한 정보를 영구적 보존 파일로 만들기 위하여 xml 생성하는 하는 기능을 하고, 트윗 AIP(Archive Information Package) 생성모듈, DM AIP 생성모듈, Following AIP 생성모듈, Follower AIP 생성모듈, Favorite 생성모듈, List 생성모듈, 보존 메타데이터 입력모듈 및 메타데이터 AIP 생성모듈로 구성된 것을 특징으로 한다.
본 발명의 다른 실시예로서, 트위터 기록물 장기보존 시스템을 이용한 트위터 기록물의 장기보존 포맷은 연단위의 기록물철과 기록물건으로 구성되고, 상기 기록물건은 메타데이터 문서이고, 트윗, DM, Friends, Followers, Lists, Favorites, 통계문서(status)로 구성된 것을 특징으로 한다.
현재의 트위터사처럼 정책에 따라 최대 보관건수(현재부터 3,200건)를 제한하는 경우 수많은 과거의 기록은 사라지게 되나, 본 발명에 의한 트위터 기록물 장기보존을 위한 시스템을 사용하게 되면, 국민들의 의견 수렴 및 각 행정기관의 정책을 국민들에게 홍보된 트위터 기록물은 미래에 역사적 기록 및 법적 증거로 활용될 수 있다.
또한, 본 발명에 의한 트위터 기록물은 ISO 표준(ISO 14271)인 OAIS 참조모형을 따르고 있는 기존 전자기록물과 웹 기록물 장기보존 메타데이터와 호환이 가능하고, 다시 트윗 정보 형태로 재현이 가능하다.
도 1은 본 발명에서의 데이터 수집 절차도
도 2는 본 발명에 따른 트위터 기록물 장기보존 시스템
도 3은 트윗 정보에 대한 일괄수집모듈의 알고리즘 순서도
도 4는 트윗 정보에 대한 일괄수집모듈을 화면상에 구현한 프로그램을 캡처한 그림
도 5는 트윗 정보에 대한 일일수집모듈의 알고리즘 순서도
도 6은 DM 정보의 일일수집모듈을 화면상에 구현한 프로그램을 캡처한 그림
도 7은 최신데이터수집모듈의 계정정보 수집 순서도
도 8은 최신데이터수집모듈의 FriendID 수집 순서도
도 9는 트윗 AIP 생성모듈의 순서도
도 10은 트윗 AIP 생성모듈의 화면 및 생성한 xml을 보기한 화면
도 11은 DM AIP 생성모듈의 순서도
도 12는 Favorite AIP 생성모듈의 순서도
도 13은 Follower AIP 생성모듈의 순서도
도 14는 Friend AIP 생성모듈의 순서도
도 15는 List AIP 생성모듈의 순서도
도 16은 보존 메타데이터 입력모듈의 순서도
도 17은 보존 메타데이터 입력 화면
도 18은 메타데이터 AIP 생성모듈의 순서도
도 19는 트위터 기록물의 장기보존 포맷
도 20은 트위터 기록물건 XSD
도 21은 트윗 문서의 XSD
이하 본 발명의 실시를 위한 구체적인 실시예를 도면을 참고하여 설명한다. 본 발명의 실시예는 하나의 발명을 설명하기 위한 것으로서 권리범위는 실시예에 한정되지 않고, 예시된 도면은 발명의 명확성을 위하여 핵심적인 내용만 확대 도시하고 부수적인 것은 생략하였으므로 도면에 한정하여 해석하여서는 아니 된다.
본 발명에서 트위터 데이터를 수집하기 위하여 트위터사에서 제공하는 API(Application Program Interface)인 REST(Representational State Transfer) API를 사용한다. REST API는 사용하기 쉽고 지원되는 라이브러리가 많으며, 데이터 수집시 사용되는 API는 Timeline, 트윗(Tweet), User, List, DM(Direct Message), Follow, Social Graph, Account, Favorite, Notification, Blocks, Spam Report, Help, OAuth, 저장 검색조건, 지역정보, 위치정보 관련 17가지이다.
트위터사에서 제공하는 API의 이용시의 문제점은 첫째, 아카이빙을 위한 데이터 수집시 일자별 정보수집이 불가능하고, 둘째, 트위터사의 정책에 의하여 트윗의 경우 최대 3,200개, DM의 경우 800개의 정보만이 가능하고 그 이전에 등록된 데이터는 수집이 불가능하며, 셋째, 접속자의 폭주로 인한 부하를 줄이기 위해 시간당 API 실행 횟수가 제한된다는 것이다.
본 발명에서는 위와 같은 문제점을 해결하기 위해 다음과 같은 방법을 사용한다. 첫째는 수집 데이터를 저장할 수 있는 RDBMS를 이용한다. 수집시에는 일자와 관계없이 최근 정보를 DB에 저장하고, 아카이빙용 데이터를 생성하기 위해 DB에서 일자별로 정보를 읽어 생성한다. 둘째는 트윗과 DM의 경우 최초에 일괄적으로 최대건수를 수집하는 모듈과 저장된 수집정보 DB에서 가장 최근의 트윗 ID를 읽은 후 그 이후에 등록된 정보만을 수집하는 모듈로 분리하여 구성한다. 셋째는 API호출 횟수를 카운트하여 횟수가 초과하는 경우에 스레드 지연(thread delay)방식을 이용하여 특정시간 이후 재호출하는 로직을 구성한다.
도 1은 본 발명에서의 데이터 수집 절차도를 보여준다. 트위터 데이터를 수집하기 위해서는 먼저 이용자의 ID와 비밀번호를 이용하여 인증정보를 받아야 한다. 인증방법으로는 BASIC, OAuth(Open Authorization), XAuth가 있으며, BASIC 인증은 API 호출횟수가 적고, XAuth는 DM을 수집하지 못한다는 단점이 있어 본 발명에서는 OAuth 인증방법을 사용한다.
구체적인 인증 절차는 다음과 같다. 트위터 수집모듈이 트위터 서버에게 임시로 사용되는 리퀘스트 토큰을 요청하면, 그에 대하여 상기 트위터 서버는 리퀘스트 토큰을 발급해 주게 된다. 이후 리퀘스트 토큰을 이용하여 인증을 수행하면 핀번호를 발급해 준다. 상기 트위터 수집모듈은 상기 핀번호를 받은 후 해당 핀번호와 리퀘스트 토큰 등의 정보를 이용하여 트위터 서버에게 억세스 토큰을 요청하게 되며, 상기 트위터 서버는 이러한 요청을 검증하여 해당 트위터 사용자의 리소스에 접근할 수 있는 억세스 토큰을 발급하게 되고, 상기 트위터 수집모듈 상기 억세스 토큰을 이용하여 사용자의 보호된 리소스에 접근할 수 있는 권한을 부여받게 된다.
트위터 데이터 수집 절차는 트위터 API를 이용해 트위터 서버에 자료를 요청한다. 트위터 서버는 인증정보를 먼저 확인하고 API에 해당하는 결과값을 JSON(JavaScript Object Notation) 데이터 포맷으로 요청한 클라이언트인 수집모듈에 보낸다. 파싱(parsing) 모듈은 결과값을 파싱하여 수집정보 저장DB에 저장한다. 본 발명에서는 트위터사의 정책에 따라 API가 변경되거나 항목이 변화가 생길 것을 대비하여 유연성 있는 파서(parser)를 사용한다.
본 발명에서의 문서는 XML(extensible markup language) 기반의 데이터 파일로서 월드 와이드 웹페이지에 사용되며, 문서형식을 구조적으로 표현하고 검색하는 것이 용이하며, 재현이 가능하여 영구적 보존 파일로 사용한다.
본 발명에 따른 트위터 기록물 장기보존 시스템은 도 2와 같이 크게 수집부, 보관부, 재현부, 콘솔부 및 DB부로 구성된다.
상기 수집부는 트위터 기록물을 수집하는 도구로서 일괄수집모듈, 일일수집모듈 및 최신데이터수집모듈로 구성된다.
상기 일괄수집모듈은 행정기관에서 등록한 예전 자료를 최초로 수집하는 모듈로서 트위터사의 서버에 보관된 트윗 정보는 현재부터 3,200건의 예전 자료를 일괄적으로 수집하고, DM 정보는 현재부터 800건의 예전 자료를 일괄적으로 수집한다.
상기 일일수집모듈은 행정기관에서 등록한 최근의 트윗과 DM을 일일로 수집한다. 일일수집 대상이 되는 자료는 스케줄러(cron)에 의해 현재 보관된 트윗 및 DM보다 최근에 등록된 자료를 수집하여 DB부에 저장한다. 상기 일일수집모듈은 트윗과 DM이외에 팔로잉하고 있는 사용자 정보인 FriendID, 팔로워하고 있는 사용자 정보인 FollowerID 및 사용자정보를 수집 저장한다.
상기 최신데이터수집모듈은 아카이빙 직전의 최신 정보를 일회 수집하는 모듈로서, 행정기관의 계정정보, FriendID, FollowerID, 트윗을 리트윗하는 사용자 정보인 Retweet_of_Me, 관심글로 등록한 트윗 정보인 Favorite 및 그룹별 관리를 위해 등록한 List가 수집 대상이다.
도 3은 트윗 정보에 대한 일괄수집모듈의 알고리즘 순서도로서 인증절차를 거치고, 트윗 수집 함수를 호출하여 트위터 API를 호출하여 API 값에 해당하는 결과값을 얻어 데이터를 파싱하여 DB에 저장하고 저장된 정보가 없을 때(null)까지 반복 수행한다. DM 정보에 대해서도 같은 방법으로 일괄 수집한다.
도 4는 일괄수집모듈의 하나의 예로서 트윗 정보에 대한 일괄수집모듈을 화면상에 구현한 프로그램을 캡처한 것이다.
도 5는 트윗 정보에 대한 일일수집모듈의 알고리즘 순서도로서 일괄수집모듈의 알고리즘과 같고 다만 일별, 월별로 주기적으로 수집하는 것이 다르다. DM 정보에 대해서도 같은 방법으로 주기적으로 일일 수집한다.
도 6은 일일수집모듈의 하나의 예로서 DM 정보의 일일수집모듈을 화면상에 구현한 프로그램을 캡처한 것이다.
도 7은 최신데이터수집모듈의 계정정보 수집 순서도로서 아카이빙 직전에 행정기관의 계정정보를 계정 수집함수를 호출하여 수집한다.
도 8은 최신데이터수집모듈의 FriendID 수집 순서도로서 Friend 수집 함수를 호출하여 팔로잉하고 있는 사용자 정보를 수집한다. FollowerID, Retweet_of_Me, Favorite 및 List도 FriendID와 유사한 알고리즘으로 수집한다.
상기 보관부는 상기 수집부에서 수집한 정보를 구조적으로 표현하고 검색하기에 용이하며, 재현이 가능하여 영구적 보존 파일로 만들기 위하여 xml 생성하는 기능을 하는 것으로서, 트윗 AIP(Archive Information Package) 생성모듈, DM AIP 생성모듈, Following AIP 생성모듈, Follower AIP 생성모듈, Favorite 생성모듈, List 생성모듈, 보존 메타데이터 입력모듈 및 메타데이터 AIP 생성모듈로 구성된다.
도 9는 트윗 AIP 생성모듈의 순서도로서 수집한 트윗 정보와 리트윗 정보를 바탕으로 트윗 AIP를 생성하여 xml 데이터를 생성하고 보기를 할 수 있다.
도 10은 트윗 AIP 생성모듈의 화면을 캡처한 그림으로서 행정기관과 연도를 선택하여 생성버튼을 누르면 xml 데이터가 생성되고 보기버튼을 누르면 하단 화면과 같이 xml 데이터를 볼 수 있다.
도 11은 DM AIP 생성모듈의 순서도로서 수집한 DM 정보를 바탕으로 DM AIP를 생성하여 xml 데이터를 생성하고 보기를 할 수 있다.
도 12는 Favorite AIP 생성모듈의 순서도로서 수집한 Favorite 정보를 바탕으로 Favorite AIP를 생성하여 xml 데이터를 생성하고 보기를 할 수 있다.
도 13은 Follower AIP 생성모듈의 순서도로서 수집한 Follower 정보를 바탕으로 Follower AIP를 생성하여 xml 데이터를 생성하고 보기를 할 수 있다.
도 14는 Friend AIP 생성모듈의 순서도로서 수집한 Friend 정보를 바탕으로 Friend AIP를 생성하여 xml 데이터를 생성하고 보기를 할 수 있다.
도 15는 List AIP 생성모듈의 순서도로서 수집한 List 정보를 바탕으로 List AIP를 생성하여 xml 데이터를 생성하고 보기를 할 수 있다.
도 16은 수집 및 보존 메타데이터 입력모듈의 순서도로서 메타데이터 AIP 생성을 위한 정보를 입력하는 모듈이다.
도 17은 보존 메타데이터 입력 화면으로서 행정기관과 연도를 선택하고 보존행위자, 키워드 및 기타정보를 입력하고 등록버튼을 누른다.
도 18은 메타데이터 AIP 생성모듈의 순서도로서 수집 및 입력한 정보를 바탕으로 메타데이터 AIP를 생성한다.
도 19는 트위터 기록물의 장기보존 포맷으로서 연단위의 기록물철과 기록물건으로 구성된다. 기록물건은 메타데이터 문서로서 트윗, DM, Friends, Followers, Lists, Favorites, 통계문서(status)로 구성된다. 트윗 문서는 트위터에 등록되는 트윗, 리트윗, 답글을 포함한다. 트윗 문서의 메타데이터는 ID, 생성일자, 생성자와 같은 트윗을 식별할 수 있는 정보와 StatusFlag, DocumentType과 같은 트윗의 구분 정보가 포함되며, 문서내용에는 트윗 내용, 리트윗 여부 등의 실제값이 포함된다. Friends와 Followers 문서는 트위터의 팔로잉, 팔로워 정보를 가지며, Favorites는 관심글 정보, Lists는 해당 행정기관의 리스트 정보, Status는 통계정보를 포함하고 있다.
도 20은 트위터 기록물건 XSD(Xml Schema Document)를 보여주는 것으로서, 트위터 문서 포맷(Twitter Document Format)은 Twitter Document Metadata와 Twitter Document Contents로 구성된다. Twitter Document Metadata는 메타데이터 정보를 담고 있으며, Twitter Document Contents는 Tweets, Friends, Followers, Favorites, Lists, DMs, Status 정보를 포함한다.
도 21은 트윗 문서의 XSD를 보여주는 것으로서 트윗 정보를 담고 있다. 트윗 문서는 Tweet_metadata와 Tweet_content로 구성되고, Tweet_metadata는 created_at, status_id, user_id, screen_name, status_flag, documenttype으로 되어 있고, Tweet_content는 text, source, truncated, in_reply_to_status_id, in_reply_to_user_id, in_reply_to_screen_name, retweet_count, retweeted 등으로 구성된다. DM, Friends, Followers, Lists, Favorites, 통계문서(status) 등도 유사한 구조로 구성된다.

Claims (18)

  1. 트위터 기록물을 수집하는 수집부;
    상기 수집부에서 수집한 정보를 구조적 메타데이터 문서로 생성하는 보관부;
    상기 보관부에서 생성된 메타데이터를 트윗 문서로 재현하는 재현부;
    상기 수집부, 보관부 및 재현부를 모니터하고 제어하는 콘솔부; 및
    상기 수집부에서 수집한 데이터를 저장하는 DB부를 포함하되,
    상기 수집부는 일괄수집모듈, 일일수집모듈 및 최신데이터수집모듈로 구성된 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  2. 삭제
  3. 제1항에 있어서,
    상기 일괄수집모듈은 행정기관에서 등록한 예전 자료를 최초로 수집하는 모듈이고, 트윗(tweet) 정보는 트위터사의 서버에 현재부터 보관된 최대건수를 일괄적으로 수집하고, DM(direct message) 정보는 현재부터 보관된 최대건수를 일괄적으로 수집하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  4. 제1항에 있어서,
    상기 일일수집모듈은 행정기관에서 등록한 최근의 트윗과 DM 정보를 일일로 수집하고, 팔로잉하고 있는 사용자 정보인 FriendID, 팔로워 하고 있는 사용자 정보인 FollowerID 및 사용자정보를 수집하여 저장하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  5. 제4항에 있어서,
    일일수집 대상이 되는 자료는 스케줄러(cron)에 의하여 일별 및 월별로 주기적으로 수집하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  6. 제1항에 있어서,
    상기 최신데이터수집모듈은 아카이빙(archiving) 직전의 최신 정보를 일회 수집하는 모듈이고, 행정기관의 계정정보, FriendID, FollowerID, 트윗을 리트윗하는 사용자 정보인 Retweet_of_Me, 관심글로 등록한 트윗 정보인 Favorite 및 그룹별 관리를 위해 등록한 List를 수집하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  7. 제1항에 있어서,
    상기 보관부는 상기 수집부에서 수집한 정보를 영구적 보존 파일로 만들기 위하여 xml 데이터를 생성하는 하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  8. 제7항에 있어서,
    상기 보관부는 트윗 AIP(Archive Information Package) 생성모듈, DM AIP 생성모듈, Following AIP 생성모듈, Follower AIP 생성모듈, Favorite 생성모듈, List 생성모듈, 보존 메타데이터 입력모듈 및 메타데이터 AIP 생성모듈로 구성된 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  9. 제8항에 있어서,
    상기 트윗 AIP 생성모듈은 상기 수집부에서 수집한 트윗 정보와 리트윗 정보를 바탕으로 트윗 AIP를 생성하여 xml 데이터를 생성하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  10. 제8항에 있어서,
    상기 DM AIP 생성모듈은 상기 수집부에서 수집한 DM 정보를 바탕으로 DM AIP를 생성하여 xml 데이터를 생성하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  11. 제8항에 있어서,
    상기 Favorite AIP 생성모듈은 상기 수집부에서 수집한 Favorite 정보를 바탕으로 Favorite AIP를 생성하여 xml 데이터를 생성하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  12. 제8항에 있어서,
    상기 Follower AIP 생성모듈은 상기 수집부에서 수집한 Follower 정보를 바탕으로 Follower AIP를 생성하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  13. 제8항에 있어서,
    상기 수집부에서 수집한 Friend 정보를 바탕으로 Friend AIP를 생성하여 xml 데이터를 생성하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  14. 제8항에 있어서,
    상기 List AIP 생성모듈의 상기 수집부에서 수집한 List 정보를 바탕으로 List AIP를 생성하여 xml 데이터를 생성하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  15. 제8항에 있어서,
    상기 보존 메타데이터 입력모듈은 메타데이터 AIP 생성을 위한 정보를 입력하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  16. 제8항에 있어서,
    상기 메타데이터 AIP 생성모듈은 수집 및 입력한 정보를 바탕으로 메타데이터 AIP를 생성하는 것을 특징으로 하는 트위터 기록물 장기보존 시스템.
  17. 삭제
  18. 삭제
KR1020120137439A 2012-11-29 2012-11-29 트위터 기록물 장기보존 시스템 KR101426482B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120137439A KR101426482B1 (ko) 2012-11-29 2012-11-29 트위터 기록물 장기보존 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120137439A KR101426482B1 (ko) 2012-11-29 2012-11-29 트위터 기록물 장기보존 시스템

Publications (2)

Publication Number Publication Date
KR20140069756A KR20140069756A (ko) 2014-06-10
KR101426482B1 true KR101426482B1 (ko) 2014-08-26

Family

ID=51124784

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120137439A KR101426482B1 (ko) 2012-11-29 2012-11-29 트위터 기록물 장기보존 시스템

Country Status (1)

Country Link
KR (1) KR101426482B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101627550B1 (ko) * 2015-06-18 2016-06-07 주식회사 스토리안트 기계학습 기반 지능형 기록물 공개관리 시스템
KR101887629B1 (ko) * 2018-02-14 2018-08-10 대신네트웍스 주식회사 자연어기반 정보공개분류시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060046539A (ko) * 2004-09-09 2006-05-17 마이크로소프트 코포레이션 데이터 보호 시스템에서 데이터를 보호하기 위한 아카이브루틴을 생성하는 방법, 시스템 및 장치
KR20080061501A (ko) * 2006-12-28 2008-07-03 학교법인 대전기독학원 웹 페이지 관리를 위한 웹 아카이브 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060046539A (ko) * 2004-09-09 2006-05-17 마이크로소프트 코포레이션 데이터 보호 시스템에서 데이터를 보호하기 위한 아카이브루틴을 생성하는 방법, 시스템 및 장치
KR20080061501A (ko) * 2006-12-28 2008-07-03 학교법인 대전기독학원 웹 페이지 관리를 위한 웹 아카이브 시스템 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IMPERIAL COLLEGE LONDON, DEPARTMENT OF COMPUTING, SEPTEMBER,2012 *
IPRES SEPTEMBER 19 - 24, 2010, CAMPBELL *

Also Published As

Publication number Publication date
KR20140069756A (ko) 2014-06-10

Similar Documents

Publication Publication Date Title
JP6997776B2 (ja) 一致するコンテンツを特定するためのシステムおよび方法
US8572196B2 (en) Systems and methods for video messaging and confirmation
US10057349B2 (en) Data stream consolidation in a social networking system for near real-time analysis
US10754985B2 (en) Anonymizing user identifiable information
US10133716B2 (en) Generation of notifications in a collaborative document editing environment
US9378465B2 (en) Methods and systems of classifying spam URL
US10248867B2 (en) Systems and methods for providing playback of selected video segments
Littman et al. API-based social media collecting as a form of web archiving
CN110061903B (zh) 用于生成社交网络活动流的方法
US20100179915A1 (en) Apparatus, system, and method for aggregating a plurality of feeds
KR102300162B1 (ko) 미디어 컨텐츠 상에 오버레이된 텍스트로 된 소셜 발언을 제공하기 위한 시스템 및 방법
US9674304B2 (en) Systems and methods for substituting references to content
WO2011136822A1 (en) News feed techniques
US11153071B2 (en) Citation and attribution management methods and systems
US20080104226A1 (en) Using feed usage data in an access controlled team project site environment
Acker et al. Tweets may be archived: civic engagement, digital preservation and Obama White House social media data
AU2016398632A1 (en) Systems and methods for identifying matching content
US8880595B2 (en) Asynchronous, passive knowledge sharing system and method
Human et al. Data protection and consenting communication mechanisms: Current open proposals and challenges
KR101426482B1 (ko) 트위터 기록물 장기보존 시스템
US9811525B1 (en) Message and attachment deletion
EP3073743B1 (en) Systems and methods for providing playback of selected video segments
JP2009252008A (ja) 営業支援システム
JP5499914B2 (ja) 情報処理プログラム及び情報処理装置
Skouby et al. Introduction to the Minitrack on Privacy, 5G and Economics

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right