KR20210052604A - 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법 - Google Patents
뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법 Download PDFInfo
- Publication number
- KR20210052604A KR20210052604A KR1020190134977A KR20190134977A KR20210052604A KR 20210052604 A KR20210052604 A KR 20210052604A KR 1020190134977 A KR1020190134977 A KR 1020190134977A KR 20190134977 A KR20190134977 A KR 20190134977A KR 20210052604 A KR20210052604 A KR 20210052604A
- Authority
- KR
- South Korea
- Prior art keywords
- news
- social content
- social
- news article
- time
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000004891 communication Methods 0.000 claims description 20
- 238000013515 script Methods 0.000 claims description 4
- 239000002131 composite material Substances 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 description 11
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G06Q50/30—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Operations Research (AREA)
Abstract
본 발명은 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법에 관한 것으로, 뉴스 기사를 사용자 관점에서 재구성하여 서비스하기 위한 것이다. 본 발명은 온라인 상에서 뉴스 기사를 수집하여 데이터베이스화하고, 사용자 간 대화를 포함하는 소셜 미디어에서 키워드를 추출하는 단계, 키워드별로 수집한 뉴스 기사를 분류하여 그룹핑하는 단계, 그룹핑한 뉴스 기사를 표시할 템플릿을 선택하는 단계, 선택한 템플릿에 따라 그룹핑한 뉴스 기사 간의 연관성을 기반으로 재구성하여 소셜 컨텐츠를 생성하는 단계, 및 생성한 소셜 컨텐츠를 제공하는 단계를 포함하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법을 제공한다.
Description
본 발명은 컨텐츠 서비스 기술에 관한 것으로, 더욱 상세하게는 뉴스 기사를 사용자 관점에서 재구성하여 서비스하는 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법에 관한 것이다.
정보통신기술의 발달로 인해 인터넷 사용이 대중화되면서 기존에 오프라인에서 이루어지던 많은 비즈니스 또는 서비스들이 온라인을 통해 제공되도록 보편화되고 있다.
이러한 일 예로서 신문 사업이 있다. 즉 예전에는 작성된 뉴스 기사를 취합하여 종이로 된 신문을 인쇄하고 이를 일별 또는 정해진 기간 단위로 정기적으로 구독자에게 배달하는 방식이었다. 하지만 현재는 작성된 뉴스 기사를 종이가 아닌 온라인을 통해 공중에 배포하는 온라인 신문의 형태를 취하고 있다. 또는 포털 사이트가 신문사들 마다 온라인을 통해 배포된 온라인 뉴스 기사를 취합하고, 취합한 온라인 뉴스 기사를 카테고리별로 세분화하여 제공하고 있다.
이와 같이 기존에는 뉴스 기사를 특정 주제, 예컨대 정치, 경제, 사회, 스포츠, 연애 등을 중심으로 분류하거나, 클러스터링 하는 것이 존재하였다.
하지만 이러한 분류 및 클러스터링 방식은 큰 주제별로 뉴스 기사를 추천해줄 수 있지만, 각각의 뉴스 기사 간의 시간 흐름에 따른 연관 관계를 한 눈에 보기 어려운 단점이 있다.
또한 신문사 또는 포털 사이트에 제공하는 뉴스 기사는 제공자 관점에서 제공하기 때문에, 뉴스 기사를 소비하는 사용자 관점과는 차이가 있을 수 있다.
따라서 본 발명의 목적은 뉴스 기사를 사용자 관점에서 재구성하여 제공하는 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법을 제공하는 데 있다.
본 발명의 다른 목적은 뉴스 기사를 사용자 관점에서 재구성하여 뉴스 기사 간의 연관성을 한 눈에 파악할 수 있도록 제공하는 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법을 제공하는 데 있다.
상기 목적을 달성하기 위하여, 본 발명은 온라인 상에서 뉴스 기사를 수집하여 데이터베이스화하고, 사용자 간 대화를 포함하는 소셜 미디어에서 키워드를 추출하는 단계; 키워드별로 수집한 뉴스 기사를 분류하여 그룹핑하는 단계; 그룹핑한 뉴스 기사를 표시할 템플릿을 선택하는 단계; 선택한 템플릿에 따라 그룹핑한 뉴스 기사 간의 연관성을 기반으로 재구성하여 소셜 컨텐츠를 생성하는 단계; 및 생성한 소셜 컨텐츠를 제공하는 단계;를 포함하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법을 제공한다.
상기 키워드는 상기 소셜 미디어에 포함된 텍스트에서 추출한 고유명사이다.
상기 템플릿은 시간의 흐름에 무관하게 뉴스 기사를 배열하여 표시하는 일반형 템플릿; 시간의 흐름에 따라 뉴스 기사를 배열하여 표시하는 시간형 템플릿; 및 상기 일반형 템플릿과 상기 시간형 템플릿의 조합으로 이루어진 복합형 템플릿;을 포함할 수 있다.
본 발명에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 방법은 상기 그룹핑하는 단계와 상기 템플릿을 선택하는 단계 사이에 수행되는, 그룹핑한 뉴스 기사에서 중복되는 뉴스 기사를 제거하는 단계;를 더 포함할 수 있다.
상기 소셜 컨텐츠를 생성하는 단계는, 중복 제거 후 남은 그룹핑한 뉴스 기사를 재구성하는 단계; 및 재구성한 뉴스 기사를 선택한 템플릿에 반영하여 소셜 매거진을 생성하는 단계;를 포함할 수 있다.
상기 재구성하는 단계는, 중복 제거 후 남은 그룹핑한 뉴스 기사를 아웃라이어(outlier) 그룹과 메인 그룹으로 분류하는 단계; 아웃라이어 그룹과 메인 그룹에서 각각 클러스터링을 수행하는 단계; 및 각각의 클러스터에 포함된 뉴스 기사의 텍스트를 요약하는 단계;를 포함할 수 있다.
상기 소셜 매거진은 키워드와 관련된 뉴스 기사를 저장한 JSON(Java Script Object Notation) 파일일 수 있다.
상기 제공하는 단계에서, 제공되는 소셜 매거진은 상기 JSON 파일을 변환한 HTML 파일 형식을 가질 수 있다.
상기 소셜 컨텐츠를 생성하는 단계는, 상기 소셜 매거진을 생성하는 단계 이후에 수행되는, 상기 JSON 파일에 포함된 뉴스 기사를 추출하는 단계; 추출한 뉴스 기사로부터 텍스트 정보, 상기 텍스트 정보를 음성 변환하여 생성한 음성 정보, 이미지 정보를 획득하는 단계; 획득한 음성 정보를 자막으로 변환하는 단계; 및 상기 이미지 정보에 음성 정보와 자막을 동기화시켜 비디오 컨텐츠를 생성하는 단계;를 포함할 수 있다.
상기 자막으로 변환하는 단계는, 상기 텍스트 정보를 문장 단위로 분리하는 단계; 상기 음성 정보의 재생 시간을 산출하는 단계; 상기 음성 정보의 재생 시간으로부터 상기 텍스트 정보의 각 문장이 음성 정보에서 재생되는 시각을 산출하는 단계; 및 상기 텍스트 정보의 문장별로 자막이 비디오 컨텐츠에서 나타나는 시작 시간과 끝 시간을 함께 입력하여 자막 파일을 생성하는 단계;를 포함할 수 있다.
상기 시각을 산출하는 단계에서, 비디오 컨텐츠에서 자막이 나오는 시각과 음성 재생 시각을 일치시키기 위해 전체 텍스트 길이와 음성 정보의 재생 시간을 참조하여 각 문장이 음성 정보에서 재생되는 시각을 계산할 수 있다.
상기 시각을 산출하는 단계는, 상기 음성 정보의 재생 시간을 전체 텍스트에 대한 길이로 나누어 음절 당 음성 정보의 재생 시간을 산출하는 단계; 및 전체 텍스트를 각각의 문장으로 나누어 각 문장의 음절 수에 음절 당 재생 시간을 곱하여 문장별 재생 시간을 산출하는 단계;를 포함할 수 있다.
상기 문장별 재생 시간을 산출하는 단계에서, 각 문장 내 숫자의 개수에 대한 시간 지연을 보정할 수 있다.
본 발명은 또한, 뉴스 기사를 생성하여 온라인으로 배포하는 뉴스 기사 제공 장치와 통신하고, 사용자 간 대화를 포함하는 소셜 미디어를 제공하는 소셜 미디어 제공 장치와 통신하는 통신부; 상기 통신부를 통하여 상기 뉴스 기사 제공 장치로부터 뉴스 기사를 수집하여 데이터베이스화하는 데이터베이스부; 및, 상기 통신부를 통하여 상기 소셜 미디어 제공 장치로부터 소셜 미디어를 수집하여 사용자 간 대화로부터 키워드를 추출하는 키워드 추출부, 키워드별로 수집한 뉴스 기사를 분류하여 그룹핑하고, 그룹핑한 뉴스 기사를 표시할 템플릿을 선택하고, 선택한 템플릿에 따라 그룹핑한 뉴스 기사 간의 연관성을 기반으로 재구성하여 소셜 컨텐츠를 생성하는 소셜 컨텐츠 생성부, 및 생성한 소셜 컨텐츠를 상기 통신부를 통하여 제공하는 소셜 컨텐츠 제공부를 구비하는 제어부;를 포함하는 뉴스 기사 기반 소셜 컨텐츠 서비스 장치를 제공한다.
본 발명에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 장치는 뉴스 기사를 사용자 관점에서 재구성하여 소셜 컨텐츠를 생성하여 사용자에게 제공할 수 있다. 즉 소셜 컨텐츠는 사용자 간 대화와 같은 소셜 미디어에서 추출된 키워드를 기반으로 뉴스 기사를 분류하되 뉴스 기사 간의 연관성, 예컨대 시간 흐름에 따른 연관성에 따라 배열하여 소셜 매거진 또는 비디오 컨텐츠로 구현함으로써, 사용자는 소셜 컨텐츠를 통하여 뉴스 기사 간의 시간 흐름에 따른 연관 관계를 한 눈에 파악할 수 있도록 할 수 있다.
뉴스 기사는 다양한 주제들을 다루고 있기 때문에, 본 발명에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 장치는 소셜 미디어에서 추출된 사용자가 원하는 특정 주제(키워드)에 대해 다양한 템플릿을 기반으로 소셜 매거진을 생성할 수 있다.
본 발명에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 장치는 뉴스 기사를 기반으로 하는 소셜 매거진의 재배포 뿐만 아니라, 비디오 컨텐츠도 함께 제공하여 다양한 미디어 환경의 컨텐츠를 사용자에게 제공할 수 있다.
본 발명에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 장치는 비슷한 주제에 대해서도 소셜 매거진 생성 시, 입력된 키워드와 연관성이 높은 뉴스 기사를 다양한 형태의 템플릿을 기반으로 여러 유형의 스토리를 제공할 수 있다.
본 발명에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 장치는 하나의 뉴스 기사만을 추천해주는 것이 아니라, 각 뉴스 기사를 기반으로 만든 매거진 형식의 소셜 매거진 또는 비디어 컨텐츠를 사용자에게 추천할 수 있다.
도 1은 본 발명의 실시예에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 시스템을 보여주는 블록도이다.
도 2는 도 1의 뉴스 기사 기반 소셜 컨텐츠 서비스 장치를 보여주는 블록도이다.
도 3은 본 발명의 실시예에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 방법에 따른 흐름도이다.
도 4는 도 3의 소셜 컨텐츠를 생성하는 단계 중 소셜 매거진을 생성하는 단계를 보여주는 흐름도이다.
도 5는 도 4의 그룹핑한 뉴스 기사를 재구성하는 단계에 대한 상세 흐름도이다.
도 6은 도 3의 소셜 컨텐츠를 생성하는 단계 중 비디오 컨텐츠를 생성하는 단계를 보여주는 흐름도이다.
도 7은 도 6의 비디오 컨텐츠를 생성하는 단계의 상세 흐름도이다.
도 8 내지 도 11은 도 3의 소셜 컨텐츠 서비스 방법에 의해 생성된 소셜 매거진의 화면 예시도이다.
도 2는 도 1의 뉴스 기사 기반 소셜 컨텐츠 서비스 장치를 보여주는 블록도이다.
도 3은 본 발명의 실시예에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 방법에 따른 흐름도이다.
도 4는 도 3의 소셜 컨텐츠를 생성하는 단계 중 소셜 매거진을 생성하는 단계를 보여주는 흐름도이다.
도 5는 도 4의 그룹핑한 뉴스 기사를 재구성하는 단계에 대한 상세 흐름도이다.
도 6은 도 3의 소셜 컨텐츠를 생성하는 단계 중 비디오 컨텐츠를 생성하는 단계를 보여주는 흐름도이다.
도 7은 도 6의 비디오 컨텐츠를 생성하는 단계의 상세 흐름도이다.
도 8 내지 도 11은 도 3의 소셜 컨텐츠 서비스 방법에 의해 생성된 소셜 매거진의 화면 예시도이다.
하기의 설명에서는 본 발명의 실시예를 이해하는데 필요한 부분만이 설명되며, 그 이외 부분의 설명은 본 발명의 요지를 흩트리지 않는 범위에서 생략될 것이라는 것을 유의하여야 한다.
이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 바람직한 실시예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 보다 상세하게 설명하고자 한다.
도 1은 본 발명의 실시예에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 시스템을 보여주는 블록도이다.
도 1을 참조하면, 본 실시예에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 시스템은 다양한 매체로부터 제공되는 뉴스 기사를 사용자 관점에서 뉴스 기사를 수집 및 재구성하여 소셜 컨텐츠로 생성하고, 생성한 소셜 컨텐츠를 사용자에게 제공하는 서비스 시스템이다.
이러한 본 실시에에 따른 소셜 컨텐츠 서비스 시스템은 온라인 상에 구현된 뉴스 기사 제공 장치, 소셜 미디어 제공 장치 및 소셜 컨텐츠 서비스 장치를 포함하며, 소셜 컨텐츠를 소비하는 사용자 단말기를 더 포함할 수 있다.
뉴스 기사 제공 장치는 뉴스 기사를 생성하여 온라인으로 배포한다. 예컨대 뉴스 기사 제공 장치는 신문사, 잡지사, 방송사, 포털 사이트 등을 포함할 수 있다. 뉴스 기사는 텍스트를 포함하며, 음성 또는 이미지 중에 적어도 하나를 더 포함할 수 있다. 음성은 텍스트와 관련된 음성으로, 텍스트를 변환한 음성일 수 있다. 이미지는 사진 및 동영상 중에 적어도 하나를 포함한다.
소셜 미디어 제공 장치는 사용자 간 대화를 포함하는 소셜 미디어를 제공한다. 여기서 소셜 미디어는 사람들의 의견, 생각, 경험, 관점들을 서로 공유하기 위해 사용하는 온라인 도구나 플랫폼을 의미한다. 이러한 소셜 미디어는 텍스트, 이미지, 오디오, 비디오 등 다양한 형태를 가지고 있다. 예컨대 소셜 미디어는 블로그(blogs), 소셜 네트워크(Social Networks), 메시지 보드(Message Boards), 팟캐스트(Podcasts), 위키스(Wikis), 비디오 블로그(Vlog) 등을 포함할 수 있다.
소셜 컨텐츠 서비스 장치는 뉴스 기사 및 소셜 미디어를 기반으로 뉴스 기사를 추출 및 재구성하여 소셜 컨텐츠를 생성하고, 생성한 소셜 컨텐츠를 제공한다. 소셜 컨텐츠 서비스 장치는 사용자가 관심이 있는 뉴스 기사를 제공하기 위해서, 사용자 간 대화를 포함하는 소셜 미디어로부터 추출된 키워드를 기반으로 뉴스 기사를 추출하고, 추출한 뉴스 기사를 재구성하여 소셜 컨텐츠를 생성하여 제공한다. 여기서 소셜 컨텐츠는 소셜 매거진과, 소셜 매거진으로 기반으로 생성한 비디오 컨텐츠를 포함한다. 이러한 소셜 컨텐츠 서비스 장치는 온라인 상에 구현된 서버로서, 클라우드 서버를 포함할 수 있다.
그리고 사용자 단말기는 온라인을 통하여 소셜 컨텐츠 서비스 장치에 접속하여 소셜 컨텐츠를 제공받는다. 이러한 사용자 단말기는 통신 기능을 구비한 통신 단말기로서, 예컨대 PC, 스마트폰, 태블릿 PC, 웨어러블 기기 등을 포함한다.
이와 같은 본 실시예에 따른 소셜 컨텐츠 서비스 장치에 대해서 도 1 및 도 2를 참조하여 설명하면 다음과 같다. 여기서 도 2는 도 1의 뉴스 기사 기반 소셜 컨텐츠 서비스 장치를 보여주는 블록도이다.
본 실시예에 따른 소셜 컨텐츠 서비스 장치는 통신부, 데이터베이스부 및 제어부를 포함한다. 제어부는 키워드 추출부, 소셜 컨텐츠 생성부 및 소셜 컨텐츠 제공부를 포함한다.
통신부는 온라인을 통해서 뉴스 기사 제공 장치, 소셜 미디어 제공 장치 및 사용자 단말기와 통신을 수행한다. 통신부는 제어부의 제어에 따라 뉴스 기사 제공 장치가 배포하는 뉴스 기사를 수집한다. 통신부는 제어부의 제어에 따라 소셜 미디어 제공 장치로부터 소셜 미디어를 수집한다. 그리고 통신부는 제어부의 제어에 따라 사용자 단말기가 요청하는 소셜 컨텐츠를 제공한다.
데이터베이스부는 통신부를 통하여 뉴스 기사 제공 장치로부터 수집한 뉴스 기사를 데이터베이스화한다. 여기서 뉴스 기사는 자동화 스크립트 및 데이터베이스 모듈을 통해 수집된다. 뉴스 기사에 대한 메타데이터들을 데이터베이스부에 삽입한다. 뉴스 기사에 대한 메타데이터는 뉴스 기사 제목, 업로드 날짜 및 시간, URL 정보, 이미지 정보, 본문 및 요약문 등을 포함할 수 있다.
데이터베이스부는 생성한 소셜 컨텐츠를 저장할 수 있다. 소셜 컨텐츠는 키워드별로 저장될 수 있다.
그리고 제어부는 소셜 컨텐츠 서비스 장치의 전반적인 동작을 수행하는 프로세서이다. 이러한 제어부는 키워드 추출부, 소셜 컨텐츠 생성부 및 소셜 컨텐츠 제공부를 포함한다. 키워드 추출부는 통신부를 통하여 소셜 미디어 제공 장치로부터 소셜 미디어를 수집하여 사용자 간 대화로부터 키워드를 추출한다. 소셜 컨텐츠 생성부는 키워드별로 수집한 뉴스 기사를 분류하여 그룹핑하고, 그룹핑한 뉴스 기사를 표시할 템플릿을 선택하고, 선택한 템플릿에 따라 그룹핑한 뉴스 기사 간의 연관성을 기반으로 재구성하여 소셜 컨텐츠를 생성한다. 그리고 소셜 컨텐츠 제공부는 생성한 소셜 컨텐츠를 통신부를 통하여 제공한다.
여기서 키워드 추출부는 소셜 미디어의 사용자 간 대화로부터 키워드를 추출한다. 즉 사용자 간 대화로부터 문장을 획득한다. 획득한 문장별로 키워드를 추출하고, 추출한 키워드를 모아서 키워드 리스트를 생성한다. 키워드 리스트에 표시된 키워드는 추출된 횟수를 기준으로 상위에서 하위 순으로 배열될 수 있다.
본 실시예에 따른 키워드는 사용자 간 대화로부터 추출되고, 해당 키워드가 사용자 간 대화에서 자주 등장한다는 것은 사용자들의 관심의 대상임을 알 수 있다. 따라서 본 실시예에서는 사용자들의 관심 대상인 키워드를 기반으로 뉴스 기사를 추출하고 재구성함으로써, 뉴스 기사를 사용자 관점에서 재구성하여 서비스할 수 있는 기초를 제공한다.
키워드 추출부는 획득한 문장에 대한 형태소 분석을 통해서 명사를 추출한다. 키워드 추출부는 추출한 명사 중에서 고유명사를 키워드로 추출한다. 여기서 고유명사는 사람이름, 영화제목, 책제목, 지명 등이 포함되며, 이것에 한정되는 것은 아니다.
소셜 컨텐츠 생성부는 키워드 리스트와 데이터베이스부에서 가져올 뉴스 기사를 기반으로 소셜 컨텐츠를 생성한다. 소셜 컨텐츠 생성부는 뉴스 기사들에 대한 중복 제거, 템플릿 선택, 아웃라이어 선택, 클러스터링 및 요약 과정을 거쳐서 소셜 컨텐츠를 생성한다.
먼저 소셜 컨텐츠 생성부는 키워드 리스트의 키워드별로 관련성이 있는 뉴스 기사를 데이터베이스부에서 불러온다. 데이터베이스부에서 불러온 뉴스 기사 또한 리스트(이하 '기사 리스트'라 함) 형태를 갖는다.
다음으로 소셜 컨텐츠 생성부는 뉴스 기사들에 대한 중복 제거를 수행한다. 여기서 기사 리스트에 포함된 뉴스 기사에 대한 중복 제거를 수행하는 이유는 웹 미디어의 특성상 같은 내용이 다른 곳에 반복적으로 게시되거나, 같은 내용을 담은 뉴스 기사가 다수 존재할 가능성이 높기 때문이다. 그리고 중복된 뉴스 기사가 많이 존재하면, 다음 과정에 진행될 클러스터링 및 요약 과정의 수행속도와 정확도 측면에서 성능이 낮아질 수 있기 때문에, 중복된 뉴스 기사를 미리 검출하여 제거하는 것이 바람직하다.
다음으로 소셜 컨텐츠 생성부는 중복 제거 후 남은 그룹핑한 뉴스 기사를 표시할 템플릿을 선택한다.
템플릿 마다 표현하는 내용이 다르므로, 뉴스 기사 분석 작업을 진행하기 전에 최적의 템플릿을 선택하는 과정이 필요하다. 선택된 템플릿 종류에 따라서 소셜 매거진의 결과로 출력해야 하는 정보도 달라지게 되며, 다음에 처리해야 할 과정에 변화가 있을 수 있다. 예컨대 템플릿은 시간의 흐름에 무관하게 뉴스 기사를 배열하여 표시하는 일반형 템플릿과, 시간의 흐름에 따라 뉴스 기사를 배열하여 표시하는 시간형 템플릿이다. 시간형 템플릿은 일별, 월별, 계절별, 연별 템플릿을 포함할 수 있다. 그 외 템플릿은 일반형 템플릿과 시간형 템플릿의 조합으로 이루어진 복합형 템플릿을 더 포함할 수 있다.
여기서 일반형 템플릿은 소셜 매거진에 대한 전체 스토리를 시간의 흐름에 상관없이 요약하여 표시할 수 있는 템플릿이다. 일별 템플릿은 특정 기간 동안 많은 양의 뉴스 기사가 생산되는 경우 적합한 템플릿이다. 월별 템플릿은 오랜 기간 일어나는 스토리를 매달 하나씩 요약하여 정리해주는 템플릿이다. 연별 템플릿은 연도별로 뉴스 기사를 요약해주는 템플릿이다. 계절별 템플릿은 계절별로 뉴스 기사를 요약해주는 템플릿이다.
다음으로 소셜 컨텐츠 생성부는 중복 제거 후 남은 그룹핑한 뉴스 기사를 재구성한다. 여기서 소셜 컨텐츠 생성부는 다음과 같이 중복 제거 후 남은 그룹핑한 뉴스 기사를 재구성할 수 있다.
먼저 소셜 컨텐츠 생성부는 아웃라이어(outlier) 선택 과정을 수행하다. 즉 소셜 컨텐츠 생성부는 중복 제거 후 남은 그룹핑한 뉴스 기사에서 아웃라이어를 선택하여 아웃라이어 그룹과 메인 그룹으로 분류한다.
아웃라이어 선택 과정은 특정 키워드에 대해 스토리가 중심을 잡고 나아갈 수 있게 하는 역할을 한다. 다른 뉴스 기사와 분류되지 않고 따로 떨어져 있는 뉴스 기사를 아웃라이어로 분류함으로써, 이후 진행할 클러스터링 과정에서의 성능 저하를 억제할 수 있다.
소셜 컨텐츠 생성부는 그룹핑한 뉴스 기사에서 선택된 아웃라이어로 아웃라이어 그룹을 형성하고, 나머지를 메인 그룹으로 분류한다.
다음으로 소셜 컨텐츠 생성부는 아웃라이어 그룹과 메인 그룹에서 각각 클러스터링 과정을 수행한다. 즉 메인 그룹에 포함된 뉴스 기사에 대해서만 클러스터링을 수행할 수 있지만, 아웃라이어 그룹에 포함된 뉴스 기사도 소셜 컨텐츠에 반영할 수 있도록 클러스터링을 수행할 수 있다.
여기서 클러스터링 과정은 뉴스 기사 내 텍스트 정보를 유사한 것끼리 모으기 위한 과정이며, 문장 단위로 각 클러스터에서 중요도가 높은 문장을 중심으로 클러스터링을 수행할 수 있다. 중요도가 높은 문장은 뉴스 기사들에서 공통적으로 자주 나오는 문장에서 선택될 수 있다. 뉴스 기사들에서 문장이 나오는 빈도에 따라서 수치화한다. 수치화한 값이 일정 임계값 이상인 경우 중요도가 높은 문장으로 선택될 수 있다.
그리고 소셜 컨텐츠 생성부는 각각의 클러스터에 포함된 뉴스 기사를 일정 비율로 요약하여 요약문을 생성한다. 예컨대 요약문은 뉴스 기사의 원문에 대해서 70%, 50% 비율로 요약될 수 있다. 즉 소셜 컨텐츠 생성부는 각 클러스터에서 순위가 높은 문장을 반환하고, 유사도가 특정 값 이상인 문장 짝들을 선택하고, 순위가 낮은 문장을 제거하는 방식으로 요약문을 생성한다. 즉 요약문에 사용될 문장을 순위별로 배열한 후 순위가 낮은 순으로 문장을 제거함으로써, 소셜 컨텐츠 생성부는 70%, 50% 비율로 요약된 요약문을 생성할 수 있다.
전술된 바와 같은 과정을 거쳐서 키워드별로 뉴스 기사들은 JSON(Java Script Object Notation) 파일 형태로 저장되며, 소셜 컨텐츠 생성부는 JSON 파일을 변환한 HTML 파일 형식의 소셜 매거진을 생성한다. 즉 소셜 매거진은 키워드와 관련된 뉴스 기사를 저장한 JSON 파일이고, 사용자에게 제공되는 소셜 매거진은 JSON 파일을 변환한 HTML 파일 형식을 가질 수 있다.
소셜 컨텐츠 생성부는 또한 JSON 파일을 기반으로 비디오 컨텐츠를 생성할 수 있다. 즉 소셜 컨텐츠 생성부는 JSON 파일에 포함된 뉴스 기사를 추출한다. 소셜 컨텐츠 생성부는 추출한 뉴스 기사로부터 텍스트 정보, 텍스트 정보를 음성 변환하여 생성한 음성 정보, 이미지 정보를 획득한다. 소셜 컨텐츠 생성부는 획득한 음성 정보를 자막으로 변환한다. 그리고 소셜 컨텐츠 생성부는 이미지 정보에 음성 정보와 자막을 동기화시켜 비디오 컨텐츠를 생성한다.
이때 텍스트 정보는 JSON 파일의 메타데이터로에서 추출된다. 텍스트 정보는 txt 파일로 저장되고 비디오 컨텐츠의 자막으로 사용된다. 텍스트의 음성 정보는 텍스트를 Text-to-Speech(TTS) 과정을 거쳐 음성 합성한 mp3 파일(음성 파일)일 수 있다. 이미지 정보는 뉴스 기사에 포함된 이미지의 URL 정보일 수 있다. 이미지의 URL 정보를 통해 웹으로부터 jpg 파일의 형태로 이미지를 얻을 수 있다. 결과적으로 소셜 컨텐츠 생성부는 음성(mp3), 텍스트(txt) 및 이미지(jpg) 정보를 가지고 음성 속도에 맞게 자막이 나오는 mp4 형태의 비디오 컨텐츠를 생성할 수 있다.
소셜 컨텐츠 생성부는 다음과 같이 자막 파일을 생성할 수 있다. 뉴스 기사의 본문인 텍스트 정보를 문장 단위로 분리하고, 음성 합성으로 얻어진 mp3 파일(음성 파일)의 재생 시간 정보를 얻는다. 최종 결과물인 비디오 컨텐츠에서 자막이 나오는 시각과 음성 재생 시각을 일치시키기 위해 전체 텍스트 길이와 음성 파일의 재생시간을 고려하여 각 문장이 음성 파일에서 재생되는 시각을 계산한다. 먼저 음성 파일의 재생 시간을 전체 텍스트에 대한 길이로 나누어 음절 당 음성 파일의 재생 시간을 구한다. 이후 전체 텍스트를 각각의 문장으로 나누어 각 문장의 음절 수에 음절 당 재생 시간을 곱하여 문장별 재생 시간을 얻는다. 이 과정에서, 숫자를 읽는 경우 연도 및 날짜를 읽는 경우가 많으므로, 각 문장 내 숫자의 개수에 대한 시간 지연을 보정한다. 마지막 문장의 경우 비디오 컨텐츠가 끝나는 시각까지 나타나도록 설정한다. 각 문장별로 자막이 비디오 컨텐츠에서 나타나는 시작 시간과 끝 시간을 함께 입력하여 자막 파일을 생성한다.
소셜 컨텐츠 생성부는 이미지 편집 과정을 수행할 수 있다. 즉 소셜 컨텐츠 생성부는 이미지의 URL 정보를 통해 이미지를 저장하고, 이미지의 크기 및 비율을 비디오에 맞도록 일정하게 조절한다. 소셜 컨텐츠 생성부는 새롭게 크기가 조절된 이미지에 대해 비디오에서 얼마나 재생되도록 할 것인지 결정하는 과정을 거치고, 각 이미지가 나타나거나 끝나는 지점에서 fade-in, fade-out 효과를 주어 자연스럽게 비디오가 재생되도록 한다.
그리고 소셜 컨텐츠 생성부는 자막 정보, 음성 정보, 이미지 정보 및 배경 음악을 통해서 하나의 비디오 컨텐츠를 생성한다.
이와 같은 본 실시예에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 방법에 대해서 도 3 내지 9를 참조하여 설명하면 다음과 같다.
도 3은 본 발명의 실시예에 따른 뉴스 기사 기반 소셜 컨텐츠 서비스 방법에 따른 흐름도이다.
먼저 S10단계에서 소셜 컨텐츠 서비스 장치는 온라인 상에서 뉴스 기사를 수집하여 데이터베이스화 하고, 소셜 미디어에서 키워드를 추출한다. 즉 소셜 컨텐츠 서비스 장치는 소셜 미디어에 포함된 사용자 간 대화로부터 문장을 획득하고, 획득한 문장으로부터 키워드를 추출한다.
소셜 컨텐츠 서비스 장치는 추출한 키워드로 키워드 리스트를 생성한다. 키워드 리스트는 추출된 횟수를 기준으로 키워드를 상위에서 하위 순으로 배열한다.
다음으로 S20단계에서 소셜 컨텐츠 서비스 장치는 키워드별로 뉴스 기사를 분류하여 그룹핑한다. 즉 키워드별로 그룹핑된 뉴스 기사는 기사 리스트의 형태를 갖는다.
다음으로 S30단계에서 소셜 컨텐츠 서비스 장치는 그룹핑한 뉴스 기사에서 중복되는 뉴스 기사를 제거한다. 즉 기사 리스트에서 중복되는 뉴스 기사는 제거한다.
다음으로 S40단계에서 소셜 컨텐츠 서비스 장치는 템플릿을 선택한다.
이어서 S50단계에서 소셜 컨텐츠 서비스 장치는 선택한 템플릿에 따라 그룹핑한 뉴스 기사를 재구성하여 소셜 컨텐츠를 생성한다.
그리고 S90단계에서 소셜 컨텐츠 서비스 장치는 생성한 소셜 컨텐츠 제공한다.
여기서 S50단계에 대해서 도 4 및 도 5를 참조하여 설명하면 다음과 같다. 도 4는 도 3의 소셜 컨텐츠를 생성하는 단계 중 소셜 매거진을 생성하는 단계를 보여주는 흐름도이다. 도 5는 도 4의 그룹핑한 뉴스 기사를 재구성하는 단계에 대한 상세 흐름도이다.
먼저 S60단계에서 소셜 컨텐츠 서비스 장치는 중복 제거 후 남은 그룹핑한 뉴스 기사를 재구성하다.
그리고 S70단계에서 소셜 컨텐츠 서비스 장치는 재구성한 뉴스 기사를 선택한 템플릿에 반영하여 소셜 매거진을 생성한다.
여기서 S60단계는 다음과 같이 수행될 수 있다.
먼저 S61단계에서 소셜 컨텐츠 서비스 장치는 중복 제거 후 남은 그룹핑한 뉴스 기사를 아웃라이어 그룹과 메인 그룹으로 분류한다.
다음으로 S63단계에서 소셜 컨텐츠 서비스 장치는 아웃라이어 그룹과 메인 그룹에서 각각 클러스터링을 수행한다.
그리고 S65단계에서 소셜 컨텐츠 서비스 장치는 각각의 클러스터에 포함된 뉴스 기사의 텍스트를 요약해서 요약문을 생성한다.
다음으로 S70단계의 소셜 매거진을 생성하는 단계 이후에, 도 6 및 도 7에 도시된 바와 같이, 비디오 컨텐츠를 생성하는 단계가 수행된다. 여기서 도 6은 도 3의 소셜 컨텐츠를 생성하는 단계 중 비디오 컨텐츠를 생성하는 단계를 보여주는 흐름도이다. 도 7은 도 6의 비디오 컨텐츠를 생성하는 단계의 상세 흐름도이다.
먼저 S81단계에서 소셜 컨텐츠 서비스 장치는 소셜 매거진에 포함된 뉴스 기사를 추출한다. 즉 소셜 컨텐츠 서비스 장치는 JSON 파일에 포함된 뉴스 기사를 추출한다.
다음으로 S83단계에서 소셜 컨텐츠 서비스 장치는 추출한 뉴스 기사로부터 텍스트 정보, 텍스트의 음성 정보, 이미지 정보를 획득한다.
다음으로 S85단계에서 소셜 컨텐츠 서비스 장치는 음성 정보를 자막으로 변환한다. 즉 S851단계에서 소셜 컨텐츠 서비스 장치는 텍스트를 문장 단위로 분리한다. S853단계에서 소셜 컨텐츠 서비스 장치는 각 문장이 음성 정보에서 재생되는 시각을 계산한다. 그리고 S855단계에서 소셜 컨텐츠 서비스 장치는 각 문장별로 자막이 비디오 컨텐츠에서 나타나는 시작 시간과 끝 시간을 함께 입력하여 자막 파일을 생성한다
이때 S853단계에서 소셜 컨텐츠 서비스 장치는 음성 정보의 재생 시간을 산출한 후, 음성 정보의 재생 시간으로부터 텍스트 정보의 각 문장이 음성 정보에서 재생되는 시각을 산출한다.
즉 S853단계에서 소셜 컨텐츠 서비스 장치는 비디오 컨텐츠에서 자막이 나오는 시각과 음성 재생 시각을 일치시키기 위해 전체 텍스트 길이와 음성 정보의 재생 시간을 참조하여 각 문장이 음성 정보에서 재생되는 시각을 계산한다. 먼저 S853단계는 음성 정보의 재생 시간을 전체 텍스트에 대한 길이로 나누어 음절 당 음성 정보의 재생 시간을 산출하는 단계와, 전체 텍스트를 각각의 문장으로 나누어 각 문장의 음절 수에 음절 당 재생 시간을 곱하여 문장별 재생 시간을 산출하는 단계를 포함할 수 있다. 문장별 재생 시간을 산출하는 단계에서, 소셜 컨텐츠 서비스 장치는 각 문장 내 숫자의 개수에 대한 시간 지연을 보정한다.
이어서 S87단계에서 소셜 컨텐츠 서비스 장치는 이미지 편집을 수행한다. 즉 S871단계에서 소셜 컨텐츠 서비스 장치는 이미지의 크기 및 비율을 비디오에 맞도록 일정하게 조절하는 리사이징을 수행한다. 다음으로 S873단계에서 소셜 컨텐츠 서비스 장치는 영상 효과를 추가하고, S875단계에서 반복효과를 추가한다.
그리고 S89단계에서 소셜 컨텐츠 서비스 장치는 이미지 정보에 음성 정보와 자막을 동기화시켜 비디어 컨텐츠 생성한다. 즉 S891단계에서 소셜 컨텐츠 서비스 장치는 자막 정보, 음성 정보, 이미지 정보 및 배경 음악을 합성해서, S893단계에서 영상인 비디오 컨텐츠를 생성한다.
이와 같은 본 실시예에 따른 소셜 컨텐츠 서비스 방법에 의해 생성된 소셜 매거진의 화면 예시도가 도 8 내지 도 11에 도시되어 있다. 도 8 내지 도 11은 연별 템플릿을 이용하여 생성된 소셜 매거진을 보여준다.
도 8을 참조하면, 키워드를 축구선수인 "이강인"과 "이승우"으로 생성된 소셜 매겨진을 보여준다. 소셜 매거진은 "이강인"과 "이승우"와 관련된 뉴스 기사를 연도별로 표시한다.
도 8에서 "정정용 감독 '16세 이강인' U-18 대표"창을 클릭하면, 도 9에 도시된 바와 같이, "정정용 감독 '16세 이강인' U-18 대표"와 관련된 뉴스 기사가 팝업창으로 표시된다. 이때 뉴스 기사는 원문에서 50% 축소된 요약문으로 팝업창에 표시된 예를 개시하였다.
도 9의 팝업창에서 오른쪽 화살표 또는 팝업창에 표시된 70을 클릭하면, 도 10에 도시된 바와 같이, 뉴스 기사는 원문의 70% 요약문으로 팝업창에 표시된 예를 개시하였다.
그리고 도 10의 팝업창에서 오른쪽 화살표 또는 팝업창에 표시된 100을 클릭하면, 도 11에 도시된 바와 같이, 뉴스 기사의 원문이 팝업창에 표시된 예를 개시하였다.
한편 도 10의 팝업창에서 왼쪽 화살표 또는 팝업창에 표시된 50을 클릭하면, 도 9에 도시된 팝업창이 표시될 수 있다.
뉴스 기사가 이미지가 포함되어 있는 경우, 팝업창의 한쪽에 이미지가 함께 표시될 수 있다. 뉴스 기사에 포함된 이미지가 복수 개인 경우, 팝업창에 이미지들은 일정 시간 간격을 두고 순차적으로 표시될 수 있다.
한편, 본 명세서와 도면에 개시된 실시예들은 이해를 돕기 위해 특정 예를 제시한 것에 지나지 않으며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시예들 이외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형예들이 실시 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게는 자명한 것이다.
10 : 뉴스 기사 제공 장치
20 : 소셜 미디어 제공 장치
30 : 소셜 컨텐츠 서비스 장치 31 : 통신부
32 : 데이터베이스부 33 : 제어부
34 : 키워드 추출부 36 : 소셜 컨텐츠 생성부
38 : 소셜 컨텐츠 제공부 100 : 소셜 컨텐츠 서비스 시스템
30 : 소셜 컨텐츠 서비스 장치 31 : 통신부
32 : 데이터베이스부 33 : 제어부
34 : 키워드 추출부 36 : 소셜 컨텐츠 생성부
38 : 소셜 컨텐츠 제공부 100 : 소셜 컨텐츠 서비스 시스템
Claims (12)
- 온라인 상에서 뉴스 기사를 수집하여 데이터베이스화하고, 사용자 간 대화를 포함하는 소셜 미디어에서 키워드를 추출하는 단계;
키워드별로 수집한 뉴스 기사를 분류하여 그룹핑하는 단계;
그룹핑한 뉴스 기사를 표시할 템플릿을 선택하는 단계;
선택한 템플릿에 따라 그룹핑한 뉴스 기사 간의 연관성을 기반으로 재구성하여 소셜 컨텐츠를 생성하는 단계; 및
생성한 소셜 컨텐츠를 제공하는 단계;
를 포함하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제1항에 있어서,
상기 키워드는 상기 소셜 미디어에 포함된 텍스트에서 추출한 고유명사인 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제1항에 있어서, 상기 템플릿은
시간의 흐름에 무관하게 뉴스 기사를 배열하여 표시하는 일반형 템플릿;
시간의 흐름에 따라 뉴스 기사를 배열하여 표시하는 시간형 템플릿; 및
상기 일반형 템플릿과 상기 시간형 템플릿의 조합으로 이루어진 복합형 템플릿;
을 포함하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제1항에 있어서, 상기 그룹핑하는 단계와 상기 템플릿을 선택하는 단계 사이에 수행되는,
그룹핑한 뉴스 기사에서 중복되는 뉴스 기사를 제거하는 단계;
를 더 포함하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제4항에 있어서, 상기 소셜 컨텐츠를 생성하는 단계는,
중복 제거 후 남은 그룹핑한 뉴스 기사를 재구성하는 단계; 및
재구성한 뉴스 기사를 선택한 템플릿에 반영하여 소셜 매거진을 생성하는 단계;를 포함하고,
상기 재구성하는 단계는,
중복 제거 후 남은 그룹핑한 뉴스 기사를 아웃라이어(outlier) 그룹과 메인 그룹으로 분류하는 단계;
아웃라이어 그룹과 메인 그룹에서 각각 클러스터링을 수행하는 단계; 및
각각의 클러스터에 포함된 뉴스 기사의 텍스트를 요약하는 단계;
를 포함하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제5항에 있어서,
상기 소셜 매거진은 키워드와 관련된 뉴스 기사를 저장한 JSON(Java Script Object Notation) 파일이고,
상기 제공하는 단계에서,
제공되는 소셜 매거진은 상기 JSON 파일을 변환한 HTML 파일 형식을 갖는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제6항에 있어서, 상기 소셜 컨텐츠를 생성하는 단계는, 상기 소셜 매거진을 생성하는 단계 이후에 수행되는,
상기 JSON 파일에 포함된 뉴스 기사를 추출하는 단계;
추출한 뉴스 기사로부터 텍스트 정보, 상기 텍스트 정보를 음성 변환하여 생성한 음성 정보, 이미지 정보를 획득하는 단계;
획득한 음성 정보를 자막으로 변환하는 단계; 및
상기 이미지 정보에 음성 정보와 자막을 동기화시켜 비디오 컨텐츠를 생성하는 단계;
를 포함하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제7항에 있어서, 상기 자막으로 변환하는 단계는,
상기 텍스트 정보를 문장 단위로 분리하는 단계;
상기 음성 정보의 재생 시간을 산출하는 단계;
상기 음성 정보의 재생 시간으로부터 상기 텍스트 정보의 각 문장이 음성 정보에서 재생되는 시각을 산출하는 단계; 및
상기 텍스트 정보의 문장별로 자막이 비디오 컨텐츠에서 나타나는 시작 시간과 끝 시간을 함께 입력하여 자막 파일을 생성하는 단계;
를 포함하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제8항에 있어서, 상기 시각을 산출하는 단계에서,
비디오 컨텐츠에서 자막이 나오는 시각과 음성 재생 시각을 일치시키기 위해 전체 텍스트 길이와 음성 정보의 재생 시간을 참조하여 각 문장이 음성 정보에서 재생되는 시각을 계산하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제9항에 있어서, 상기 시각을 산출하는 단계는,
상기 음성 정보의 재생 시간을 전체 텍스트에 대한 길이로 나누어 음절 당 음성 정보의 재생 시간을 산출하는 단계; 및
전체 텍스트를 각각의 문장으로 나누어 각 문장의 음절 수에 음절 당 재생 시간을 곱하여 문장별 재생 시간을 산출하는 단계;
를 포함하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 제10항에 있어서, 상기 문장별 재생 시간을 산출하는 단계에서,
각 문장 내 숫자의 개수에 대한 시간 지연을 보정하는 것을 특징으로 하는 뉴스 기사 기반 소셜 컨텐츠 서비스 방법. - 뉴스 기사를 생성하여 온라인으로 배포하는 뉴스 기사 제공 장치와 통신하고, 사용자 간 대화를 포함하는 소셜 미디어를 제공하는 소셜 미디어 제공 장치와 통신하는 통신부;
상기 통신부를 통하여 상기 뉴스 기사 제공 장치로부터 뉴스 기사를 수집하여 데이터베이스화하는 데이터베이스부; 및
상기 통신부를 통하여 상기 소셜 미디어 제공 장치로부터 소셜 미디어를 수집하여 사용자 간 대화로부터 키워드를 추출하는 키워드 추출부,
키워드별로 수집한 뉴스 기사를 분류하여 그룹핑하고, 그룹핑한 뉴스 기사를 표시할 템플릿을 선택하고, 선택한 템플릿에 따라 그룹핑한 뉴스 기사 간의 연관성을 기반으로 재구성하여 소셜 컨텐츠를 생성하는 소셜 컨텐츠 생성부, 및
생성한 소셜 컨텐츠를 상기 통신부를 통하여 제공하는 소셜 컨텐츠 제공부를 구비하는 제어부;
를 포함하는 뉴스 기사 기반 소셜 컨텐츠 서비스 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190134977A KR102368823B1 (ko) | 2019-10-29 | 2019-10-29 | 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법 |
PCT/KR2019/016618 WO2021085731A1 (ko) | 2019-10-29 | 2019-11-28 | 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190134977A KR102368823B1 (ko) | 2019-10-29 | 2019-10-29 | 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210052604A true KR20210052604A (ko) | 2021-05-11 |
KR102368823B1 KR102368823B1 (ko) | 2022-03-03 |
Family
ID=75715545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190134977A KR102368823B1 (ko) | 2019-10-29 | 2019-10-29 | 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102368823B1 (ko) |
WO (1) | WO2021085731A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230051995A (ko) | 2021-10-12 | 2023-04-19 | 주식회사 피씨엔 | 실감형 확장현실 콘텐츠 관리 플랫폼 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030088928A (ko) * | 2002-05-15 | 2003-11-21 | 정보통신연구진흥원 | 무선 통신 시스템에서 맞춤정보 제공 시스템 및 그 방법 |
KR101353320B1 (ko) | 2012-07-16 | 2014-01-23 | 주식회사 이유씨시스템즈 | 소셜 네트워크 서비스 기반의 콘텐츠 관리시스템 |
KR20160069362A (ko) * | 2014-12-08 | 2016-06-16 | 삼성전자주식회사 | 전자 장치 및 그의 소셜 미디어 컨텐츠 제공 방법 |
KR20160103802A (ko) * | 2015-02-25 | 2016-09-02 | 국민대학교산학협력단 | 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법 |
KR20170114321A (ko) * | 2016-04-04 | 2017-10-16 | (주)어반트시스템 | 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100616152B1 (ko) * | 2004-01-13 | 2006-08-25 | 주식회사 이뉴스네트웍 | 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법 |
JP6222465B2 (ja) * | 2014-03-18 | 2017-11-01 | Kddi株式会社 | アニメーション生成装置、アニメーション生成方法およびプログラム |
KR20160119535A (ko) * | 2015-04-06 | 2016-10-14 | 이장규 | 사용자 장치 기반의 기사 편집 및 공유 방법 및 장치 |
KR101869618B1 (ko) * | 2016-12-29 | 2018-06-20 | (주) 쓰리웨어 | 맞춤형 뉴스컨텐츠 제공시스템 |
-
2019
- 2019-10-29 KR KR1020190134977A patent/KR102368823B1/ko active IP Right Grant
- 2019-11-28 WO PCT/KR2019/016618 patent/WO2021085731A1/ko active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030088928A (ko) * | 2002-05-15 | 2003-11-21 | 정보통신연구진흥원 | 무선 통신 시스템에서 맞춤정보 제공 시스템 및 그 방법 |
KR101353320B1 (ko) | 2012-07-16 | 2014-01-23 | 주식회사 이유씨시스템즈 | 소셜 네트워크 서비스 기반의 콘텐츠 관리시스템 |
KR20160069362A (ko) * | 2014-12-08 | 2016-06-16 | 삼성전자주식회사 | 전자 장치 및 그의 소셜 미디어 컨텐츠 제공 방법 |
KR20160103802A (ko) * | 2015-02-25 | 2016-09-02 | 국민대학교산학협력단 | 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법 |
KR20170114321A (ko) * | 2016-04-04 | 2017-10-16 | (주)어반트시스템 | 키워드 분석을 이용한 뉴스 콘텐츠들의 개인화 필터링 시스템 및 그 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230051995A (ko) | 2021-10-12 | 2023-04-19 | 주식회사 피씨엔 | 실감형 확장현실 콘텐츠 관리 플랫폼 |
Also Published As
Publication number | Publication date |
---|---|
KR102368823B1 (ko) | 2022-03-03 |
WO2021085731A1 (ko) | 2021-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7624093B2 (en) | Method and system for automatic summarization and digest of celebrity news | |
US9400833B2 (en) | Generating electronic summaries of online meetings | |
JP5886733B2 (ja) | 映像群再構成・要約装置、映像群再構成・要約方法及び映像群再構成・要約プログラム | |
Leake et al. | Generating audio-visual slideshows from text articles using word concreteness | |
JP6165913B1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20130294746A1 (en) | System and method of generating multimedia content | |
JP2020005309A (ja) | 動画編集サーバおよびプログラム | |
WO2019245033A1 (ja) | 動画編集サーバおよびプログラム | |
Thompson | Building a specialised audiovisual corpus | |
Haspo et al. | An analysis of slang word in song lyrics Eminem on album Kamikaze | |
KR102368823B1 (ko) | 뉴스 기사 기반 소셜 컨텐츠 서비스 장치 및 방법 | |
KR20210074734A (ko) | 영상 내 자막 키워드 추출 및 순위 산정 시스템 및 방법 | |
JP6730760B2 (ja) | サーバおよびプログラム、動画配信システム | |
JP6603929B1 (ja) | 動画編集サーバおよびプログラム | |
JP6903364B1 (ja) | サーバおよびデータ割り当て方法 | |
Sack et al. | Automated annotations of synchronized multimedia presentations | |
JP6713183B1 (ja) | サーバおよびプログラム | |
KR20210136609A (ko) | 영상 뉴스 콘텐츠 생성 장치 및 방법 | |
JP7365849B2 (ja) | 要約装置およびプログラム | |
McGill et al. | BSL-Hansard: A parallel, multimodal corpus of English and interpreted British Sign Language data from parliamentary proceedings | |
Nichols et al. | Machine-generated multimedia content | |
JP6710884B2 (ja) | サーバおよびプログラム | |
Baumann et al. | The spoken wikipedia corpus collection | |
Afonso et al. | Combining Text-to-Speech Services with Conventional Voiceover for News Oralization | |
JP2003067388A (ja) | 音声データ検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |