WO2021256884A1 - Method and device for identifying fake news using ai - Google Patents

Method and device for identifying fake news using ai Download PDF

Info

Publication number
WO2021256884A1
WO2021256884A1 PCT/KR2021/007642 KR2021007642W WO2021256884A1 WO 2021256884 A1 WO2021256884 A1 WO 2021256884A1 KR 2021007642 W KR2021007642 W KR 2021007642W WO 2021256884 A1 WO2021256884 A1 WO 2021256884A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
news
fake
fact
expert
Prior art date
Application number
PCT/KR2021/007642
Other languages
French (fr)
Korean (ko)
Inventor
김성수
이주훈
Original Assignee
주식회사 푸시뉴스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 푸시뉴스 filed Critical 주식회사 푸시뉴스
Publication of WO2021256884A1 publication Critical patent/WO2021256884A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Definitions

  • One embodiment of the present invention relates to a method and apparatus for reading fake news using AI.
  • the news curation market in the securities sector is estimated to be approximately 1.5 trillion won as of 2019. It is estimated that the main consumers are 5.6 million to 8 million individual investors. Due to the recently passed Data 3 Act, it is expected that marketing and business will be possible even with non-real name information.
  • This embodiment collects news and provides reliable information according to consumer preferences when providing a service that curates and shows various news in the securities information market to individual investors who are fragmented from various websites to find securities information, , aims to provide a fake news reading method and device using AI that uses artificial intelligence to read fake news and distinguish fake news and reliable news from among securities information.
  • a news information collection unit for collecting stock news information from a news provider; a news selection unit filtering only the news information of the items of interest corresponding to the keywords or items of interest set in the subscriber terminal among the stock news information; a fake news determination unit for generating a truth determination result for determining whether the news information on the item of interest is fake news or real news based on previously learned learning data using artificial intelligence; and a news curation unit that matches the authenticity determination result to the interest item news information and curates the news to the subscriber terminal.
  • the process of collecting stock news information from a news provider in the news information collection unit a process of filtering, in the news selection unit, only the news information of the interest item corresponding to the keyword or the item of interest set in the subscriber terminal among the securities news information; a process of generating a truth determination result for determining whether the news information of the item of interest is fake news or real news based on previously learned learning data using artificial intelligence in the fake news determination unit; and a news curation unit curating the news information on the item of interest and the authenticity determination result to the subscriber terminal.
  • the authenticity information can be determined by automatically updating the authenticity by performing the authenticity determination process according to the reliability of the expert or the fact check of the expert in each field as the basis for determining the fake news.
  • FIG. 1 is a diagram schematically illustrating a fake news reading system using AI according to the present embodiment.
  • FIGS. 2 and 3 are diagrams schematically showing a fake news reader according to the present embodiment.
  • FIG. 4 is a diagram illustrating a process of providing a fake news reading service according to the present embodiment.
  • FIG. 5 is a diagram illustrating a method of providing fake news identification information according to the present embodiment.
  • FIG. 6 is a diagram illustrating a context determination method for reading fake news according to the present embodiment.
  • FIG. 7 is a diagram illustrating a method of determining whether to synthesize for fake news reading according to the present embodiment.
  • FIG. 8 is a diagram illustrating a learning execution concept of a fake news reader according to the present embodiment.
  • FIG. 9 is a diagram illustrating a news authenticity determination service using artificial intelligence according to the present embodiment.
  • FIG. 10 is a diagram illustrating a service provision concept according to the present embodiment.
  • FIG. 1 is a diagram schematically illustrating a fake news reading system using AI according to the present embodiment.
  • the fake news reading system using AI includes a subscriber terminal 110 , a fake news reader 120 , a manager terminal 130 , a news provider 140 , and an expert judgment group terminal 150 .
  • Components included in the fake news detection system using AI are not necessarily limited thereto.
  • the subscriber terminal 110 receives news content and news authenticity information from the fake news reader 120 .
  • the subscriber terminal 110 provides points and rewards according to the subscription from the fake news reader 120 .
  • the subscriber terminal 110 manages membership registration and withdrawal.
  • the subscriber terminal 110 manages member information, charges points, and manages the use of points.
  • the subscriber terminal 110 applies for the authenticity determination service and confirms news content information.
  • the subscriber terminal 110 files an objection to the authenticity of the news content.
  • the fake news reader 120 curates stock information and provides it as a mobile application.
  • the fake news reader 120 provides news curation that filters out fake news using big data on stock information and artificial intelligence.
  • the fake news reader 120 provides, to the subscriber terminal 110 , important information on stock information and trend information of companies, which are important to companies, organizations, and individual investors who need stock information.
  • the fake news reader 120 learns about the results for determining the authenticity of news content based on artificial intelligence.
  • the news information collection unit 210 collects stock news information from the news provider 140 .
  • the news selection unit 220 filters only the news information of the items of interest corresponding to the keywords or items of interest set in the subscriber terminal 110 among the securities news information.
  • the fake news determining unit 230 separates the text and the image included in the news item of interest information and generates image determination result information confirming whether the image is synthesized or not. As a result of the check, if it is determined that the image is synthesized, the fake news determining unit 230 generates fake image determination information. As a result of the check, if it is determined that the image is not synthesized, the fake news determining unit 230 generates image authenticity determination information.
  • the fake news reader 120 receives the expert fake judgment information from the expert judgment group terminal 150, determines that the text included in the stock news information is real news by checking its own facts, and the image inserted into the stock news information is an image If it is determined as genuine information, it indicates that the news may be fake news as a result of the expert's judgment on the news, and the probability information of fake news is calculated and output together with the news.
  • the determination of the text for identifying fake news may be performed based on the following method.
  • the fake news reader 120 performs learning to read fake news.
  • the fake news reader 120 analyzes fake news cases and patterns, and learns a result of analyzing stock news information based on fake news cases and patterns.
  • the news content and creator information input module transmits the received stock news information to the fake news content information operation module and the fake news content creator information processing module for learning data processing.
  • the news classification module classifies news based on fake news information and author tendency in news content.
  • the news authenticity information output module outputs news authenticity information.
  • the news information input module transmits news authenticity information to the web server and the communication server.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

According one aspect of the present embodiment, provided is a fake news identification device characterized by comprising: a news information collection unit which collects stock news information from news providers; a news sorting unit which filters out, from the stock news, only item-of-interest news information corresponding to items of interest or keywords set in a subscriber's terminal; a fake news determination unit which generates an authenticity determination result obtained by using artificial intelligence to determine whether the item-of-interest news information is fake news on the basis of learned training data; and a news curation unit which matches the authenticity determination result with the item-of-interest news information to curate the stock news for the subscriber's terminal.

Description

AI를 이용한 가짜뉴스 판독 방법 및 장치Method and device for reading fake news using AI
본 발명의 일 실시예는 AI를 이용한 가짜뉴스 판독 방법 및 장치에 관한 것이다.One embodiment of the present invention relates to a method and apparatus for reading fake news using AI.
이하에 기술되는 내용은 단순히 본 실시예와 관련되는 배경 정보만을 제공할 뿐 종래기술을 구성하는 것이 아니다.The content described below merely provides background information related to the present embodiment and does not constitute the prior art.
증권 부분 뉴스 큐레이션 시장은 2019년을 기준으로 대략 1조5천억원으로 추정된다. 주된 소비자는 560만명 내지 800만명이 개인투자자로 추정된다. 최근 통과된 데이터3법으로 인해 비실명정보로도 마케팅 및 사업을 전개할 수 있을 것으로 전망된다.The news curation market in the securities sector is estimated to be approximately 1.5 trillion won as of 2019. It is estimated that the main consumers are 5.6 million to 8 million individual investors. Due to the recently passed Data 3 Act, it is expected that marketing and business will be possible even with non-real name information.
국내 증권정보를 보며, 주식을 거래하는 개인투자자는 대략 560만명 내지 800만명 정도이나, 무분별하게 가짜뉴스에 노출되고 있는 실정이다. 일반적으로 개인투자자들은 인터넷을 이용하여 관련 정보를 찾아보지만 복수의 사이트에서 시간과 비용을 낭비하고 있으며, 원하는 정보와 정확한 정보를 찾지 못하고 있다.There are approximately 5.6 to 8 million individual investors who trade stocks while looking at domestic stock information, but they are indiscriminately exposed to fake news. In general, individual investors use the Internet to search for relevant information, but they waste time and money on multiple sites, and cannot find the desired and accurate information.
최근 들어, 1인 미디어 증가에 따른 소비환경이 변화되고 있다. 1인 미디어 뉴스는 시간과 장소의 구애없이 실시간으로 소비 가능하므로, 흥미 위주의 창작물이나 조합물 같은 무분별한 가짜뉴스를 생산하고 유통시키는 부작용이 증가하고 있다.Recently, the consumption environment is changing due to the increase in single-person media. Since single-person media news can be consumed in real time regardless of time and place, the side effect of producing and distributing reckless fake news such as interesting creations or combinations is increasing.
가짜뉴스의 경제적, 사회적 폐해가 증가하고 있다. 즉, ‘낚시성 기사’나 트래픽 유발 목적의 ‘어뷰징(Abusing)기사’, 홍보 등의 특정한 목적으로 대가를 받고 쓴‘광고성 기사'들은 뉴스를 소비하는 소비자의 혼란을 가중시키고 있다. 사회적 비용 또한 덩달아 크게 증가하고 있는 실정이며, 가짜뉴스로 인한 경제적 피해는 30조원에 달하는 것으로 조사되었다.The economic and social harm of fake news is increasing. In other words, 'fishing articles', 'abusing articles' for the purpose of inducing traffic, and 'advertising articles' written for a specific purpose such as publicity are aggravating the confusion of consumers who consume news. Social costs are also increasing significantly, and the economic damage caused by fake news is estimated to reach 30 trillion won.
가짜뉴스로 인한 국가 신뢰도가 하락하고 있으며, 로이터 언론 연구소 조사에 따르면 한국은 뉴스 신뢰도 23%로 세계에서 최악의 가짜뉴스 나라로 평가되고 있다.National credibility due to fake news is declining, and according to a Reuters Media Research Institute survey, South Korea is ranked as the worst fake news country in the world with 23% of news credibility.
정보의 비대칭 문제로 정보의 신뢰도에서 가짜뉴스로 인한 피해가 급증하고 있다. 따라서, 신뢰성과 공정성에 대한 문제가 대두되고 있으며, 뉴스 컨텐츠 등에 대해서 명확하게 판별하여 사회적ㆍ경제적ㆍ정치적 갈등해소에 기여하는 기술을 필요로 한다.Due to the information asymmetry problem, the damage caused by fake news in the reliability of information is increasing rapidly. Therefore, issues of reliability and fairness are emerging, and technologies that contribute to resolving social, economic, and political conflicts by clearly discriminating news content and the like are required.
본 실시예는 다양한 웹사이트에서 파편화되어 증권 정보를 찾는 개인 투자자들에게 증권 정보 시장의 다양한 뉴스들을 큐레이션해서 보여주는 서비스를 제공할 때, 뉴스를 수집하고, 신뢰도 있는 정보를 소비자 선호에 맞춰 제공하며, 인공지능을 이용하여 가짜뉴스를 판독하여 증권 정보들 중에서 가짜뉴스와 신뢰할 수 있는 뉴스를 가려낼 수 있도록 하는 AI를 이용한 가짜뉴스 판독 방법 및 장치를 제공하는 데 목적이 있다.This embodiment collects news and provides reliable information according to consumer preferences when providing a service that curates and shows various news in the securities information market to individual investors who are fragmented from various websites to find securities information, , aims to provide a fake news reading method and device using AI that uses artificial intelligence to read fake news and distinguish fake news and reliable news from among securities information.
본 실시예의 일 측면에 의하면, 뉴스 공급자로부터 증권 뉴스 정보를 수집하는 뉴스 정보 수집부; 상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 뉴스 선별부; 인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 가짜뉴스 판별부; 및 상기 관심항목 뉴스정보에 상기 진위판별결과를 매칭하여 상기 구독자 단말기로 큐레이션(Curation)하는 뉴스 큐레이션부를 포함하는 것을 특징으로 하는 가짜뉴스 판독 장치를 제공한다.According to an aspect of this embodiment, a news information collection unit for collecting stock news information from a news provider; a news selection unit filtering only the news information of the items of interest corresponding to the keywords or items of interest set in the subscriber terminal among the stock news information; a fake news determination unit for generating a truth determination result for determining whether the news information on the item of interest is fake news or real news based on previously learned learning data using artificial intelligence; and a news curation unit that matches the authenticity determination result to the interest item news information and curates the news to the subscriber terminal.
본 실시예의 다른 측면에 의하면, 뉴스 정보 수집부에서 뉴스 공급자로부터 증권 뉴스 정보를 수집하는 과정; 뉴스 선별부에서 상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 과정; 가짜뉴스 판별부에서 인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 과정; 및 뉴스 큐레이션부에서 상기 관심항목 뉴스정보와 상기 진위판별결과를 상기 구독자 단말기로 큐레이션(Curation)하는 과정을 포함하는 것을 특징으로 하는 가짜뉴스 판독 방법을 제공한다.According to another aspect of this embodiment, the process of collecting stock news information from a news provider in the news information collection unit; a process of filtering, in the news selection unit, only the news information of the interest item corresponding to the keyword or the item of interest set in the subscriber terminal among the securities news information; a process of generating a truth determination result for determining whether the news information of the item of interest is fake news or real news based on previously learned learning data using artificial intelligence in the fake news determination unit; and a news curation unit curating the news information on the item of interest and the authenticity determination result to the subscriber terminal.
이상에서 설명한 바와 같이 본 실시예에 의하면, 다양한 웹사이트에서 파편화되어 증권 정보를 찾는 개인 투자자들에게 증권 정보 시장의 다양한 뉴스들을 큐레이션해서 보여주는 서비스를 제공할 때, 뉴스를 수집하고, 신뢰도 있는 정보를 소비자 선호에 맞춰 제공하며, 인공지능을 이용하여 가짜뉴스를 판독하여 증권 정보들 중에서 가짜뉴스와 신뢰할 수 있는 뉴스를 가려낼 수 있도록 하는 효과가 있다.As described above, according to this embodiment, when providing a service that curates and shows various news in the securities information market to individual investors who are fragmented from various websites and looking for securities information, news is collected and reliable information is provided according to consumer preferences, and by using artificial intelligence to read fake news, it has the effect of discriminating between fake news and reliable news among securities information.
본 실시예에 의하면, 가짜뉴스 판별 근거를 전문가의 신뢰도 또는 분야별 전문가의 팩트체크에 따라 진위여부판정 프로세스를 수행하여 자동으로 진위여부를 갱신하여 진위여부 정보를 판정할 수 있는 효과가 있다.According to the present embodiment, there is an effect that the authenticity information can be determined by automatically updating the authenticity by performing the authenticity determination process according to the reliability of the expert or the fact check of the expert in each field as the basis for determining the fake news.
도 1은 본 실시예에 따른 AI를 이용한 가짜뉴스 판독 시스템을 개략적으로 나타낸 도면이다.1 is a diagram schematically illustrating a fake news reading system using AI according to the present embodiment.
도 2 및 도 3은 본 실시예에 따른 가짜뉴스 판독기를 개략적으로 나타낸 도면이다.2 and 3 are diagrams schematically showing a fake news reader according to the present embodiment.
도 4는 본 실시예에 따른 가짜뉴스 판독 서비스 제공 과정을 나타낸 도면이다.4 is a diagram illustrating a process of providing a fake news reading service according to the present embodiment.
도 5는 본 실시예에 따른 가짜뉴스 식별 정보 제공 방법을 나타낸 도면이다.5 is a diagram illustrating a method of providing fake news identification information according to the present embodiment.
도 6은 본 실시예에 따른 가짜뉴스 판독을 위해 문맥 판단 방법을 나타낸 도면이다.6 is a diagram illustrating a context determination method for reading fake news according to the present embodiment.
도 7은 본 실시예에 따른 가짜뉴스 판독을 위해 합성 여부를 판단 방법을 나타낸 도면이다.7 is a diagram illustrating a method of determining whether to synthesize for fake news reading according to the present embodiment.
도 8은 본 실시예에 따른 가짜뉴스 판독기의 학습 수행 개념을 나타낸 도면이다.8 is a diagram illustrating a learning execution concept of a fake news reader according to the present embodiment.
도 9는 본 실시예에 따른 인공지능을 이용한 뉴스 진위 판별 서비스를 나타낸 도면이다.9 is a diagram illustrating a news authenticity determination service using artificial intelligence according to the present embodiment.
도 10은 본 실시예에 따른 서비스 제공 개념을 나타낸 도면이다.10 is a diagram illustrating a service provision concept according to the present embodiment.
이하, 본 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, this embodiment will be described in detail with reference to the accompanying drawings.
도 1은 본 실시예에 따른 AI를 이용한 가짜뉴스 판독 시스템을 개략적으로 나타낸 도면이다.1 is a diagram schematically illustrating a fake news reading system using AI according to the present embodiment.
본 실시예에 따른 AI를 이용한 가짜뉴스 판독 시스템은 구독자 단말기(110), 가짜뉴스 판독기(120), 관리자 단말기(130), 뉴스 공급자(140), 전문가 판정단 단말기(150)를 포함한다. AI를 이용한 가짜뉴스 판독 시스템에 포함된 구성요소는 반드시 이에 한정되는 것은 아니다.The fake news reading system using AI according to the present embodiment includes a subscriber terminal 110 , a fake news reader 120 , a manager terminal 130 , a news provider 140 , and an expert judgment group terminal 150 . Components included in the fake news detection system using AI are not necessarily limited thereto.
구독자 단말기(110)는 가짜뉴스 판독기(120)로부터 뉴스컨텐츠, 뉴스진위정보를 제공받는다. 구독자 단말기(110)는 가짜뉴스 판독기(120)로부터 구독에 따른 포인트 및 리워드를 제공한다.The subscriber terminal 110 receives news content and news authenticity information from the fake news reader 120 . The subscriber terminal 110 provides points and rewards according to the subscription from the fake news reader 120 .
구독자 단말기(110)는 가짜뉴스 판독기(120)로 접속하여 뉴스 컨텐츠를 검색하고, 뉴스 구독 정보를 수신한다.The subscriber terminal 110 accesses the fake news reader 120 to search for news content and receives news subscription information.
구독자 단말기(110)는 가짜뉴스 판독기(120)로 뉴스 진위를 요청하고, 유료 서비스를 이용한다.The subscriber terminal 110 requests the authenticity of the news through the fake news reader 120 and uses a paid service.
구독자 단말기(110)는 회원가입 및 탈퇴를 관리한다. 구독자 단말기(110)는 회원 정보를 관리하고, 포인트를 충전하고 포인트 사용을 관리한다. 구독자 단말기(110)는 진위 판정 서비스를 신청하고, 뉴스 컨텐츠 정보를 확인한다. 구독자 단말기(110)는 뉴스 컨텐츠의 진위여부에 대한 이의를 신청한다.The subscriber terminal 110 manages membership registration and withdrawal. The subscriber terminal 110 manages member information, charges points, and manages the use of points. The subscriber terminal 110 applies for the authenticity determination service and confirms news content information. The subscriber terminal 110 files an objection to the authenticity of the news content.
가짜뉴스 판독기(120)는 증권 정보를 큐레이션하여 모바일 애플리케이션으로 제공한다. 가짜뉴스 판독기(120)는 증권 정보에 대한 빅데이터, 인공지능을 이용하여 가짜뉴스를 걸러내는 뉴스 큐레이션을 제공한다.The fake news reader 120 curates stock information and provides it as a mobile application. The fake news reader 120 provides news curation that filters out fake news using big data on stock information and artificial intelligence.
가짜뉴스 판독기(120)는 증권 뉴스의 송출매체와 계약하여 증권 뉴스의 최초 송출진원지인 뉴스 공급자(140)로부터 RSS, 크롤링 기술을 이용하여 증권 관련 데이터를 수집한다.The fake news reader 120 collects securities-related data by using RSS and crawling technology from the news provider 140, which is the first source of transmission of securities news, by contracting with the transmission medium of the securities news.
가짜뉴스 판독기(120)는 수집한 증권 관련 데이터에 대한 확정 기사와 추정 기사를 분류하고, 빅데이터를 합치는 과정을 거쳐 해당 뉴스의 진위여부를 파악한다. 가짜뉴스 판독기(120)는 증권분야에서 주가 변화, 뉴스, SNS등 매체 송출 이후 일어나고 있는지를 알고리즘을 이용하여 분석한다.The fake news reader 120 classifies confirmed and estimated articles on the collected securities-related data, and determines the authenticity of the news through a process of merging big data. The fake news reader 120 analyzes, using an algorithm, whether stock price changes, news, and social media are transmitted in the securities field after transmission.
가짜뉴스 판독기(120)는 인공지능을 이용하여 사용자가 지정한 뉴스 소스원의 컨텐츠가 가짜일 확률을 알려준다. 가짜뉴스 판독기(120)는 정확한 팩트체크를 위하여 분야별 전문가 및 검증된 판정단이 전문가 판정단 단말기(150)로부터 수신된 팩트체크 결과를 기반으로 인공지능을 이용하여 뉴스 진위여부를 판별하는 서비스를 구독자 단말기(110)로 제공한다.The fake news reader 120 informs the probability that the content of the news source specified by the user is fake using artificial intelligence. The fake news reader 120 provides a service for determining the authenticity of news using artificial intelligence based on the fact check result received from the expert judgment group terminal 150 by field experts and verified judges for accurate fact checking. 110) is provided.
가짜뉴스 판독기(120)는 인공지능 기술을 이용하여 사용자가 원하는 증권 정보들 중에서 가짜뉴스와 신뢰할 수 있는 정보를 가려낼 수 있도록 한다. 가짜뉴스 판독기(120)는 가짜뉴스와 신뢰할 수 있는 정보를 가려낼 수 있는 근거를 제시한다. 가짜뉴스 판독기(120)는 근거에 대해 전문가의 신뢰도나 진위여부에 참가한 전문가 판정단 단말기(150)로부터 수신된 판정정보에 따라 자동으로 진위여부를 갱신하여 진위여부 정보를 판정한다.The fake news reader 120 uses artificial intelligence technology to sort out fake news and reliable information from among the securities information desired by the user. The fake news reader 120 provides a basis for discriminating between fake news and reliable information. The fake news reader 120 determines the authenticity information by automatically updating the authenticity according to the judgment information received from the expert judgment group terminal 150 participating in the expert's reliability or authenticity with respect to the evidence.
가짜뉴스 판독기(120)는 증권정보가 필요한 기업, 단체, 개인투자자들에게 중요한 증권정보와 기업들의 동향정보 등에 대한 주요 정보를 구독자 단말기(110)로 제공한다. 가짜뉴스 판독기(120)는 인공지능을 기반으로 뉴스컨텐츠의 진위여부를 판정을 위한 결과에 대해 학습한다.The fake news reader 120 provides, to the subscriber terminal 110 , important information on stock information and trend information of companies, which are important to companies, organizations, and individual investors who need stock information. The fake news reader 120 learns about the results for determining the authenticity of news content based on artificial intelligence.
관리자 단말기(130)는 가짜뉴스 판독기(120)에 접속하여 가짜뉴스 판독기(120)의 전반적인 기능을 제어한다. 관리자 단말기(130)는 컨텐츠에 대한 진위여부를 관리한다.The manager terminal 130 accesses the fake news reader 120 and controls overall functions of the fake news reader 120 . The manager terminal 130 manages the authenticity of the content.
관리자 단말기(130)는 회원 및 전문가 정보를 관리한다. 관리자 단말기(130)는 전문가에 대한 승인 및 정지를 관리한다. 관리자 단말기(130)는 진짜 또는 가짜 판정정보에 대응하는 포인트 입금을 관리한다. 관리자 단말기(130)는 컨텐츠 진위여부 정보를 관리한다. 관리자 단말기(130)는 전문가 수익정책을 관리한다.The manager terminal 130 manages member and expert information. The manager terminal 130 manages approval and suspension of experts. The manager terminal 130 manages the point deposit corresponding to the real or fake determination information. The manager terminal 130 manages content authenticity information. The manager terminal 130 manages the expert profit policy.
뉴스 공급자(140)는 가짜뉴스 판독기(120)로부터 뉴스 검색(키워드, 구독)을 요청받고, 가짜뉴스 판독기(120)로 뉴스 검색에 대응하는 뉴스정보를 전송한다.The news provider 140 receives a news search (keyword, subscription) request from the fake news reader 120 , and transmits news information corresponding to the news search to the fake news reader 120 .
전문가 판정단 단말기(150)는 가짜뉴스 판독기(120)로 뉴스 정보에 대응하는 진짜 또는 가짜 판정정보를 전송한다. 전문가 판정단 단말기(150)는 가짜뉴스 판독기(120)로부터 진짜 또는 가짜 판정정보에 대응하는 포인트 또는 리워드를 제공받는다.The expert judgment group terminal 150 transmits real or fake judgment information corresponding to the news information to the fake news reader 120 . The expert judgment group terminal 150 is provided with points or rewards corresponding to real or fake judgment information from the fake news reader 120 .
전문가 판정단 단말기(150)는 회원가입된 전문가 또는 판정단 단말기로서, 전문분야를 설정한다. 전문가 판정단 단말기(150)는 기 설정된 전문분야에 대응하는 증권 뉴스 정보에 대한 진위여부를 확인하고 관리한다.The expert judgment group terminal 150 is a registered expert or judgment group terminal, and sets a field of expertise. The expert judgment group terminal 150 checks and manages the authenticity of stock news information corresponding to a preset specialized field.
전문가 판정단 단말기(150)는 진짜 또는 가짜 판정정보에 대응하는 포인트를 수신하여 적립한 적립 현황과 사용내역을 관리한다. 전문가 판정단 단말기(150)는 기 설정된 전문분야에 대한 이의를 신청하고 관리한다. 전문가 판정단 단말기(150)는 진짜판정정보 또는 가짜판정정보에 대응하는 포인트를 입금 받는다.The expert judgment group terminal 150 receives points corresponding to real or fake judgment information and manages the accumulated status and usage history. The expert judgment group terminal 150 applies for and manages objections to a preset specialized field. The expert judgment group terminal 150 receives points corresponding to the genuine judgment information or the fake judgment information.
도 2 및 도 3은 본 실시예에 따른 가짜뉴스 판독기를 개략적으로 나타낸 도면이다.2 and 3 are diagrams schematically showing a fake news reader according to the present embodiment.
가짜뉴스 판독기(120)는 인공지능기술을 이용한 가짜뉴스 학습엔진, 인공지능기술을 이용한 가짜뉴스 판단엔진을 포함한다. 가짜뉴스 판독기(120)는 학습데이터를 관리하고, 구독정보 설정을 관리하고, 가짜뉴스 확률을 계산하고 정보를 제공한다.The fake news reader 120 includes a fake news learning engine using artificial intelligence technology and a fake news determination engine using artificial intelligence technology. The fake news reader 120 manages learning data, manages subscription information settings, calculates a fake news probability, and provides information.
본 실시예에 따른 가짜뉴스 판독기(120)는 뉴스 정보 수집부(210), 뉴스 선별부(220), 가짜뉴스 판별부(230), 학습부(232), 진위 판별부(234), 뉴스 큐레이션부(240)를 포함한다. 가짜뉴스 판독기(120)에 포함된 구성요소는 반드시 이에 한정되는 것은 아니다.The fake news reader 120 according to this embodiment includes a news information collection unit 210 , a news selection unit 220 , a fake news determination unit 230 , a learning unit 232 , a truth determination unit 234 , and a news queue. It includes a ration unit 240 . Components included in the fake news reader 120 are not necessarily limited thereto.
다시 말해, 가짜뉴스 판독기(120)는 회원관리모듈, 전문가관리모듈, 포인트관리모듈, 구독정보관리모듈, 결제관리모듈, 서비스구매관리모듈, 진위확률관리모듈, 뉴스컨텐츠정보관리모듈, 전문가평가모듈, 컨텐츠별 진위평가 의견관리모듈, 전문가별 전문분야 설정관리모듈, 가짜뉴스판별정책 관리모듈, 전문가랭킹 관리모듈, 진위판정모듈, 알림통지모듈, 이의신청모듈을 포함하는 형태로 구현 가능하다.In other words, the fake news reader 120 is a member management module, expert management module, point management module, subscription information management module, payment management module, service purchase management module, authenticity probability management module, news content information management module, expert evaluation module , it can be implemented in the form of including an opinion management module for authenticity evaluation by content, a setting management module for specialized fields by experts, a fake news identification policy management module, an expert ranking management module, a truth determination module, a notification notification module, and an objection module.
가짜뉴스 판독기(120)에 포함된 각 구성요소는 장치 내부의 소프트웨어적인 모듈 또는 하드웨어적인 모듈을 연결하는 통신 경로에 연결되어 상호 간에 유기적으로 동작할 수 있다. 이러한 구성요소는 하나 이상의 통신 버스 또는 신호선을 이용하여 통신한다.Each component included in the fake news reader 120 may be connected to a communication path that connects a software module or a hardware module inside the device to operate organically with each other. These components communicate using one or more communication buses or signal lines.
도 2 및 도 3에 도시된 가짜뉴스 판독기(120)의 각 구성요소는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 소프트웨어적인 모듈, 하드웨어적인 모듈 또는 소프트웨어와 하드웨어의 결합으로 구현될 수 있다.Each component of the fake news reader 120 shown in FIGS. 2 and 3 means a unit that processes at least one function or operation, and may be implemented as a software module, a hardware module, or a combination of software and hardware. have.
뉴스 정보 수집부(210)는 뉴스 공급자(140)로부터 증권 뉴스 정보를 수집한다. 뉴스 선별부(220)는 증권 뉴스정보 중 구독자 단말기(110)에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링한다.The news information collection unit 210 collects stock news information from the news provider 140 . The news selection unit 220 filters only the news information of the items of interest corresponding to the keywords or items of interest set in the subscriber terminal 110 among the securities news information.
가짜뉴스 판별부(230)는 인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성한다. 가짜뉴스 판별부(230)는 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보), 학습 데이터를 기반으로 관심항목 뉴스정보가 가짜뉴스인지의 진위여부를 판별한다.The fake news determining unit 230 generates a result of determining whether the news information of the item of interest is fake news or real news based on previously learned learning data using artificial intelligence. The fake news determining unit 230 determines whether the news information of the interest item is fake news based on the expert judgment information (the expert real judgment information or the expert fake judgment information) and learning data.
가짜뉴스 판별부(230)는 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 문자에 대해서 전처리를 수행한다. 가짜뉴스 판별부(230)는 문자들을 기반으로 단어를 인지한다. 가짜뉴스 판별부(230)는 단어를 조합한 순서를 기반으로 문맥을 이해하고, 문맥을 기반으로 자체 팩트체크 결과정보를 생성한다.The fake news determining unit 230 separates the text and image included in the news item of interest information and performs pre-processing on the text. The fake news determining unit 230 recognizes a word based on the characters. The fake news determining unit 230 understands the context based on the order of combining words, and generates its own fact check result information based on the context.
가짜뉴스 판별부(230)는 문맥을 기반으로 특정 기업의 계약 또는 수주 기사로 판단하면 계약 금액, 계약 년도, 계약 조건을 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 기업 또는 정부의 투자 기사로 판단하면 투자처, 투자분야, 투자비용, 투자년도를 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 세계 증시 기사로 판단하면 국가별 증시 증감율, 일시를 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 기업별 신기술 개발 기사로 판단하면 기업별 신기술 정보를 팩트 정보로 저장한다. 가짜뉴스 판별부(230)는 문맥을 기반으로 국가별 경제 성장률 기사로 판단하면 국가별 경제 성장률 정보를 팩트 정보로 저장한다.The fake news determining unit 230 stores the contract amount, the contract year, and the contract conditions as fact information if it is determined that the contract or the order article of a specific company is based on the context. The fake news determining unit 230 stores the investment destination, investment field, investment cost, and investment year as fact information when determining that it is an investment article of a company or government based on the context. The fake news determining unit 230 stores the increase/decrease rate and date and time of the stock market by country as fact information when it is determined as a world stock market article based on the context. The fake news determining unit 230 stores the new technology information for each company as fact information if it is determined that the new technology development article for each company is based on the context. The fake news determining unit 230 stores the economic growth rate information for each country as fact information when it is determined that the article is an article on economic growth rates for each country based on the context.
가짜뉴스 판별부(230)는 문맥을 기반으로 새로운 증권 정보가 인지되면, 새로운 증권 정보와 기 저장된 팩트 정보가 일치하는지의 여부를 확인하여 자체 팩트체크 결과정보를 생성한다. 확인 결과, 새로운 증권 정보가 기 저장된 팩트 정보와 일치하는 경우, 가짜뉴스 판별부(230)는 진짜뉴스로 판단한 자체 팩트체크 결과정보를 생성한다. 확인 결과, 새로운 증권 정보가 기 저장된 팩트 정보와 미일치하는 경우, 가짜뉴스 판별부(230)는 가짜뉴스로 판단한 자체 팩트체크 결과정보를 생성한다.When new stock information is recognized based on the context, the fake news determining unit 230 checks whether the new stock information and pre-stored fact information match, and generates its own fact check result information. As a result of the check, if the new stock information matches the previously stored fact information, the fake news determining unit 230 generates its own fact check result information determined as real news. As a result of the check, if the new stock information does not match the previously stored fact information, the fake news determining unit 230 generates fact check result information determined as fake news.
가짜뉴스 판별부(230)는 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 이미지에 대한 합성 여부를 확인한 이미지 판정결과정보를 생성한다. 확인 결과, 이미지가 합성한 것으로 판단되면, 가짜뉴스 판별부(230)는 이미지 가짜판정정보를 생성한다. 확인 결과, 이미지가 합성하지 않은 것으로 판단되면, 가짜뉴스 판별부(230)는 이미지 진짜판정정보를 생성한다.The fake news determining unit 230 separates the text and the image included in the news item of interest information and generates image determination result information confirming whether the image is synthesized or not. As a result of the check, if it is determined that the image is synthesized, the fake news determining unit 230 generates fake image determination information. As a result of the check, if it is determined that the image is not synthesized, the fake news determining unit 230 generates image authenticity determination information.
가짜뉴스 판별부(230)는 관심항목 뉴스정보가 가짜뉴스로 판별되는 경우, 가짜뉴스 확률정보를 계산한다. 가짜뉴스 판별부(230)는 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보), 자체 팩트체크 결과정보(진짜뉴스, 가짜뉴스), 이미지 판정결과정보(이미지 진짜판정정보 또는 이미지 가짜판정정보)를 기반으로 가짜뉴스 확률정보를 계산한다.The fake news determining unit 230 calculates fake news probability information when it is determined that the news information of the item of interest is fake news. The fake news determining unit 230 includes expert judgment information (expert genuine judgment information or expert fake judgment information), self-fact check result information (real news, fake news), image judgment result information (image real judgment information or image fake judgment information) ) to calculate fake news probability information.
학습부(232)는 가짜뉴스 사례와 가짜뉴스 패턴을 분석한다. 학습부(232)는 가짜뉴스 사례와 가짜뉴스 패턴을 학습하여 학습 데이터에 반영한다. 학습부(232)는 가짜뉴스 사례와 가짜뉴스 패턴을 기반으로 증권 뉴스 정보를 분석한 결과를 학습하여 학습 데이터에 반영한다.The learning unit 232 analyzes fake news cases and fake news patterns. The learning unit 232 learns fake news cases and fake news patterns and reflects them in the learning data. The learning unit 232 learns the result of analyzing stock news information based on fake news cases and fake news patterns and reflects them in the learning data.
진위 판별부(234)는 뉴스 공급자(140)로부터 새로운 증권 뉴스 정보를 수신하는 경우, 구독자 단말기(110)로 전달하기 전에 새로운 증권 뉴스 정보의 분야를 분류한다.When new stock news information is received from the news provider 140 , the authenticity determining unit 234 classifies a field of the new stock news information before delivering it to the subscriber terminal 110 .
진위 판별부(234)는 해당 분야에 대응하는 전문분야를 갖는 전문가 판정단 단말기(150)로 증권 뉴스 정보를 전송한다. 진위 판별부(234)는 전문가 판정단 단말기(150)로부터 전문분야에 따라 새로운 증권 뉴스 정보에 대한 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보)를 수신한다.The authenticity determination unit 234 transmits the stock news information to the expert determination group terminal 150 having a field of expertise corresponding to the field. The authenticity determining unit 234 receives expert judgment information (real expert judgment information or expert fake judgment information) on new securities news information according to the field of expertise from the expert judgment group terminal 150 .
뉴스 큐레이션부(240)는 관심항목 뉴스정보에 진위판별결과를 매칭하여 구독자 단말기(110)로 큐레이션(Curation)한다. 뉴스 큐레이션부(240)는 관심항목 뉴스정보와 함께 가짜뉴스 확률을 전송한다.The news curation unit 240 performs curation with the subscriber terminal 110 by matching the authenticity determination result with the news information of the item of interest. The news curation unit 240 transmits the fake news probability together with the news information of the item of interest.
도 4는 본 실시예에 따른 가짜뉴스 판독 서비스 제공 과정을 나타낸 도면이다.4 is a diagram illustrating a process of providing a fake news reading service according to the present embodiment.
도 4의 (a)에 도시된 바와 같이, 구독자 단말기(110)는 본인이 관심 있는 뉴스풀을 설정한다. 도 4의 (b)에 도시된 바와 같이, 구독자 단말기(110)는 키워드를 설정하여 관심있는 뉴스정보를 검색결과로서 출력한다.As shown in (a) of FIG. 4 , the subscriber terminal 110 sets up a newspool that the subscriber is interested in. As shown in (b) of FIG. 4 , the subscriber terminal 110 sets keywords and outputs interesting news information as a search result.
도 4의 (c)에 도시된 바와 같이, 구독자 단말기(110)는 가짜뉴스 판독기(120)로부터 사용자가 설정한 뉴스공급자로부터 검색어에 대응하는 정보를 가져와서 뉴스 목록 창에 출력한다.As shown in (c) of FIG. 4 , the subscriber terminal 110 retrieves information corresponding to a search term from the news provider set by the user from the fake news reader 120 and outputs it to the news list window.
도 4의 (d)에 도시된 바와 같이, 구독자 단말기(110)는 사용자가 관심있는 뉴스정보를 클릭하면 상세정보창에 가짜뉴스 판독기(120)로부터 분석된 진위여부 정보와 전문가가 제시한 진위여부 판정정보를 확인할 수 있는 정보를 상단에 배치하여 출력하는 동시에 광고와 함께 해당 컨텐츠 정보를 제공한다.As shown in (d) of Fig. 4, when the user clicks on news information of interest, the subscriber terminal 110 determines the authenticity information analyzed from the fake news reader 120 and the authenticity presented by the expert in the detailed information window. Information that can be checked is placed at the top and output, and the corresponding content information is provided along with advertisements.
도 5는 본 실시예에 따른 가짜뉴스 식별 정보 제공 방법을 나타낸 도면이다.5 is a diagram illustrating a method of providing fake news identification information according to the present embodiment.
1차적으로 가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 수신된 전문가 판정정보(전문가 진짜판정정보 또는 전문가 가짜판정정보)를 이용하여 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한다. 즉, 가짜뉴스판독기(120)는 뉴스 컨텐츠의 진위여부 판정을 위해서는 전문판정단계를 수행한다.First, the fake news reader 120 determines whether the news information is fake news or real news using expert judgment information (real expert judgment information or expert fake judgment information) received from the expert judgment group terminal 150 . That is, the fake news reader 120 performs a professional judgment step to determine the authenticity of the news content.
2차적으로 가짜뉴스 판독기(120)는 뉴스에 삽입된 텍스트를 인지하여 문맥을 분석한 후 기 저장된 팩트 정보와 비교하여 뉴스에 대해 자체 팩트체크로 진위 판별한다. 즉, 가짜뉴스 판독기(120)는 뉴스 컨텐츠의 문맥을 파악하여 가짜뉴스일 확률을 판단한다.Secondary, the fake news reader 120 recognizes the text inserted in the news, analyzes the context, and compares it with pre-stored fact information to determine the authenticity of the news by its own fact check. That is, the fake news reader 120 determines the probability of fake news by grasping the context of the news content.
3차적으로 가짜뉴스 판독기(120)는 뉴스에 삽입된 이미지가 합성 사진 판별하여 뉴스에 대한 진위를 판별한다.Thirdly, the fake news reader 120 determines the authenticity of the news by determining whether the image inserted into the news is a composite photo.
즉, 가짜뉴스 판독기(120)는 뉴스에 포함된 사진정보의 합성여부를 판단하여 가짜뉴스일 확률을 판단한다.That is, the fake news reader 120 determines whether the photo information included in the news is synthesized to determine the probability of fake news.
가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 진짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 진짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면 해당 뉴스를 진짜뉴스로 판단한다.The fake news reader 120 receives the expert real judgment information from the expert judgment group terminal 150, determines that the text included in the stock news information is real news by its own fact check, and the image inserted into the stock news information is an image If it is judged by the real judgment information, the corresponding news is judged as real news.
가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 가짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 진짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면, 해당 뉴스에 대해 전문가가 판단한 결과 가짜뉴스일 수 있음을 나타내고 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.The fake news reader 120 receives the expert fake judgment information from the expert judgment group terminal 150, determines that the text included in the stock news information is real news by checking its own facts, and the image inserted into the stock news information is an image If it is determined as genuine information, it indicates that the news may be fake news as a result of the expert's judgment on the news, and the probability information of fake news is calculated and output together with the news.
가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 진짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 가짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면, 해당 뉴스에 대해 자체팩드체크 결과 가짜뉴스일 수 있음을 나타내고 자체팩드체크 결과 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.The fake news reader 120 receives the expert real judgment information from the expert judgment group terminal 150, determines that the text included in the stock news information is fake news, and determines that the text included in the stock news information is fake news, and the image inserted in the stock news information is an image. If it is judged as genuine information, it indicates that the news may be fake news as a result of the self-fact check, and the probability information that the self-pack check result is fake news is calculated and output together with the news.
가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 진짜판정정보를 수신하고, 증권 뉴스 정보에 포함된 텍스트에 대해 자체 팩트체크로 진짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 가짜판정정보로 판단하면, 해당 뉴스에 대해 이미지 팩드체크 결과 가짜뉴스일 수 있음을 나타내고 가짜 이미지(합성이미지)를 포함하고 있는 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.The fake news reader 120 receives the expert real judgment information from the expert judgment group terminal 150, determines that the text included in the stock news information is real news by its own fact check, and the image inserted into the stock news information is an image If it is judged as fake information, the image pack check for the news indicates that it may be fake news, and the probability information of fake news including fake images (synthetic images) is calculated and output together with the news.
여기서, 가짜뉴스 판독기(120)는 세가지 판단 기준 중 한가지 판단기준이 가짜로 판단(전문가 판정정보, 자체팩트체크 결과정보, 이미지 판정결과정보)되므로 가짜뉴스일 확률정보를 예컨대, 대략 30%로 산출할 수 있다.Here, since the fake news reader 120 determines that one of the three criteria is fake (expert judgment information, self-fact check result information, image judgment result information), the fake news reader 120 calculates, for example, about 30% of the probability information of fake news. can do.
가짜뉴스 판독기(120)는 전문가 판정정보가 가짜뉴스인 것으로 판단되는 경우, 전문가가 판정한 전문분야에 따라 가짜뉴스 확률정보를 계산할 수 있다. 가짜뉴스 판독기(120)는 전문분야가 수치화 가능분야(예컨대, IT 분야)인 경우 평균 임계치보다 높은 가중치를 반영하고, 전문분야가 수치화 불가능분야(예컨대, 정치, 시사, 예측)인 경우 평균 임계치보다 낮은 가중치를 반영하여 가짜 뉴스 확률정보를 계산할 수 있다.When it is determined that the expert judgment information is fake news, the fake news reader 120 may calculate fake news probability information according to the expert field determined by the expert. The fake news reader 120 reflects a weight higher than the average threshold when the specialized field is a quantifiable field (eg, IT field), and is higher than the average threshold when the specialized field is a non-quantifiable field (eg, politics, current affairs, prediction). By reflecting the low weight, fake news probability information can be calculated.
가짜뉴스 판독기(120)는 자체 팩트체크 결과정보가 가짜뉴스인 것으로 판단되는 경우, 기 저장된 팩트 정보에 포함된 항목과 미일치 개수를 카운트하여 가짜뉴스 확률정보를 계산할 수 있다. 가짜뉴스 판독기(120)는 기 저장된 팩트 정보 내의 각 항목에 중요도에 따른 가중치를 반영하여 가짜 뉴스 확률정보를 계산할 수 있다.When the fake news reader 120 determines that the fact check result information is fake news, the fake news reader 120 can calculate fake news probability information by counting the number of mismatches with the items included in the pre-stored fact information. The fake news reader 120 may calculate fake news probability information by reflecting a weight according to importance to each item in the pre-stored fact information.
가짜뉴스 판독기(120)는 이미지 판정결과정보로 판단한 결과 뉴스에 삽입된 이미자 합성 또는 위변조 이미지로 확인되는 경우, 해당 뉴스에 포함된 문맥과 연계하여 가짜뉴스 확률정보를 계산하거나 합성 또는 위변조 확률을 수치화하여 가짜뉴스 확률정보를 계산할 수 있다.The fake news reader 120 calculates fake news probability information in connection with the context included in the news or quantifies the synthesis or forgery probability when it is determined by the image determination result information and it is confirmed that the image is synthesized or forged image inserted in the news. Thus, fake news probability information can be calculated.
가짜뉴스 판독기(120)는 뉴스에 대한 판정 결과, 전문가 판정정보, 자체 팩트체크 결과정보, 이미지 판정결과정보 중 가짜뉴스로 판단한 결과를 기반으로 가짜뉴스 확률정보를 계산한다.The fake news reader 120 calculates fake news probability information based on a result determined as fake news among news determination results, expert determination information, own fact check result information, and image determination result information.
예컨대, 가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 가짜판정정보를 수신하고, 증권 뉴스정보에 포함된 텍스트에 대해 자체 팩트체크로 가짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 진짜판정정보로 판단하면, 해당 뉴스에 대해 전문가가 판단한 결과와 자체팩드체크 결과가 가짜뉴스일 수 있음을 나타내고, 전문가 판단결과와 자체팩드체크 결과로 인해 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.For example, the fake news reader 120 receives the expert fake judgment information from the expert judgment group terminal 150, determines that the text included in the stock news information is fake news by checking its own facts, and the image inserted into the stock news information If is judged by the image real judgment information, it indicates that the expert judgment result and the self fact check result for the news may be fake news. It should be printed along with the news.
다시 말해, 가짜뉴스 판독기(120)는 세가지 판단 기준 중 두가지 판단기준이 가짜로 판단(예컨대, 전문가 판정정보(전문가 가짜판정정보), 팩트체크 결과정보(가짜뉴스), 이미지 판정결과정보(이미지 진짜판정정보))되므로 가짜뉴스일 확률정보를 높게 산출(예컨대, 대략 60 %)할 수 있다.In other words, the fake news reader 120 determines that two of the three judgment criteria are fake (eg, expert judgment information (expert fake judgment information), fact check result information (fake news), image judgment result information (image real) decision information)), so the probability information of fake news can be highly calculated (eg, about 60%).
예컨대, 가짜뉴스 판독기(120)는 전문가 판정단 단말기(150)로부터 전문가 가짜판정정보를 수신하고, 증권 뉴스정보에 포함된 텍스트에 대해 자체 팩트체크로 가짜뉴스로 판단하고, 증권 뉴스 정보에 삽입된 이미지가 이미지 가짜판정정보로 판단하면, 해당 뉴스에 대해 전문가가 판단한 결과, 자체팩드체크 결과, 이미지 판정결과 모두가 가짜뉴스일 수 있음을 나타내고, 전문가 판단결과, 자체 팩드체크 결과, 이미지 판정결과 모두 가짜뉴스일 확률정보를 계산하여 해당 뉴스와 함께 출력되도록 한다.For example, the fake news reader 120 receives the expert fake judgment information from the expert judgment group terminal 150, determines that the text included in the stock news information is fake news by checking its own facts, and the image inserted into the stock news information If is judged as image fake judgment information, it indicates that the expert judged the news, the self-packed check result, and the image judgment result may all be fake news, and the expert judgment result, the self-packed check result, and the image judgment result are all fake. The probability information of news is calculated and output together with the corresponding news.
여기서, 가짜뉴스 판독기(120)는 세가지 판단 기준 모두가 가짜로 판단(전문가 판정정보(전문가 가짜판정정보), 팩트체크 결과정보(가짜뉴스), 이미지 판정결과정보(이미지 가짜판정정보))되므로 가짜뉴스일 확률정보를 높게 산출(예컨대, 대략 90 %)할 수 있다.Here, the fake news reader 120 judges all three judgment criteria to be fake (expert judgment information (expert fake judgment information), fact check result information (fake news), image judgment result information (image fake judgment information)), so it is fake. It is possible to calculate the probability information of news highly (eg, about 90%).
본 발명의 실시예에 따르면, 가짜 뉴스 판별을 위한 텍스트에 대한 판단은 아래와 같은 방법을 기반으로 수행될 수 있다.According to an embodiment of the present invention, the determination of the text for identifying fake news may be performed based on the following method.
텍스트에 포함된 단어 간의 연관성에 대한 학습 결과를 기반으로 가짜 뉴스에 대한 판단이 수행될 수 있다. 뉴스 판별을 위해 기존의 진짜 뉴스에 대한 학습이 수행될 수 있다. 진짜 뉴스에 대한 학습을 통해 단어간 연관도에 대한 학습의 수행 이후, 가짜 뉴스에 대한 판단은 가짜 뉴스에 포함된 단어 연관도에 대한 판단을 추가적으로 고려하여 가짜 뉴스의 진위 여부에 대한 판단이 수행될 수 있다. 진짜 뉴스에 포함된 단어 연관도에 대한 학습은 단어간 1차 연관도와 2차 연관도를 추출하여 수행될 수 있다. 1차 연관도와 2차 연관도는 텍스트 내의 단어간 거리를 고려하여 추출될 수 있다. 1차 연관도와 2차 연관도를 결정하기 위한 단어간 거리는 입력되는 학습을 위해 입력되는 뉴스의 길이에 따라 적응적으로 조정될 수 있다. 1차 연관도와 2차 연관도를 기반으로 단어간 연관도가 추출되되 1차 연관도에 상대적으로 높은 가중치를 두어 뉴스의 진위 여부에 대한 판단이 수행될 수 있다.A determination of fake news may be performed based on the learning result of the association between words included in the text. Learning about existing real news may be performed for news discrimination. After learning on the degree of relevance between words through learning about real news, the judgment on fake news is performed by additionally considering the judgment on word relevance included in the fake news to determine the authenticity of fake news. can Learning about word relevance included in real news can be performed by extracting primary and secondary relevance between words. The primary and secondary associations may be extracted by considering the distance between words in the text. The distance between words for determining the primary and secondary associations may be adaptively adjusted according to the length of input news for input learning. A degree of relevance between words is extracted based on the first degree of relevance and the second degree of relevance, and a relatively high weight is placed on the first degree of relevance to determine the authenticity of the news.
또한, 추가적으로 본 발명의 실시예에 따르면, 뉴스의 진위 여부에 대한 판단을 수행하기 위해 뉴스의 발행처에 대한 정보, 뉴스의 발행 속도 정보와 발행량 정보에 대한 학습이 추가적으로 수행될 수 있다. 동일한 주제에 대해 기존의 진짜 뉴스와 가짜 뉴스가 뉴스로서 발생되는 발행처, 발행되는 발행량, 발행 속도에 대한 정보가 수집될 수 있고, 발행량과 발행 속도를 기반으로 발행 뉴스가 가짜 뉴스일 확률이 시간의 흐름에 따라 조정될 수 있다.In addition, according to an embodiment of the present invention, in order to determine the authenticity of the news, information on the publisher of the news, information on the publication speed of the news, and the information on the amount of publication may be additionally learned. For the same topic, information on the publisher, the amount of issuance, and the speed at which existing real news and fake news are generated as news can be collected, and the probability that the published news is fake news is It can be adjusted according to the flow.
예를 들어, 진짜 뉴스의 경우, 하나의 뉴스 발행 시점을 기준으로 출처가 다른 곳에서 유사한 뉴스들이 증가하는 추세를 보이다가 점진적으로 감소하는 추세를 가질 수 있다. 하지만, 가짜 뉴스의 경우, 출처가 동일한 곳에서 급속도로 발행되고, 다른 출처의 뉴스에 대한 증가가 이루어지지 않고, 급속하게 소멸될 수 있다. 이러한 뉴스 출처, 뉴스 발행량, 뉴스 발행 속도에 대한 학습을 통해 가짜 뉴스와 진짜 뉴스가 퍼지는 발행 패턴에 대한 학습이 수행될 수 있고, 이를 기반으로 뉴스가 진짜 뉴스인지 가짜 뉴스인지에 대한 판단이 실시간으로 변화되면서 수행될 수 있다.For example, in the case of real news, similar news from different sources may have a tendency to increase and then gradually decrease based on the publication time of one news. However, in the case of fake news, it is rapidly published from the same source, and there is no increase in news from other sources, and it can disappear rapidly. Through learning about these news sources, news issuance volume, and news publication speed, learning about the publication patterns of fake news and real news spreading can be performed, and based on this, a judgment as to whether news is real news or fake news can be made in real time. It can be done with change.
도 6은 본 실시예에 따른 가짜뉴스 판독을 위해 문맥 판단 방법을 나타낸 도면이다.6 is a diagram illustrating a context determination method for reading fake news according to the present embodiment.
가짜뉴스 판독기(120)는 RNN(Recurrent Neural Networks)을 이용하여 문자열, 동영상 등 시계열 정보가 담긴 데이터에서 문맥을 판단하고, 문맥을 기반으로 가짜뉴스를 식별한다.The fake news reader 120 uses Recurrent Neural Networks (RNNs) to determine a context from data containing time series information, such as a character string and video, and identifies fake news based on the context.
가짜뉴스 판독기(120)는 복수의 레이어로 구성된 인공신경망 구조를 가지며, 가짜뉴스 판독기(120)는 증권 뉴스정보 내의 문장을 전처리하고 특징을 추출한다. 가짜뉴스 판독기(120)는 증권 뉴스 정보 내에 포함된 단어를 인지하고, 단어의 순서를 기반으로 문맥을 이해하고 문맥 내에 등장한 단어가 문맥을 이해하는데 중요한 단어이라고 판단되면 기억한다.The fake news reader 120 has an artificial neural network structure composed of a plurality of layers, and the fake news reader 120 pre-processes sentences in stock news information and extracts features. The fake news reader 120 recognizes the words included in the stock news information, understands the context based on the order of the words, and remembers when it is determined that the words appearing in the context are important words for understanding the context.
가짜뉴스 판독기(120)는 문맥을 판단하여 해당 증권 정보가 팩트체크된 정보라고 판단하는 경우, 저장한다. 예컨대, 가짜뉴스 판독기(120)는 특정 기업의 계약 또는 수주 정보 기사가 팩트로 판단되면, 계약 금액, 계약 년도, 계약 조건을 저장한다. 이후 가짜뉴스 판독기(120)는 동일한 분야에서 새로운 기사가 검색되는 경우, 팩트 체크된 정보를 기반으로 새로운 기사가 가짜뉴스인지 여부를 검색할 수 있다. 가짜뉴스 판독기(120)는 기 저장된 정보와 해당 정보가 필요한 곳과의 차이(GAP)가 적을 경우 높은 학습효과를 갖는다.When the fake news reader 120 determines the context and determines that the corresponding securities information is fact-checked information, it is stored. For example, when the fake news reader 120 determines that the contract or order information article of a specific company is a fact, the contract amount, the contract year, and the contract conditions are stored. Thereafter, when a new article is found in the same field, the fake news reader 120 may search whether the new article is fake news based on the fact-checked information. The fake news reader 120 has a high learning effect when the difference (GAP) between the pre-stored information and the place where the information is needed is small.
도 7은 본 실시예에 따른 가짜뉴스 판독을 위해 합성 여부를 판단 방법을 나타낸 도면이다.7 is a diagram illustrating a method of determining whether to synthesize for fake news reading according to the present embodiment.
가짜뉴스 판독기(120)는 증권 뉴스 정보에 포함된 사진의 합성 여부 판단하여 가짜뉴스를 식별한다. 가짜뉴스 판독기(120)는 CNN(Convolutional Neural Network)을 이용하여 컨볼루션(Convolution)과 풀링(Pooling)을 이용하여 특징(Feature)을 추출하여 학습한다.The fake news reader 120 identifies fake news by determining whether a photo included in the stock news information is synthesized. The fake news reader 120 uses a convolutional neural network (CNN) to extract and learn features by using convolution and pooling.
가짜뉴스 판독기(120)는 컨볼루션(Convolution)의 출력데이터를 다시 입력데이터로 사용한다. 가짜뉴스 판독기(120)는 데이터를 줄이거나 강조하는 용도로 사용한다. 가짜뉴스 판독기(120)는 풀링을 수행할 때, 최대 풀링(Max Pooling), 최소 풀링(Min Pooling), 평균 풀링(Average Pooling)을 이용할 수 있으나, CNN에서 주로 최대풀링을 이용한다.The fake news reader 120 uses the output data of the convolution again as input data. The fake news reader 120 is used to reduce or emphasize data. When the fake news reader 120 performs pooling, Max Pooling, Min Pooling, and Average Pooling may be used. However, CNN mainly uses maximum pooling.
도 8은 본 실시예에 따른 가짜뉴스 판독기의 학습 수행 개념을 나타낸 도면이다.8 is a diagram illustrating a learning execution concept of a fake news reader according to the present embodiment.
가짜뉴스 판독기(120)는 가짜뉴스를 판독을 위한 학습을 수행한다. 가짜뉴스 판독기(120)는 가짜뉴스 사례와 패턴을 분석하고, 가짜뉴스 사례와 패턴을 기반으로 증권 뉴스 정보를 분석한 결과를 학습한다.The fake news reader 120 performs learning to read fake news. The fake news reader 120 analyzes fake news cases and patterns, and learns a result of analyzing stock news information based on fake news cases and patterns.
가짜뉴스 판독기(120)는 이미지없이 문자로만 구성된 증권 뉴스 정보에 대해서는 문자열, 동영상 등 시계열 정보가 담긴 데이터를 다루는데 적합한 RNN(Recurrent Neural Networks) 알고리즘을 이용하여 학습을 수행한다.The fake news reader 120 performs learning using a Recurrent Neural Networks (RNN) algorithm suitable for handling data containing time series information, such as character strings and moving pictures, for stock news information composed only of text without images.
가짜뉴스 판독기(120)는 이미지 합성과 관련된 부분은 텐서플로우의 CNN(Convolutional Neural Network)을 이용하여 학습을 수행할 수 있다.The fake news reader 120 may learn the part related to image synthesis using a Convolutional Neural Network (CNN) of TensorFlow.
도 9는 본 실시예에 따른 인공지능을 이용한 뉴스 진위 판별 서비스를 나타낸 도면이다.9 is a diagram illustrating a news authenticity determination service using artificial intelligence according to the present embodiment.
가짜뉴스 판독기(120)는 인공지능 기술을 이용하여 뉴스 진위여부를 판별하기 위해 학습 데이터를 이용한 지도학습에서부터 시작하여 학습된 데이터를 중심으로 뉴스정보 분석하여 자동으로 가짜뉴스일 확률을 판단해내고 이를 뉴스 진위서비스를 통하여 이용자에게 제공한다.The fake news reader 120 automatically determines the probability of fake news by analyzing news information based on the learned data, starting from supervised learning using learning data to determine the authenticity of the news using artificial intelligence technology. It is provided to users through the news authenticity service.
도 9에 도시된 바와 같이, 학습 데이터 가공을 위해 뉴스컨텐츠 및 작성자정보 입력모듈은 입력받은 증권 뉴스 정보를 가짜뉴스 컨텐츠 정보 가동모듈과 가짜뉴스 컨텐츠 작성자 정보 가공모듈로 전송한다.As shown in FIG. 9 , the news content and creator information input module transmits the received stock news information to the fake news content information operation module and the fake news content creator information processing module for learning data processing.
가짜뉴스 컨텐츠 정보 가동모듈은 입력받은 증권 뉴스 정보로부터 뉴스 컨텐츠를 추출한다. 가짜뉴스 컨텐츠 작성자 정보 가공모듈은 입력받은 증권 뉴스 정보로부터 작성자 정보를 추출한다.The fake news content information operation module extracts news content from the received stock news information. The fake news content creator information processing module extracts author information from the received stock news information.
진위 정보 검증 모듈은 뉴스 컨텐츠에 대한 뉴스정보 진위정보에 대해서 검증을 수행한다. 뉴스 진위 판단 모듈은 뉴스 컨텐츠에 대한 뉴스 학습 정보를 이용하여 팩트체크를 수행하여 가짜뉴스인지를 확인한다. 작성자 성향 판단모듈은 작성자 정보를 기반으로 작성자 성향 학습 정보를 이용하여 작성자 성향을 분류한다.The authenticity information verification module verifies news information authenticity information for news content. The news authenticity determination module checks whether the news is fake news by performing a fact check using the news learning information on the news content. The author propensity determination module classifies the author propensity by using the author propensity learning information based on the author information.
뉴스 분류모듈은 뉴스 컨텐츠에 가짜뉴스 정보와 작성자 성향을 기반으로 뉴스를 분류한다. 뉴스 진위 정보 출력 모듈은 뉴스 진위 정보를 출력한다. 뉴스 정보 입력 모듈은 뉴스 진위 정보를 웹서버 및 통신 서버로 전송한다. The news classification module classifies news based on fake news information and author tendency in news content. The news authenticity information output module outputs news authenticity information. The news information input module transmits news authenticity information to the web server and the communication server.
도 10은 본 실시예에 따른 서비스 제공 개념을 나타낸 도면이다.10 is a diagram illustrating a service provision concept according to the present embodiment.
가짜뉴스 판독기(120)는 뉴스매체 등 뉴스컨텐츠의 소스 원으로부터 정보를 수신한다. 다시 말해, 가짜뉴스 판독기(120)는 언론사 뉴스 공급자(140)로부터 증권 뉴스 정보를 수집한다. 가짜뉴스 판독기(120)는 수집한 증권뉴스 정보 중 구독자 단말기(110)에서 설정한 키워드 또는 분야에 해당하는 특정분야 뉴스정보만을 추출한다.The fake news reader 120 receives information from a source source of news content, such as a news medium. In other words, the fake news reader 120 collects stock news information from the media news provider 140 . The fake news reader 120 extracts only news information in a specific field corresponding to a keyword or field set in the subscriber terminal 110 from among the collected stock news information.
가짜뉴스 판독기(120)는 인공지능을 이용하여 특정분야 뉴스정보가 가짜뉴스일 확률을 분석한다. 가짜뉴스 판독기(120)는 분석된 가짜뉴스일 확률정보를 특정분야 뉴스정보와 함께 사용자에게 제공한다. 구독자 단말기(110)는 뉴스매체에 대하여 구독설정을 진행하고, 관심 항목에 대해서는 키워드를 통하여 필터링하여 관련 정보를 별도로 확인할 수 있다.The fake news reader 120 analyzes the probability that news information in a specific field is fake news using artificial intelligence. The fake news reader 120 provides the analyzed probability information of fake news together with news information in a specific field to the user. The subscriber terminal 110 may set up a subscription for a news medium and separately check related information by filtering items of interest through keywords.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely illustrative of the technical idea of this embodiment, and a person skilled in the art to which this embodiment belongs may make various modifications and variations without departing from the essential characteristics of the present embodiment. Accordingly, the present embodiments are intended to explain rather than limit the technical spirit of the present embodiment, and the scope of the technical spirit of the present embodiment is not limited by these embodiments. The protection scope of this embodiment should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be interpreted as being included in the scope of the present embodiment.

Claims (5)

  1. 뉴스 공급자로부터 증권 뉴스 정보를 수집하는 뉴스 정보 수집부;a news information collection unit that collects stock news information from news providers;
    상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 뉴스 선별부;a news selection unit filtering only the news information of the items of interest corresponding to the keywords or items of interest set in the subscriber terminal among the stock news information;
    인공지능을 이용하여 기 학습된 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 가짜뉴스 판별부; 및a fake news determination unit for generating a truth determination result for determining whether the news information on the item of interest is fake news or real news based on previously learned learning data using artificial intelligence; and
    상기 관심항목 뉴스정보에 상기 진위판별결과를 매칭하여 상기 구독자 단말기로 큐레이션(Curation)하는 뉴스 큐레이션부를 포함하되, 상기 가짜뉴스 판별부는 상기 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 상기 문자에 대해서 전처리를 수행한 후 상기 문자들을 기반으로 단어를 인지하고, 상기 단어를 조합한 순서를 기반으로 문맥을 인지하고,and a news curation unit that matches the authenticity determination result with the interest item news information to curate the subscriber terminal, wherein the fake news determination unit separates the text and image included in the interest item news information. After performing pre-processing on the characters, words are recognized based on the characters, and contexts are recognized based on the order in which the words are combined,
    상기 관심항목 뉴스정보의 상기 문맥을 기반으로 특정 기업의 계약 또는 수주 기사로 판단하면 계약 금액, 계약년도, 계약 조건을 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업 또는 정부의 투자 기사로 판단하면 투자처, 투자분야, 투자비용, 투자년도를 팩트 정보로 저장하며, 상기 문맥을 기반으로 세계 증시 기사로 판단하면 국가별 증시 증감율, 일시를 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업별 신기술 개발 기사로 판단하면 기업별 신기술 정보를 팩트 정보로 저장하며, 상기 문맥을 기반으로 국가별 경제 성장률 기사로 판단하면 국가별 경제 성장률 정보를 팩트 정보로 저장하며, 상기 문맥을 기반으로 새로운 증권 정보가 인지되면, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 일치하는 경우 진짜뉴스로 판단한 팩트체크 결과정보를 생성하고, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 미일치하는 경우 가짜뉴스로 판단한 팩트체크 결과정보를 생성하며,If it is determined as a contract or order article of a specific company based on the context of the news information on the item of interest, the contract amount, contract year, and contract condition are saved as fact information The investment destination, investment field, investment cost, and investment year are stored as fact information. Based on the above context, if it is judged as a world stock market article, the change rate and date and time of the stock market by country are stored as fact information, and new technology development for each company based on the above context If it is judged as an article, new technology information for each company is stored as fact information, and if it is judged as an article on economic growth by country based on the above context, information on economic growth rate for each country is stored as fact information, and new securities information is recognized based on the context. When the new stock information matches the pre-stored fact information, the fact check result information determined as real news is generated, and when the new stock information does not match the pre-stored fact information, the fact check result information determined as fake news create,
    상기 팩트 정보 내의 문장 길이에 따라 적응적으로 상기 팩트 정보 내의 상기 문장에 포함된 단어간 거리를 기반으로 1차 연관도와 2차 연관도를 추출하고, 상기 1차 연관도와 상기 2차 연관도를 기반으로 단어간 연관도를 추출한 후 상기 1차 연관도에 상기 2차 연관도보다 높은 가중치를 반영하여 상기 관심항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별하며,adaptively according to the sentence length in the fact information, extracting the primary and secondary associations based on the distance between words included in the sentences in the fact information, and based on the primary and secondary associations After extracting the degree of relevance between the words as , it is determined whether the news information of the item of interest is fake news or real news by reflecting a higher weight than the second degree of relevance in the first degree of relevance,
    상기 관심항목 뉴스정보에 대한 발행처 정보, 발행 속도 정보, 발행량 정보를 수집한 후 상기 발행처 정보를 기반으로 하나의 발행처를 기준으로 다른 발행처에서 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도정보 및 상기 발행량 정보를 기반으로 뉴스가 증가하는 추세로 발행되다가 점진적으로 감소하는 추세를 가지는 경우 상기 진짜뉴스로 판단한 팩트체크 결과정보를 생성하고, 상기 발행처 정보를 기반으로 동일한 발행처에서만 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도 정보 및 상기 발행량 정보를 기반으로 뉴스가 급속도로 발행되다가 급속하게 소멸되는 추세를 갖는 경우 상기 가짜뉴스로 판단한 팩트체크 결과정보를 생성하며,After collecting the publisher information, the publication rate information, and the publication amount information for the news item of interest, it is confirmed that similar news is issued from another publisher based on one publisher based on the publication information, and the issuance rate information and the Based on the publication amount information, if the news is issued in an increasing trend and then gradually decreases, the fact check result information determined as the real news is generated, and it is confirmed that similar news is issued only in the same publisher based on the publication information and, based on the issuance rate information and the issuance amount information, generates fact check result information determined as fake news when news is issued rapidly and then rapidly disappears,
    상기 이미지에 대한 합성 여부를 확인하여, 상기 이미지가 합성한 것으로 판단되면 이미지 가짜판정정보를 생성하고, 상기 이미지가 합성되지 않은 것으로 판단되면 이미지 진짜판정정보를 생성하며, 전문가 판정단 단말기로부터 전문분야에 따라 상기 새로운 증권 정보에 대해 전문가 진짜판정정보 및 전문가 가짜판정정보를 수신하고,It is checked whether the image is synthesized, and if it is determined that the image is synthesized, image fake determination information is generated. Receive expert real judgment information and expert fake judgment information for the new securities information accordingly;
    상기 이미지 진짜판정정보, 상기 이미지 가짜판정정보, 상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보, 상기 진짜뉴스로 판단한 팩트체크 결과정보, 상기 가짜뉴스로 판단한 팩트체크 결과정보 중 가짜판정정보가 포함된 비율을 기반으로 가짜뉴스 확률정보를 계산하며,The image real determination information, the image fake determination information, the expert genuine determination information, the expert fake determination information, the fact check result information determined as the real news, and the fact check result information determined as the fake news. Calculate fake news probability information based on the ratio,
    상기 가짜뉴스 확률정보를 계산할 때,When calculating the fake news probability information,
    상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보에 대해 전문분야가 수치화 가능분야인 경우 평균 임계치보다 높은 가중치를 반영하고, 전문분야가 수치화 불가능분야인 경우 평균 임계치보다 낮은 가중치를 반영하고For the real expert judgment information and the expert fake judgment information, if the specialized field is a quantifiable field, a weight higher than the average threshold is reflected, and if the specialized field is a quantifiable field, a weight lower than the average threshold is reflected,
    상기 가짜뉴스로 판단한 팩트체크 결과정보에 기 저장된 팩트 정보에 포함된 항목과 미일치 개수를 카운트하고,Counting the number of items inconsistent with the items included in the fact information stored in the fact check result information determined as fake news,
    기 저장된 팩트 정보 내의 각 항목의 중요도에 따른 가중치를 반영하고, 상기 이미지 가짜판정정보에 합성 또는 위변조 확률을 수치화하여 상기 가짜뉴스 확률정보에 반영하는 것을 특징으로 하는 가짜뉴스 판독 장치.A fake news reading apparatus, characterized in that the weight according to the importance of each item in the pre-stored fact information is reflected, and the synthetic or forgery probability is digitized in the image fake determination information and reflected in the fake news probability information.
  2. 제 1 항에 있어서,The method of claim 1,
    가짜뉴스 사례와 가짜뉴스 패턴을 분석하고, 상기 가짜뉴스 사례와 상기 가짜뉴스 패턴을 학습하여 상기 학습데이터에 반영하며, 상기 가짜뉴스 사례와 상기 가짜뉴스 패턴을 기반으로 상기 증권 뉴스 정보를 분석한 결과를 학습하여 상기 학습 데이터에 반영하는 학습부를 추가로 포함하는 것을 특징으로 하는 가짜뉴스 판독 장치.Fake news cases and fake news patterns are analyzed, the fake news cases and the fake news patterns are learned and reflected in the learning data, and the stock news information is analyzed based on the fake news cases and the fake news patterns. Fake news reading device, characterized in that it further comprises a learning unit for learning and reflecting in the learning data.
  3. 제 2 항에 있어서,3. The method of claim 2,
    상기 뉴스 공급자로부터 상기 새로운 증권 정보를 수신하는 경우, 상기 구독자 단말기로 전달하기 전에 상기 새로운 증권 정보의 분야를 분류하며, 해당 분야에 대응하는 전문분야를 갖는 상기 전문가 판정단 단말기로 상기 증권 뉴스 정보를 전송하며, 상기 전문가 판정단 단말기로부터 상기 전문분야에 따라 상기 새로운 증권 정보에 대한 전문가 판정정보를 수신하는 진위 판별부를 추가로 포함하는 것을 특징으로 하는 가짜뉴스 판독 장치.When the new stock information is received from the news provider, the new stock information field is classified before being delivered to the subscriber terminal, and the stock news information is transmitted to the expert judging group terminal having a specialized field corresponding to the relevant field. and an authenticity determining unit for receiving expert judgment information on the new securities information according to the specialized field from the expert judgment group terminal.
  4. 제 3 항에 있어서,4. The method of claim 3,
    상기 가짜뉴스 판별부는,The fake news discrimination unit,
    상기 전문가 판정정보, 상기 학습 데이터를 기반으로 상기 관심항목 뉴스정보가 가짜뉴스인지의 진위여부를 판별하는 것을 특징으로 하는 가짜뉴스 판독 장치.and determining whether the news information on the item of interest is fake news or not based on the expert determination information and the learning data.
  5. 뉴스 정보 수집부에서 뉴스 공급자로부터 증권 뉴스 정보를 수집하는 과정;a process of collecting stock news information from news providers in the news information collection unit;
    뉴스 선별부에서 상기 증권 뉴스 정보 중 구독자 단말기에서 설정한 키워드 또는 관심항목에 해당하는 관심항목 뉴스정보만을 필터링하는 과정;a process of filtering, in the news selection unit, only the news information of the interest item corresponding to the keyword or the item of interest set in the subscriber terminal among the securities news information;
    가짜뉴스 판별부에서 상기 관심항목 뉴스정보에 포함된 문자와 이미지를 분리한 후 상기 문자에 대해서 전처리를 수행한 후 상기 문자들을 기반으로 단어를 인지하고, 상기 단어를 조합한 순서를 기반으로 문맥을 인지하는 과정;After the fake news determination unit separates the text and the image included in the news item of interest information, pre-processing is performed on the text, the word is recognized based on the text, and the context is determined based on the order of combining the words. process of perception;
    상기 가짜뉴스 판별부에서 상기 관심항목 뉴스정보의 상기 문맥을 기반으로 특정 기업의 계약 또는 수주 기사로 판단하면 계약 금액, 계약 년도, 계약 조건을 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업 또는 정부의 투자 기사로 판단하면 투자처, 투자분야, 투자비용, 투자년도를 팩트 정보로 저장하며, 상기 문맥을 기반으로 세계 증시 기사로 판단하면 국가별 증시 증감율, 일시를 팩트 정보로 저장하며, 상기 문맥을 기반으로 기업별 신기술 개발 기사로 판단하면 기업별 신기술 정보를 팩트 정보로 저장하며, 상기 문맥을 기반으로 국가별 경제 성장률 기사로 판단하면 국가별 경제 성장률 정보를 팩트 정보로 저장하는 과정;When the fake news determination unit determines that the contract or order for a specific company is a contract or order article based on the context of the news information on the item of interest, the contract amount, contract year, and contract conditions are stored as fact information, and based on the context, the When it is judged as an investment article of a process of storing new technology information for each company as fact information if it is determined as a new technology development article for each company based on the basis, and storing the economic growth rate information for each country as fact information if it is determined as an article on economic growth rate by country based on the context;
    상기 가짜뉴스 판별부에서 상기 문맥을 기반으로 새로운 증권 정보가 인지되면, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 일치하는 경우 진짜뉴스로 판단한 팩트체크 결과정보를 생성하고, 상기 새로운 증권 정보가 기 저장된 팩트 정보와 미일치하는 경우 가짜뉴스로 판단한 팩트체크 결과정보를 생성하는 과정;When the fake news determining unit recognizes new stock information based on the context, if the new stock information matches pre-stored fact information, it generates fact check result information determined as real news, and the new stock information is pre-stored. The process of generating fact check result information determined to be fake news when the fact information does not match;
    상기 가짜뉴스 판별부에서 상기 팩트 정보 내의 문장 길이에 따라 적응적으로 상기 팩트 정보 내의 상기 문장에 포함된 단어간 거리를 기반으로 1차 연관도와 2차 연관도를 추출하고, 상기 1차 연관도와 상기 2차 연관도를 기반으로 단어간 연관도를 추출한 후 상기 1차 연관도에 상기 2차 연관도보다 높은 가중치를 반영하여 상기 관심 항목 뉴스정보가 가짜뉴스인지 진짜뉴스인지를 판별한 진위판별결과를 생성하는 과정;The fake news determining unit extracts the primary and secondary associations based on the distance between words included in the sentences in the fact information adaptively according to the sentence length in the fact information, and the primary association and the After extracting the degree of relevance between words based on the second degree of relevance, a weight higher than the second degree of relevance is reflected in the first degree of relevance to determine whether the news information of the item of interest is fake news or real news. the process of creating;
    상기 가짜뉴스 판별부에서 상기 관심항목 뉴스정보에 대한 발행처 정보, 발행 속도 정보, 발행량 정보를 수집하는 과정;collecting, in the fake news determining unit, information on a publisher of the news item of interest, information on a publication rate, and information on an amount of publication;
    상기 가짜뉴스 판별부에서 상기 발행처 정보를 기반으로 하나의 발행처를 기준으로 다른 발행처에서 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도 정보 및 상기 발행량 정보를 기반으로 뉴스가 증가하는 추세로 발행되다가 점진적으로 감소하는 추세를 가지는 경우 상기 진짜뉴스로 판단한 팩트체크 결과정보를 생성하는 과정;In the fake news determination unit, it is confirmed that similar news is issued from another publisher based on one publisher based on the information on the publisher based on the information on the publisher. generating fact check result information determined as the real news when it has a decreasing trend;
    상기 가짜뉴스 판별부에서 상기 발행처 정보를 기반으로 동일한 발행처에서만 유사한 뉴스들이 발행되는 것으로 확인되고, 상기 발행 속도 정보 및 상기 발행량 정보를 기반으로 뉴스가 급속도로 발행되다가 급속하게 소멸되는 추세를 갖는 경우 상기 가짜뉴스로 판단한 팩트체크 결과정보를 생성하는 과정;When the fake news determination unit confirms that similar news is issued only from the same publisher based on the information on the publisher, and the news is issued rapidly and then rapidly disappears based on the information on the issuance rate and the amount of issuance, the The process of generating fact check result information determined to be fake news;
    상기 가짜뉴스 판별부에서 상기 이미지에 대한 합성 여부를 확인하여, 상기 이미지가 합성한 것으로 판단되면 이미지 가짜판정정보를 생성하고, 상기 이미지가 합성되지 않은 것으로 판단되면 이미지 진짜판정정보를 생성하는 과정;checking whether the image is synthesized by the fake news determining unit, generating image fake determination information if it is determined that the image is synthesized, and generating image genuine determination information if it is determined that the image is not synthesized;
    상기 가짜뉴스 판별부에서 전문가 판정단 단말기로부터 전문분야에 따라 상기 새로운 증권 정보에 대해 전문가 진짜판정정보 및 전문가 가짜판정정보를 수신하는 과정;receiving, in the fake news determination unit, real expert judgment information and expert fake judgment information for the new securities information according to the field of expertise from the expert judgment group terminal;
    상기 가짜뉴스 판별부에서 상기 이미지 진짜판정정보, 상기 이미지 가짜판정정보, 상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보, 상기 진짜뉴스로 판단한 팩트체크 결과정보, 상기 가짜뉴스로 판단한 팩트체크 결과 정보 중 가짜판정정보가 포함된 비율을 기반으로 가짜뉴스 확률정보를 계산하는 과정;Among the fake news determination unit, the image real determination information, the image fake determination information, the expert real determination information, the expert fake determination information, the fact check result information determined as the real news, and the fact check result information determined as the fake news A process of calculating fake news probability information based on a ratio including fake determination information;
    상기 가짜뉴스 판별부에서 상기 전문가 진짜판정정보, 상기 전문가 가짜판정정보에 대해 전문분야가 수치화 가능분야인 경우 평균 임계치보다 높은 가중치를 반영하고, 전문분야가 수치화 불가능분야인 경우 평균 임계치보다 낮은 가중치를 적용하여 상기 가짜뉴스 확률정보에 반영하는 과정;In the fake news determination unit, a weight higher than the average threshold value is reflected when the specialized field is a quantifiable field for the expert real determination information and the expert fake determination information, and a weight lower than the average threshold value is applied when the specialized field is a field that cannot be quantified. applying and reflecting the fake news probability information;
    상기 가짜뉴스 판별부에서 상기 가짜뉴스로 판단한 팩트체크 결과정보에 기 저장된 팩트 정보에 포함된 항목과 미일치 개수를 카운트하고, 기 저장된 팩트 정보 내의 각 항목의 중요도에 따른 가중치를 적용하여 상기 가짜뉴스 확률정보에 반영하는 과정;In the fact check result information determined by the fake news determination unit as fake news, the number of items inconsistent with the items included in the stored fact information are counted, and a weight is applied according to the importance of each item in the stored fact information to apply the fake news. The process of reflecting the probability information;
    상기 가짜뉴스 판별부에서 상기 이미지 가짜판정정보에 합성 또는 위변조 확률을 수치화하여 상기 가짜뉴스 확률정보에 반영하는 과정; 및a process of digitizing the probability of synthesis or forgery in the fake image determination information by the fake news determination unit and reflecting it in the fake news probability information; and
    뉴스 큐레이션부에서 상기 관심항목 뉴스정보, 상기 진위판별결과, 상기 가짜뉴스 확률정보를 상기 구독자 단말기로 큐레이션(Curation)하는 과정을 포함하는 것을 특징으로 하는 가짜뉴스 판독 방법.and curating, by a news curator, the news item of interest, the authenticity determination result, and the fake news probability information to the subscriber terminal.
PCT/KR2021/007642 2020-06-17 2021-06-17 Method and device for identifying fake news using ai WO2021256884A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0073560 2020-06-17
KR1020200073560A KR102228737B1 (en) 2020-06-17 2020-06-17 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence

Publications (1)

Publication Number Publication Date
WO2021256884A1 true WO2021256884A1 (en) 2021-12-23

Family

ID=75243384

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/007642 WO2021256884A1 (en) 2020-06-17 2021-06-17 Method and device for identifying fake news using ai

Country Status (2)

Country Link
KR (1) KR102228737B1 (en)
WO (1) WO2021256884A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540038A (en) * 2024-01-10 2024-02-09 中国信息通信研究院 Intelligent detection false data synthesis method and system

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102228737B1 (en) * 2020-06-17 2021-03-17 주식회사 푸시뉴스 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence
KR20230128616A (en) 2022-02-28 2023-09-05 세종대학교산학협력단 Method of generating data set for detecting fake news

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165598A (en) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology Apparatus and method for extracting rumor information
KR20170114321A (en) * 2016-04-04 2017-10-16 (주)어반트시스템 Personalized news contents filtering system and method using the Keyword analysis
KR20190019589A (en) * 2017-08-18 2019-02-27 주식회사 포스코아이씨티 System and Method for Checking Fact
KR102228737B1 (en) * 2020-06-17 2021-03-17 주식회사 푸시뉴스 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165598A (en) * 2006-12-28 2008-07-17 National Institute Of Information & Communication Technology Apparatus and method for extracting rumor information
KR20170114321A (en) * 2016-04-04 2017-10-16 (주)어반트시스템 Personalized news contents filtering system and method using the Keyword analysis
KR20190019589A (en) * 2017-08-18 2019-02-27 주식회사 포스코아이씨티 System and Method for Checking Fact
KR102228737B1 (en) * 2020-06-17 2021-03-17 주식회사 푸시뉴스 Method And Apparatus for Detecting Fake News by Using Artificial Intelligence

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LEE, DONG-HO; LEE, JEONG-HOON; KIM, YU- RI; KIM, HYUNG-JUN; PARK SEUNG-MYEON; YANG, YU-JUN; UNGBI SHIN: "Fake news detection using deep learning", PROCEEDINGS OF THE 2018 SPRING CONFERENCE OF THE KIPS; 28TH MAY 2018, vol. 25, no. 1, 11 May 2018 (2018-05-11) - 11 May 2018 (2018-05-11), Korea, pages 384 - 387, XP009533178 *
REILLY IAN: "Satirical Fake News and/as American Political Discourse", THE JOURNAL OF AMERICAN CULTURE, vol. 35, no. 3, 1 September 2012 (2012-09-01), pages 258 - 275, XP055881918, ISSN: 1542-7331, DOI: 10.1111/j.1542-734X.2012.00812.x *
SAHIL CHOPRA, JAIN SAACHI, SHOLAR JOHN MERRIMAN: "Towards Automatic Identification of Fake News: Headline-Article Stance Detection with LSTM Attention Models", 27 April 2017 (2017-04-27), pages 1 - 15, XP055483012, Retrieved from the Internet <URL:https://web.stanford.edu/class/cs224n/reports/2761028.pdf> [retrieved on 20180611] *
SHU KAI, SLIVA AMY, WANG SUHANG, TANG JILIANG, LIU HUAN: "Fake News Detection on Social Media : A Data Mining Perspective", ARXIV, vol. 19, no. 1, 1 September 2017 (2017-09-01), US , pages 22 - 36, XP055881887, ISSN: 1931-0145, DOI: 10.1145/3137597.3137600 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540038A (en) * 2024-01-10 2024-02-09 中国信息通信研究院 Intelligent detection false data synthesis method and system
CN117540038B (en) * 2024-01-10 2024-03-22 中国信息通信研究院 Intelligent detection false data synthesis method and system

Also Published As

Publication number Publication date
KR102228737B9 (en) 2023-02-23
KR102228737B1 (en) 2021-03-17

Similar Documents

Publication Publication Date Title
WO2021256884A1 (en) Method and device for identifying fake news using ai
US11430065B2 (en) Subscription-enabled news recommendation system
CN108874777B (en) Text anti-spam method and device
Li et al. Spotting fake reviews using positive-unlabeled learning
CN102208992B (en) The malicious information filtering system of Internet and method thereof
Varol et al. Feature engineering for social bot detection
WO2021112463A1 (en) Information providing apparatus and method for company
CN105843844A (en) Method for categorizing object, such as documents and/or clusters, with respect to a taxonomy and data structure derived from such categorization
WO2017155292A1 (en) Anomaly detection method and detection program
US20140059089A1 (en) Method and apparatus for structuring a network
WO2021025203A1 (en) Artificial intelligence-based mail management method and device
Chung et al. A theory-based deep-learning approach to detecting disinformation in financial social media
Li et al. A CNN-based misleading video detection model
Naudé et al. A machine learning approach to detecting fraudulent job types
Jáñez-Martino et al. Classifying spam emails using agglomerative hierarchical clustering and a topic-based approach
Sheeba et al. A fuzzy logic based on sentiment classification
WO2020149541A1 (en) Method and device for automatically generating question-answer data set for specific topic
CN117291722A (en) Object management method, related device and computer readable medium
CN113961969B (en) Security threat collaborative modeling method and system
CN113722484A (en) Rumor detection method, device, equipment and storage medium based on deep learning
Grishechko The Linguistic Landscape of" Controversial": Sentiment and Theme Distribution Insights.
Brady et al. Theory-driven Measurement of Emotion (Expressions) in Social Media Text
Cai et al. Co-attention based feature fusion network for spam review detection on douban
WO2024071568A1 (en) Product marketing method based on customer preference prediction
Ahmad et al. Features Identification for Filtering Credible Content on Twitter Using Machine Learning Techniques

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21824974

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205 DATED 12/05/2023)

122 Ep: pct application non-entry in european phase

Ref document number: 21824974

Country of ref document: EP

Kind code of ref document: A1