JP7287992B2 - Information processing device, information processing system, information processing method, and program - Google Patents
Information processing device, information processing system, information processing method, and program Download PDFInfo
- Publication number
- JP7287992B2 JP7287992B2 JP2021011645A JP2021011645A JP7287992B2 JP 7287992 B2 JP7287992 B2 JP 7287992B2 JP 2021011645 A JP2021011645 A JP 2021011645A JP 2021011645 A JP2021011645 A JP 2021011645A JP 7287992 B2 JP7287992 B2 JP 7287992B2
- Authority
- JP
- Japan
- Prior art keywords
- news
- information processing
- title
- text
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 71
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000004458 analytical method Methods 0.000 claims description 19
- 238000009795 derivation Methods 0.000 claims description 14
- 238000010801 machine learning Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 description 24
- 238000000034 method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理装置、情報処理システム、情報処理方法、及びプログラムに関する。 The present invention relates to an information processing device, an information processing system, an information processing method, and a program.
近年、ニュース配信業者がニュースを収集し、収集したニュースを配信するサービスが提供されている。ニュース配信業者が収集するニュースには、偽のニュース、いわゆるフェイクニュースが含まれることがある。フェイクニュースの伝達を阻止するために、従来、人手を介して発見したフェイクニュースの特徴を学習し、学習結果に基づきフェイクニュースを自動的に検知する技術がある(例えば、特許文献1参照)。 In recent years, services have been provided in which news distributors collect news and distribute the collected news. News collected by news distributors may include fake news, so-called fake news. In order to prevent the transmission of fake news, conventionally, there is a technique of learning the characteristics of manually discovered fake news and automatically detecting fake news based on the learning result (see, for example, Patent Document 1).
しかし、多数あるニュースの中からフェイクニュースを見抜くことは簡単ではない。このため、ニュース配信業者により配信されるニュースには、信用度の低いニュースから信用度の高いニュースまで様々なニュースがある。このよう様々なニュース配信業者からニュースを配信されたユーザは、ニュースの内容を見ても一律的にその内容を信頼することが難しいという問題があった。 However, it is not easy to spot fake news from a large number of news. Therefore, the news distributed by news distributors includes various news, from low-credit news to high-credit news. There is a problem that it is difficult for users who have received news delivered from such various news distributors to uniformly trust the content of the news even if they see the content of the news.
本発明は、このような事情を考慮してなされたものであり、配信されるニュースの内容をユーザに信頼させることができる情報処理装置、情報処理システム、情報処理方法、及びプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and provides an information processing apparatus, an information processing system, an information processing method, and a program that enable users to trust the content of news that is distributed. is one of the purposes.
本発明の一態様は、ニュースの本文と、前記ニュースに付されたタイトルを収集する収集部と、前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングする分析部と、前記クラスタリングの結果に基づいて、前記本文と前記タイトルの合致度を求める分析部と、を備える、情報処理装置である。 According to one aspect of the present invention, a collection unit that collects texts of news and titles attached to the news, and an analysis unit that clusters the texts and the titles based on words included in the texts and the titles. and an analysis unit that obtains a degree of matching between the text and the title based on the result of the clustering.
本発明の一態様によれば、配信されるニュースの内容をユーザに信頼させることができる。 ADVANTAGE OF THE INVENTION According to one aspect of the present invention, users can be made to trust the content of news to be distributed.
以下、図面を参照し、本発明の情報処理装置、情報処理システム、情報処理方法、及びプログラムの実施形態について説明する。 Hereinafter, embodiments of an information processing apparatus, an information processing system, an information processing method, and a program according to the present invention will be described with reference to the drawings.
[概要]
図1は、情報処理システムMにおいて、情報処理装置100が取り扱うニュースに関する情報の伝達の一例を示す図である。情報処理システムMは、例えば、一以上の投稿者端末1、ニュース配信サーバ2、端末装置10、及び情報処理装置100を含む。情報処理装置100は、ネットワークを介して複数の投稿者端末1、ニュース配信サーバ2、及び複数の端末装置10と接続される。ネットワークは、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、セルラー網などを含む。
[overview]
FIG. 1 is a diagram showing an example of transmission of information on news handled by an
投稿者は、投稿者端末1を用いて、世の中で起こる様々な事象に関するニュースを作成し、作成したニュースをニュース配信サーバ2に投稿する。投稿者端末1を用いてニュースを投稿する投稿者は、例えば、いわゆるメディアなどのニュースの投稿を業とする法人でもよいし、法人以外の自然人でもよい。ニュース配信サーバ2は、投稿者端末1により投稿されたニュースを端末装置10に配信する。ニュース配信サーバ2は、ニュース配信装置の一例である。
A contributor uses
端末装置10は、例えば、ニュース配信サーバ2によりネットワークを介して配信されることによって提供されるニュースを表示する。端末装置10を占有するユーザは、端末装置10にニュースが表示されることにより、投稿者が投稿するニュースの内容を知ることができる。
The
情報処理装置100は、ニュース配信サーバ2に配信されたニュースを取得する。情報処理装置100は、取得したニュースのタイトルと本文の合致度を示す情報を導出し、取得したニュースがフェイクニュースである信頼度を判定する。情報処理装置100は、導出した合致度及び判定した信頼度の情報をニュース配信サーバ2に送信する。
The
[ニュース配信サーバ2]
ニュース配信サーバ2は、例えば、1以上のプロセッサにより実現される。図2は、ニュース配信サーバ2の構成の一例を示す図である。ニュース配信サーバ2は、例えば、通信部210と、処理部220と、を備える。通信部210は、例えば、NIC等の通信インターフェースを含む。通信部210は、ネットワークを介して、端末装置10や情報処理装置100などと通信する。
[News distribution server 2]
The
処理部220は、例えば、収集部221と、決定部222と、配信部223と、を備える。処理部220の各構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶部装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。上記の全ての構成要素が一つのプロセッサにより実現される必要はなく、適宜、複数のプロセッサによる分散処理などがなされてもよい。
The
収集部221は、複数の投稿者端末1により投稿される複数のニュースを収集する。収集部221は、収集したニュースをまとめて決定部222に通知する。決定部222は、収集部221により通知されたニュースの内容を選別したり、複数のニュースをジャンルに応じて分類したりする。
The
決定部222は、収集部221が分類した複数のニュースを情報処理装置100に送信する。決定部222は、収集部221が分類する前のニュースを情報処理装置100に送信してもよい。情報処理装置100は、ニュース配信サーバ2が送信したニュースの合致度を導出し、信頼度を判定してニュース配信サーバ2に送信する。ニュース配信サーバ2は、情報処理装置100により送信される信頼度の情報に基づいて、分類したニュースの優先順位を決定する。
The
決定部222は、分類したジャンルを示すメタ情報をニュースに付与する。決定部222は、情報処理装置により送信される合致度をニュースに付与する。決定部222は、ニュースの情報を、付与した優先順位、メタ情報、及び情報処理装置100により送信される合致度とともに配信部223に通知する。配信部223は、決定部222により通知されたニュースの情報を端末装置10に配信する。
The determining
[端末装置10]
端末装置10は、例えば、スマートフォンであり、画像を表示する表示部と入力部とを兼用するタッチパネルを備える。端末装置10は、スマートフォン以外の携帯電話やタブレット端末、ノート型あるいはデスクトップ型のパーソナルコンピュータ、PDA(Personal Digital Assistant)などの、少なくとも通信機能と表示機能を有するものであればよい。
[Terminal device 10]
The
端末装置10では、例えば、アプリケーションプログラムやブラウザなどのUA(User Agent)が動作する。端末装置10は、例えば、ニュースを表示させるUAが動作し、ニュース配信サーバ2にリクエストを送信することにより、ニュース配信サーバ2により配信される。そして、端末装置10は、配信されたニュースをタッチパネルに表示可能となる。
In the
端末装置10のユーザは、ニュース配信サーバ2によるニュースの配信を受けたいときに、UAを起動(動作)させる。端末装置10のユーザは、UAが動作中である端末装置10を操作することにより、端末装置10に対して、ニュース配信リクエストをニュース配信サーバ2に向けて送信させる。
When the user of the
ニュース配信サーバ2は、端末装置10により送信されるニュース配信リクエストに応じて、ニュースコンテンツとしてのトップページを端末装置10に配信する。端末装置10は、ニュース配信サーバ2により配信されるトップページをタッチパネルに表示する。トップページは、ニュースのタイトルとサムネイルを含むフロント画像の一覧を含むコンテンツである。
The
図3は、端末装置10に表示されたトップページG1の一例である。図示するように、端末装置10は、トップページG1に、ジャンルG11と、フロント画像G12と、を表示する。ジャンルG11は、トップページG1の上方に表示される。ジャンルG11には、メタ情報としてニュースに付与されるジャンルの内容が含まれる。ジャンルG11は、例えば「主要」「エンタメ」「スポーツ」「国内」「経済」「国際」などのジャンルがタブに表示される。複数のジャンルG11から1つのジャンルG11の1つが選択されると、選択されたジャンルのタブが暗転し、選択されたジャンルのメタ情報が付与されたニュースのフロント画像G12が順に複数表示される。
FIG. 3 is an example of the top page G1 displayed on the
フロント画像G12には、サムネイルG13とタイトルG14と合致度G15とが含まれる。フロント画像G12に含まれるタイトルG14には、文字数の制限が課されている。このため、フロント画像G12のタイトルG14は、ニュースの本文に含まれるニュースのタイトルを簡素化したタイトルであることがある。フロント画像G12は、ニュースに付与された表示優先度が高い順(ランキングが高い順)に上から表示される。 The front image G12 includes a thumbnail G13, a title G14, and a matching degree G15. The title G14 included in the front image G12 is restricted in the number of characters. Therefore, the title G14 of the front image G12 may be a simplified version of the news title included in the body of the news. The front image G12 is displayed from the top in the order of the display priority assigned to the news (high ranking order).
端末装置10は、フロント画像G12が操作されると、フロント画像G12が示すニュースに応じた指定リクエストをニュース配信サーバ2に送信する。ニュース配信サーバ2は、例えば、端末装置10により送信される指定リクエストを受信した場合に、指定リクエストに応じたニュースの本文を端末装置10に配信する。ニュース配信サーバ2によりニュースの本文を配信された端末装置10は、ニュース画像をタッチパネルに表示する。ニュース配信サーバ2は、トップページG1とともにニュースの本文を端末装置10に配信してもよい。
When the front image G12 is operated, the
図4は、端末装置10に表示されたニュースページG2の一例を示す図である。図示するように、ニュースページG2には、拡大画像G21と、タイトルG22と、合致度G23と、フロント本文G24と、表示継続ボタンG25とが含まれる。拡大画像G21は、例えば、フロント画像G12に含まれるサムネイルG13を拡大した画像である。フロント画像G12では、狭い領域で複数のニュースを表示することから、サムネイルG13は小さな画像となる。ニュースページG2では、画像を表示する領域を広くとることができる。このため、ニュースページG2に含まれる拡大画像G21は、サムネイルG13より大きな画像とすることができる。
FIG. 4 is a diagram showing an example of the news page G2 displayed on the
拡大画像G21の下にタイトルG22が表示される。タイトルG22は、例えば、フロント画像G12に含まれるタイトルG14と共通の内容である。フロント画像G12に含まれるタイトルG14は、表示スペースが狭い場合には、長文を入れることができないことがある。このため、フロント画像G12に含まれるタイトルG14は、タイトルG22を簡略化したタイトルとなる。 A title G22 is displayed below the enlarged image G21. The title G22 has, for example, the same content as the title G14 included in the front image G12. The title G14 included in the front image G12 may not be able to contain a long sentence when the display space is narrow. Therefore, the title G14 included in the front image G12 is a simplified version of the title G22.
拡大画像G21とタイトルG22の間に合致度G23が表示される。合致度G23は、フロントページに表示される合致度と同一の合致度である。タイトルG22の下にフロント本文G24が表示される。フロント本文G24は、ニュースの本文のうち、最初の数行を示す文章である。フロント本文G24の下に表示継続ボタンG25が表示される。表示継続ボタンG25が操作されることにより、ニュースの本文が表示される。ニュースの本文が長い場合には、端末装置10の表示がスクロールされることにより、ニュースの全文が順次表示される。ここで表示されるニュースの本文にも、タイトル及び拡大画像が合わせて表示される。
A matching degree G23 is displayed between the enlarged image G21 and the title G22. The degree of matching G23 is the same degree of matching as displayed on the front page. A front text G24 is displayed below the title G22. The front text G24 is text indicating the first few lines of the news text. A display continuation button G25 is displayed below the front text G24. By operating the display continuation button G25, the text of the news is displayed. When the text of the news is long, the display of the
[情報処理装置100の構成]
情報処理装置100は、例えば、1以上のプロセッサにより実現される。図5は、情報処理装置100の構成の一例を示す図である。情報処理装置100は、例えば、通信部110と、処理部120と、記憶部150と、を備える。通信部110は、例えば、NIC等の通信インターフェースを含む。通信部110は、ネットワークを介して、ニュース配信サーバ2などと通信する。
[Configuration of information processing apparatus 100]
The
処理部120は、例えば、収集部121と、分析部122と、導出部123と、生成部124と、判定部125と、を備える。処理部120の各構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶部装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。上記の全ての構成要素が一つのプロセッサにより実現される必要はなく、適宜、複数のプロセッサによる分散処理などがなされてもよい。
The
情報処理装置100は、さらに、記憶部150を備える。記憶部150は、例えば、HDD、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部150には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他、学習済モデル151を記憶する。記憶部150は、情報処理装置100に付随する装置ではなく、ネットワークなどを介して情報処理装置100からアクセス可能なNAS(Network Attached Storage)であってもよい。
収集部121は、ニュース配信サーバ2により配信される複数のニュースを取得する。収集部121は、収集したニュースのそれぞれについて、ニュースのタイトル及び本文を抽出する。収集部121は、収集したニュースのタイトル及び本文を分析部122に通知する。
The
分析部122は、ニュースのタイトルと本文のそれぞれに対して、例えば自然言語処理を行い、タイトル及び本文に含まれるワードを抽出する。分析部122は、タイトル及び本文に含まれるワードの存在に基づいてタイトル及び本文をベクトル化してクラスタリングし、タイトルベクトル及び本文ベクトルを生成する。分析部122は、例えば、タイトルに含まれるワードに対応するベクトル要素を1、そうでないベクトル要素をゼロとした疎ベクトルであるタイトルベクトルを生成する。そして、分析部122は、タイトルベクトルのベクトル空間上の位置に基づいてタイトルをクラスタリングする。
The
分析部122は、同様に、例えば、本文に含まれるワードに対応するベクトル要素を1、そうでないベクトル要素をゼロとした疎ベクトルである本文ベクトルを生成する。そして、分析部122は、本文ベクトルのベクトル空間上の位置に基づいて本文をクラスタリングする。分析部122は、クラスタリングの結果として得られたタイトルベクトル及び本文ベクトルを導出部123に通知する。
The
分析部122は、クラスタリングとしてどのような手法を用いてもよい。分析部122は、例えば、単リンク法(最短距離法)、完全リンク法(最長距離法)、群平均法、Word法(最小分散法)、セントロイド法(重心法)、重み付き平均法、メジアン法、K平均法など公知の手法を用いてよい。
The
導出部123は、分析部122におけるクラスタリングの結果に基づいて、ニュースのタイトルと本文の合致度を導出する。合致度は、ニュースのタイトルと本文の内容が合致する割合を表す指標値である。例えば、本文の内容を的確かつ端的に表しているタイトルが付与されたニュースでは、合致度が高く導出され、大げさな内容のタイトルが付与されているが本文の内容はタイトルとはかけ離れた内容である場合には、合致度は低く導出される。
The derivation unit 123 derives the matching degree between the news title and the text based on the clustering result of the
導出部123は、ニュースのタイトルと本文の合致度として、例えば、分析部122が生成したタイトルベクトルと本文ベクトルのコサイン類似度を算出する。導出部123は、算出したコサイン類似度をニュースのタイトルと本文の合致度として導出する。ニュースのタイトルと本文の合致度は、他の手法により導出されてもよい。導出部123は、導出した合致度をニュース配信サーバ2に送信する。
The derivation unit 123 calculates, for example, the cosine similarity between the title vector and the text vector generated by the
生成部124は、収集部121が抽出したニュースのタイトル及び本文に基づいて、学習済モデル151を生成する。生成部124は、例えば、収集部121が収集したニュースから抽出したニュースのタイトル及び本文を学習データとした機械学習を行って最適化された学習済モデルを生成する。
The
図6は、学習済モデル151の機能を概念的に示す図である。学習済モデル151は、例えば、ニュースのタイトル及び本文を入力データとし、ニュースがフェイクニュースであるか否かを出力データとする。学習済モデル151は、例えば、入力層と中間層と出力層とを有する。
FIG. 6 is a diagram conceptually showing the functions of the trained
入力層には、ニュースのタイトル及び本文のデータが入力される。出力層からは、ニュースがフェイクニュースであるか否かの結果が出力される。中間層は、例えば、入力層と出力層をつなぐ多層のニューラルネットワークを有する。学習済モデルとしては、例えば、トランスフォーマー、バートが用いられる。学習済モデルによる処理の前処理として、TF-IDF(Term FrequencyーInverse Document Frequency)等でワードを絞り込む処理が行われてもよい。 The input layer receives news title and text data. The output layer outputs a result indicating whether the news is fake news. The intermediate layer has, for example, a multilayer neural network connecting the input layer and the output layer. As a trained model, for example, Transformer and Vert are used. As pre-processing for processing by the trained model, processing for narrowing down words by TF-IDF (Term Frequency-Inverse Document Frequency) or the like may be performed.
生成部124は、例えば、何らかの手法でニュースがフェイクニュースであると判定されたときのデータを正解データとし、学習済モデル151の元となる機械学習モデルのパラメータを調整する。生成部124は、入力層への入力データを学習データとし、出力層から出力されるべきデータを正解データとして、バックプロパゲーション等により中間層のパラメータを調整することで、機械学習モデルを最適化することにより、学習済モデル151を生成する。生成部124は、生成した学習済モデル151を記憶部150に格納する。
For example, the
判定部125は、例えば、記憶部150から学習済モデル151を読み出す。判定部125は、収集部121が抽出したニュースのタイトル及び本文を入力データとして学習済モデル151に入力することで、収集部121が収集したニュースがフェイクニュースである信頼度を判定する。さらに、判定部125は、例えば、導出部123が導出した合致度が低いほど、信頼度を大きく判定する。判定部125は、判定した信頼度をニュース配信サーバ2に送信する。
The
[処理シーケンス]
次に、情報処理システムMによって実行される一連の処理について説明する。図7は、情報処理システムMにより実行される処理の流れの一例を示すシーケンス図である。まず、投稿者端末1は、作成したニュースをニュース配信サーバ2に投稿する(ステップS1)。投稿者端末1は複数あり、ニュース配信サーバ2には、複数の投稿者端末1からニュースが投稿される。それぞれの投稿者端末1は、ニュース配信サーバ2に対して複数のニュースを投稿する。
[Processing sequence]
Next, a series of processes executed by the information processing system M will be described. FIG. 7 is a sequence diagram showing an example of the flow of processing executed by the information processing system M. As shown in FIG. First, the
ニュース配信サーバ2は、投稿者端末1により投稿されたニュースを収集部221においてし、続いて、決定部222は、収集部221が収集したニュースを分類する(ステップS11)。ニュース配信サーバ2は、決定部222において分類したニュースを情報処理装置100に送信する(ステップS2)。
The
ニュースを送信された情報処理装置100は、収集部121においてニュースを収集し、収集したニュースのタイトルと本文を抽出する。続いて、分析部122は、収集部121が抽出したニュースのタイトルと本文をそれぞれクラスタリングして(ステップS21)、タイトルベクトル及び本文ベクトルを生成する。
The
続いて、導出部123は、分析部122が生成したタイトルベクトル及び本文ベクトルを用いて、ニュースのタイトルと本文の合致度を導出する(ステップS22)。続いて、生成部124は、ニュースのタイトル及び本文を学習データとした機械学習を行って最適化された学習済モデルを生成する(ステップS23)。
Subsequently, the derivation unit 123 derives the matching degree between the news title and the text using the title vector and text vector generated by the analysis unit 122 (step S22). Subsequently, the generating
続いて、判定部125は、学習済モデル151を記憶部150から読み出す。判定部125は、収集部121が抽出したニュースのタイトル及び本文を入力データとして学習済モデル151に入力する。こうして、判定部125は、収集部121が収集したニュースがフェイクニュースである信頼度を判定する(ステップS24)。その後、情報処理装置100は、導出部123が導出した導出度及び判定部125が判定した信頼度をニュース配信サーバ2に送信する(ステップS3)。
Subsequently, the
ニュース配信サーバ2は、決定部222において、情報処理装置100により送信された信頼度に基づいて、ニュースの優先順位を決定する(ステップS12)。続いて、ニュース配信サーバ2は、複数のニュースについて、優先順位とともに分類したジャンルを示すメタ情報及びタイトルと本文の合致度を付与して端末装置10に配信する(ステップS4)。
The
ニュースの配信を受けた端末装置10は、配信されたニュースを表示する(ステップS31)。端末装置10は、ニュースを表示するにあたり、ニュースに付与されたメタ情報に基づいてニュースを分類する。さらに、端末装置10は、ニュースに付与された優先順位が高い順に上からニュースを並べて表示する。さらに、端末装置10は、ニュースに付与された合致度をニュースとともに表示する。こうして、情報処理システムMによって実行される一連の処理が終了する。
The
実施形態の情報処理装置100は、ニュースのタイトルと本文をクラスタリングしてタイトルベクトルと本文ベクトルを生成し、タイトルと本文の合致度を導出する。タイトルと本文の合致度が低いと、ニュースがフェイクニュースである可能性が高くなる傾向が見てとれる。このため、タイトルと本文の合致度を導出して、導出した合致度に応じてニュースを配信することにより、配信されるニュースの内容をユーザに信頼させることができる。
The
さらに、情報処理装置100は、導出した合致度に基づいて、ニュースがフェイクニュースである信頼度を判定し、合致度が低いほど信頼度を大きく判定する。フェイクニュースである可能性を明確に認識することができる。さらに、本文及びタイトルを学習データとしてニュースがフェイクニュースであると判定されたときのニュースを正解データとした機械学習により、前記ニュースがフェイクニュースであるか否かを判定する学習済モデルを用いて、信頼度を判定する。このため、フェイクニュースの信頼度を容易かつ精度よく判定することができる。
Further, the
さらに、情報処理システムMは、端末装置10において、ニュースを表示する際に、ニュースの合致度を表示する。このため、端末装置10を占有するユーザは、合致度を確認することにより、ニュースの本文を読む価値があるか否かをおおよそ予想することができる。
Furthermore, the information processing system M displays the matching degree of the news when displaying the news on the
[変形例]
上記の実施形態では、決定部222は、ニュースがフェイクニュースである信頼度に基づいて優先順位を決定する。これに対して、決定部222は、ニュースのタイトルと本文の合致度に基づいて優先順位を決定してもよい。この場合、決定部222は、合致度が高いほど優先順位を高く決定すればよい。さらに、決定部222は、ニュースがフェイクニュースである信頼度及びニュースのタイトルと本文の合致度に基づいて優先順位を決定してもよい。
[Modification]
In the above embodiment, the
上記の実施形態では、ニュース配信サーバ2は、ニュースに合致度を付与して端末装置10に配信する。これに対して、ニュース配信サーバ2は、合致度に代えてまたは加えて、ニュースに信頼度を付与して端末装置10に配信してもよい。この場合、端末装置10には、ニュースとともに、そのニュースがフェイクニュースである信頼度が表示される。ニュース配信サーバ2は、合致度とともに信頼度を付与したニュースを端末装置10に配信してもよい。
In the above-described embodiment, the
上記の実施形態では、判定部125は、学習済モデル151を用いてニュースがフェイクニュースである信頼度を判定する。これに対して、判定部125は、ニュースのタイトルと本文の合致度に基づいてニュースの信頼度を判定してもよい。判定部125は、例えば、ニュースのタイトルと本文の合致度の逆数をニュースがフェイクニュースである信頼度としてもよい。
In the above embodiment, the
上記の実施形態では、情報処理装置100が生成部124を備え、情報処理装置100において、学習済モデル151を生成する。これに対して、情報処理装置100は、生成部124を備えることなく、学習済モデル151を生成しないものでもよい。この場合、情報処理装置100は、別途生成される学習済モデル151を取得して、例えば記憶部150に記憶するようにすればよい。
In the above embodiment, the
フェイクニュースには、プロパガンダ、単純なデマ、悪意のある情報、ミスインフォメーション、ディスインフォメーション、マルインフォメーションなどの種類がある。情報処理装置100は、フェイクニュースである信頼度として、これらの種類のフェイクニュースごとに信頼度を導出してもよい。
Fake news includes types such as propaganda, simple hoaxes, malicious information, misinformation, disinformation, and misinformation. The
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 As described above, the mode for carrying out the present invention has been described using the embodiments, but the present invention is not limited to such embodiments at all, and various modifications and replacements can be made without departing from the scope of the present invention. can be added.
1…投稿者端末
2…ニュース配信サーバ
10…端末装置
100…情報処理装置
110,210…通信部
120,220…処理部
121,221…収集部
122…分析部
123…導出部
124…生成部
125…判定部
150…記憶部
151…学習済モデル
222…決定部
223…配信部
G1…トップページ
G2…ニュースページ
G11…ジャンル
G12…フロント画像
G13…サムネイル
G14…タイトル
G15…合致度
G21…拡大画像
G22…タイトル
G23…合致度
G24…フロント本文
G25…表示継続ボタン
M…情報処理システム
1...
Claims (14)
前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングする分析部と、
前記クラスタリングの結果に基づいて、ユーザの端末に前記本文と前記タイトルとともに表示させる前記本文と前記タイトルの合致度を導出する導出部と、を備える、
情報処理装置。 a collection unit that collects texts of news provided via a network and titles given to the news;
an analysis unit that clusters the text and the title based on words contained in the text and the title, respectively;
a derivation unit that derives a degree of matching between the text and the title to be displayed on a user terminal together with the text and the title, based on the clustering result;
Information processing equipment.
前記判定部は、前記合致度が低いほど、前記信頼度を大きく判定する、
請求項1に記載の情報処理装置。 A determination unit that determines the reliability that the news is fake news based on the degree of matching,
The determination unit determines the reliability to be larger as the degree of matching is lower.
The information processing device according to claim 1 .
請求項2に記載の情報処理装置。 The judging unit judges whether the news is fake news by machine learning using the title and the text as learning data and correct data when the news is judged to be fake news. Determining the reliability using a trained model that
The information processing apparatus according to claim 2.
請求項2または3に記載の情報処理装置。 A trained model for determining whether or not the news is fake news by machine learning using the title and the text as learning data and the news when the news is determined to be fake news as correct data. a generator that generates
The information processing apparatus according to claim 2 or 3.
ネットワークを介して提供されるニュースを収集し、収集したニュースを分類して端末装置に配信するニュース配信装置と、を備え、
前記導出部は、前記合致度を前記ニュース配信装置に提供し、
前記ニュース配信装置は、前記ユーザの端末に前記合致度を前記タイトル及び前記本文とともに表示させる、
情報処理システム。 an information processing apparatus according to any one of claims 1 to 4;
a news distribution device that collects news provided via a network, classifies the collected news, and distributes it to a terminal device;
The derivation unit provides the degree of matching to the news distribution device,
The news distribution device causes the terminal of the user to display the degree of matching together with the title and the text.
Information processing system.
前記決定部は、前記導出部により提供される前記合致度に基づいて、前記優先順位を決定する、
請求項5に記載の情報処理システム。 The news distribution device includes a determination unit that determines the priority of the classified news,
The determination unit determines the priority based on the degree of matching provided by the derivation unit.
The information processing system according to claim 5.
請求項6に記載の情報処理システム。 The determination unit determines the priority higher as the degree of matching is higher.
The information processing system according to claim 6.
請求項5から7のうちいずれか1項に記載の情報処理システム。 The news distribution device distributes the news to which the degree of matching is attached.
The information processing system according to any one of claims 5 to 7.
ネットワークを介して提供されるニュースを収集し、収集したニュースを分類して端末装置に配信するニュース配信装置と、を備え、
前記判定部は、前記信頼度を前記ニュース配信装置に提供する、
情報処理システム。 an information processing apparatus according to any one of claims 2 to 4;
a news distribution device that collects news provided via a network, classifies the collected news, and distributes it to a terminal device;
The determination unit provides the reliability to the news distribution device,
Information processing system.
前記決定部は、前記情報処理装置により提供される前記信頼度に基づいて、前記優先順位を決定する、
請求項9に記載の情報処理システム。 The news distribution device includes a determination unit that determines the priority of the classified news,
The determination unit determines the priority based on the reliability provided by the information processing device.
The information processing system according to claim 9.
請求項10に記載の情報処理システム。 The determination unit determines the priority to be lower as the reliability is higher.
The information processing system according to claim 10.
請求項9から11のうちいずれか1項に記載の情報処理システム。 The news distribution device distributes the news with the reliability attached.
The information processing system according to any one of claims 9 to 11.
ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集し、
前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングし、
前記クラスタリングの結果に基づいて、ユーザの端末に前記本文と前記タイトルとともに表示させる前記本文と前記タイトルの合致度を導出する、
情報処理方法。 the computer
collecting the text of the news provided via the network and the title attached to the news,
clustering the text and the title based on words contained in the text and the title, respectively;
Based on the results of the clustering, derive the degree of matching between the text and the title to be displayed on the user's terminal together with the text and the title;
Information processing methods.
ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集させ、
前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングさせ、
前記クラスタリングの結果に基づいて、ユーザの端末に前記本文と前記タイトルとともに表示させる前記本文と前記タイトルの合致度を導出させる、
プログラム。 to the computer,
collecting texts of news provided via a network and titles given to the news;
Clustering the text and the title based on words contained in the text and the title, respectively;
Based on the result of the clustering, derive the degree of matching between the text and the title to be displayed together with the text and the title on the user's terminal ;
program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021011645A JP7287992B2 (en) | 2021-01-28 | 2021-01-28 | Information processing device, information processing system, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021011645A JP7287992B2 (en) | 2021-01-28 | 2021-01-28 | Information processing device, information processing system, information processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022115160A JP2022115160A (en) | 2022-08-09 |
JP7287992B2 true JP7287992B2 (en) | 2023-06-06 |
Family
ID=82747926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021011645A Active JP7287992B2 (en) | 2021-01-28 | 2021-01-28 | Information processing device, information processing system, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7287992B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7564390B1 (en) | 2024-02-02 | 2024-10-08 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | Information processing device, information processing method, and information processing program |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282795A (en) | 2008-05-23 | 2009-12-03 | National Institute Of Information & Communication Technology | System, method, and program for estimating level of importance of information |
CN105095368A (en) | 2015-06-29 | 2015-11-25 | 北京金山安全软件有限公司 | Method and device for sequencing news information |
JP2016105260A (en) | 2014-12-01 | 2016-06-09 | ビッグローブ株式会社 | Site consolidation method, site consolidation system, information processing device, and program |
JP2017117270A (en) | 2015-12-25 | 2017-06-29 | 株式会社イード | Information processing device, method and program |
JP2019164591A (en) | 2018-03-20 | 2019-09-26 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
JP2019507425A5 (en) | 2017-01-17 | 2020-02-20 | ||
CN111061862A (en) | 2019-12-16 | 2020-04-24 | 湖南大学 | Method for generating abstract based on attention mechanism |
JP2020173774A (en) | 2019-04-08 | 2020-10-22 | バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド | Method, device, server, computer-readable storage medium, and computer program for generating narration |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017062612A (en) * | 2015-09-24 | 2017-03-30 | 株式会社日立製作所 | Regulation search device and regulation search method |
CN107015976B (en) * | 2016-01-27 | 2020-09-29 | 阿里巴巴集团控股有限公司 | Service processing method, data processing method and device |
KR102107502B1 (en) * | 2018-12-13 | 2020-05-07 | 줌인터넷 주식회사 | An apparatus for detecting spam news with false article titles, a method thereof and computer recordable medium storing program to perform the method |
-
2021
- 2021-01-28 JP JP2021011645A patent/JP7287992B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282795A (en) | 2008-05-23 | 2009-12-03 | National Institute Of Information & Communication Technology | System, method, and program for estimating level of importance of information |
JP2016105260A (en) | 2014-12-01 | 2016-06-09 | ビッグローブ株式会社 | Site consolidation method, site consolidation system, information processing device, and program |
CN105095368A (en) | 2015-06-29 | 2015-11-25 | 北京金山安全软件有限公司 | Method and device for sequencing news information |
JP2017117270A (en) | 2015-12-25 | 2017-06-29 | 株式会社イード | Information processing device, method and program |
JP2019507425A5 (en) | 2017-01-17 | 2020-02-20 | ||
JP2019164591A (en) | 2018-03-20 | 2019-09-26 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
JP2020173774A (en) | 2019-04-08 | 2020-10-22 | バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド | Method, device, server, computer-readable storage medium, and computer program for generating narration |
CN111061862A (en) | 2019-12-16 | 2020-04-24 | 湖南大学 | Method for generating abstract based on attention mechanism |
Also Published As
Publication number | Publication date |
---|---|
JP2022115160A (en) | 2022-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11455465B2 (en) | Book analysis and recommendation | |
CN106708817B (en) | Information searching method and device | |
US9613268B2 (en) | Processing of images during assessment of suitability of books for conversion to audio format | |
CN111259192B (en) | Audio recommendation method and device | |
US11010687B2 (en) | Detecting abusive language using character N-gram features | |
CN110334356A (en) | Article matter method for determination of amount, article screening technique and corresponding device | |
US20150379610A1 (en) | Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program | |
JP2011081728A (en) | Device, method and program for extracting recommended content | |
KR20140119269A (en) | Apparatus and system for detecting complex issues based on social media analysis and method thereof | |
EP2613275B1 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
JP6434954B2 (en) | Information processing apparatus, information processing method, and program | |
JP7287992B2 (en) | Information processing device, information processing system, information processing method, and program | |
JP2016177690A (en) | Service recommendation device, service recommendation method, and service recommendation program | |
WO2016103519A1 (en) | Data analysis system, data analysis method, and data analysis program | |
US11232325B2 (en) | Data analysis system, method for controlling data analysis system, and recording medium | |
WO2021200502A1 (en) | Information processing device and information processing method | |
US11007443B2 (en) | Method for performing game by using activity count | |
JP6993955B2 (en) | Information processing equipment, information processing methods, and programs | |
JP7284196B2 (en) | Information processing device, information processing method, and program | |
CN112711524A (en) | Data testing method and device based on AB testing and computer storage medium | |
CN111090741B (en) | Data processing method, device and system | |
JP2019194793A (en) | Information processing apparatus and program | |
Mol et al. | A trustworthy model in E-commerce by mining feedback comments | |
CN114663200B (en) | Product recommendation method and device, electronic equipment and storage medium | |
JP2019003254A (en) | Category selection apparatus, advertisement distribution system, category selection method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230525 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7287992 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |