JP2022115160A - 情報処理装置、情報処理システム、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理システム、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2022115160A
JP2022115160A JP2021011645A JP2021011645A JP2022115160A JP 2022115160 A JP2022115160 A JP 2022115160A JP 2021011645 A JP2021011645 A JP 2021011645A JP 2021011645 A JP2021011645 A JP 2021011645A JP 2022115160 A JP2022115160 A JP 2022115160A
Authority
JP
Japan
Prior art keywords
news
information processing
text
title
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021011645A
Other languages
English (en)
Other versions
JP7287992B2 (ja
Inventor
篤慎 鎌田
Atsuchika Kamata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021011645A priority Critical patent/JP7287992B2/ja
Publication of JP2022115160A publication Critical patent/JP2022115160A/ja
Application granted granted Critical
Publication of JP7287992B2 publication Critical patent/JP7287992B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】配信されるニュースの内容をユーザに信頼させることができる情報処理装置、情報処理システム、情報処理方法、及びプログラムを提供する。【解決手段】情報処理装置は、ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集する収集部と、前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングする分析部と、前記クラスタリングの結果に基づいて、前記本文と前記タイトルの合致度を導出する導出部と、を備える。【選択図】図5

Description

本発明は、情報処理装置、情報処理システム、情報処理方法、及びプログラムに関する。
近年、ニュース配信業者がニュースを収集し、収集したニュースを配信するサービスが提供されている。ニュース配信業者が収集するニュースには、偽のニュース、いわゆるフェイクニュースが含まれることがある。フェイクニュースの伝達を阻止するために、従来、人手を介して発見したフェイクニュースの特徴を学習し、学習結果に基づきフェイクニュースを自動的に検知する技術がある(例えば、特許文献1参照)。
特開2020-113179号公報
しかし、多数あるニュースの中からフェイクニュースを見抜くことは簡単ではない。このため、ニュース配信業者により配信されるニュースには、信用度の低いニュースから信用度の高いニュースまで様々なニュースがある。このよう様々なニュース配信業者からニュースを配信されたユーザは、ニュースの内容を見ても一律的にその内容を信頼することが難しいという問題があった。
本発明は、このような事情を考慮してなされたものであり、配信されるニュースの内容をユーザに信頼させることができる情報処理装置、情報処理システム、情報処理方法、及びプログラムを提供することを目的の一つとする。
本発明の一態様は、ニュースの本文と、前記ニュースに付されたタイトルを収集する収集部と、前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングする分析部と、前記クラスタリングの結果に基づいて、前記本文と前記タイトルの合致度を求める分析部と、を備える、情報処理装置である。
本発明の一態様によれば、配信されるニュースの内容をユーザに信頼させることができる。
情報処理システムMにおいて、情報処理装置100が取り扱うニュースに関する情報の伝達の一例を示す図である。 ニュース配信サーバ2の構成の一例を示す図である。 端末装置10に表示されたトップページG1の一例である。 端末装置10に表示されたニュースページG2の一例を示す図である。 情報処理装置100の構成の一例を示す図である。 図6は、学習済モデル151の機能を概念的に示す図である。 情報処理システムMにより実行される処理の流れの一例を示すシーケンス図である。
以下、図面を参照し、本発明の情報処理装置、情報処理システム、情報処理方法、及びプログラムの実施形態について説明する。
[概要]
図1は、情報処理システムMにおいて、情報処理装置100が取り扱うニュースに関する情報の伝達の一例を示す図である。情報処理システムMは、例えば、一以上の投稿者端末1、ニュース配信サーバ2、端末装置10、及び情報処理装置100を含む。情報処理装置100は、ネットワークを介して複数の投稿者端末1、ニュース配信サーバ2、及び複数の端末装置10と接続される。ネットワークは、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、セルラー網などを含む。
投稿者は、投稿者端末1を用いて、世の中で起こる様々な事象に関するニュースを作成し、作成したニュースをニュース配信サーバ2に投稿する。投稿者端末1を用いてニュースを投稿する投稿者は、例えば、いわゆるメディアなどのニュースの投稿を業とする法人でもよいし、法人以外の自然人でもよい。ニュース配信サーバ2は、投稿者端末1により投稿されたニュースを端末装置10に配信する。ニュース配信サーバ2は、ニュース配信装置の一例である。
端末装置10は、例えば、ニュース配信サーバ2によりネットワークを介して配信されることによって提供されるニュースを表示する。端末装置10を占有するユーザは、端末装置10にニュースが表示されることにより、投稿者が投稿するニュースの内容を知ることができる。
情報処理装置100は、ニュース配信サーバ2に配信されたニュースを取得する。情報処理装置100は、取得したニュースのタイトルと本文の合致度を示す情報を導出し、取得したニュースがフェイクニュースである信頼度を判定する。情報処理装置100は、導出した合致度及び判定した信頼度の情報をニュース配信サーバ2に送信する。
[ニュース配信サーバ2]
ニュース配信サーバ2は、例えば、1以上のプロセッサにより実現される。図2は、ニュース配信サーバ2の構成の一例を示す図である。ニュース配信サーバ2は、例えば、通信部210と、処理部220と、を備える。通信部210は、例えば、NIC等の通信インターフェースを含む。通信部210は、ネットワークを介して、端末装置10や情報処理装置100などと通信する。
処理部220は、例えば、収集部221と、決定部222と、配信部223と、を備える。処理部220の各構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶部装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。上記の全ての構成要素が一つのプロセッサにより実現される必要はなく、適宜、複数のプロセッサによる分散処理などがなされてもよい。
収集部221は、複数の投稿者端末1により投稿される複数のニュースを収集する。収集部221は、収集したニュースをまとめて決定部222に通知する。決定部222は、収集部221により通知されたニュースの内容を選別したり、複数のニュースをジャンルに応じて分類したりする。
決定部222は、収集部221が分類した複数のニュースを情報処理装置100に送信する。決定部222は、収集部221が分類する前のニュースを情報処理装置100に送信してもよい。情報処理装置100は、ニュース配信サーバ2が送信したニュースの合致度を導出し、信頼度を判定してニュース配信サーバ2に送信する。ニュース配信サーバ2は、情報処理装置100により送信される信頼度の情報に基づいて、分類したニュースの優先順位を決定する。
決定部222は、分類したジャンルを示すメタ情報をニュースに付与する。決定部222は、情報処理装置により送信される合致度をニュースに付与する。決定部222は、ニュースの情報を、付与した優先順位、メタ情報、及び情報処理装置100により送信される合致度とともに配信部223に通知する。配信部223は、決定部222により通知されたニュースの情報を端末装置10に配信する。
[端末装置10]
端末装置10は、例えば、スマートフォンであり、画像を表示する表示部と入力部とを兼用するタッチパネルを備える。端末装置10は、スマートフォン以外の携帯電話やタブレット端末、ノート型あるいはデスクトップ型のパーソナルコンピュータ、PDA(Personal Digital Assistant)などの、少なくとも通信機能と表示機能を有するものであればよい。
端末装置10では、例えば、アプリケーションプログラムやブラウザなどのUA(User Agent)が動作する。端末装置10は、例えば、ニュースを表示させるUAが動作し、ニュース配信サーバ2にリクエストを送信することにより、ニュース配信サーバ2により配信される。そして、端末装置10は、配信されたニュースをタッチパネルに表示可能となる。
端末装置10のユーザは、ニュース配信サーバ2によるニュースの配信を受けたいときに、UAを起動(動作)させる。端末装置10のユーザは、UAが動作中である端末装置10を操作することにより、端末装置10に対して、ニュース配信リクエストをニュース配信サーバ2に向けて送信させる。
ニュース配信サーバ2は、端末装置10により送信されるニュース配信リクエストに応じて、ニュースコンテンツとしてのトップページを端末装置10に配信する。端末装置10は、ニュース配信サーバ2により配信されるトップページをタッチパネルに表示する。トップページは、ニュースのタイトルとサムネイルを含むフロント画像の一覧を含むコンテンツである。
図3は、端末装置10に表示されたトップページG1の一例である。図示するように、端末装置10は、トップページG1に、ジャンルG11と、フロント画像G12と、を表示する。ジャンルG11は、トップページG1の上方に表示される。ジャンルG11には、メタ情報としてニュースに付与されるジャンルの内容が含まれる。ジャンルG11は、例えば「主要」「エンタメ」「スポーツ」「国内」「経済」「国際」などのジャンルがタブに表示される。複数のジャンルG11から1つのジャンルG11の1つが選択されると、選択されたジャンルのタブが暗転し、選択されたジャンルのメタ情報が付与されたニュースのフロント画像G12が順に複数表示される。
フロント画像G12には、サムネイルG13とタイトルG14と合致度G15とが含まれる。フロント画像G12に含まれるタイトルG14には、文字数の制限が課されている。このため、フロント画像G12のタイトルG14は、ニュースの本文に含まれるニュースのタイトルを簡素化したタイトルであることがある。フロント画像G12は、ニュースに付与された表示優先度が高い順(ランキングが高い順)に上から表示される。
端末装置10は、フロント画像G12が操作されると、フロント画像G12が示すニュースに応じた指定リクエストをニュース配信サーバ2に送信する。ニュース配信サーバ2は、例えば、端末装置10により送信される指定リクエストを受信した場合に、指定リクエストに応じたニュースの本文を端末装置10に配信する。ニュース配信サーバ2によりニュースの本文を配信された端末装置10は、ニュース画像をタッチパネルに表示する。ニュース配信サーバ2は、トップページG1とともにニュースの本文を端末装置10に配信してもよい。
図4は、端末装置10に表示されたニュースページG2の一例を示す図である。図示するように、ニュースページG2には、拡大画像G21と、タイトルG22と、合致度G23と、フロント本文G24と、表示継続ボタンG25とが含まれる。拡大画像G21は、例えば、フロント画像G12に含まれるサムネイルG13を拡大した画像である。フロント画像G12では、狭い領域で複数のニュースを表示することから、サムネイルG13は小さな画像となる。ニュースページG2では、画像を表示する領域を広くとることができる。このため、ニュースページG2に含まれる拡大画像G21は、サムネイルG13より大きな画像とすることができる。
拡大画像G21の下にタイトルG22が表示される。タイトルG22は、例えば、フロント画像G12に含まれるタイトルG14と共通の内容である。フロント画像G12に含まれるタイトルG14は、表示スペースが狭い場合には、長文を入れることができないことがある。このため、フロント画像G12に含まれるタイトルG14は、タイトルG22を簡略化したタイトルとなる。
拡大画像G21とタイトルG22の間に合致度G23が表示される。合致度G23は、フロントページに表示される合致度と同一の合致度である。タイトルG22の下にフロント本文G24が表示される。フロント本文G24は、ニュースの本文のうち、最初の数行を示す文章である。フロント本文G24の下に表示継続ボタンG25が表示される。表示継続ボタンG25が操作されることにより、ニュースの本文が表示される。ニュースの本文が長い場合には、端末装置10の表示がスクロールされることにより、ニュースの全文が順次表示される。ここで表示されるニュースの本文にも、タイトル及び拡大画像が合わせて表示される。
[情報処理装置100の構成]
情報処理装置100は、例えば、1以上のプロセッサにより実現される。図5は、情報処理装置100の構成の一例を示す図である。情報処理装置100は、例えば、通信部110と、処理部120と、記憶部150と、を備える。通信部110は、例えば、NIC等の通信インターフェースを含む。通信部110は、ネットワークを介して、ニュース配信サーバ2などと通信する。
処理部120は、例えば、収集部121と、分析部122と、導出部123と、生成部124と、判定部125と、を備える。処理部120の各構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶部装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。上記の全ての構成要素が一つのプロセッサにより実現される必要はなく、適宜、複数のプロセッサによる分散処理などがなされてもよい。
情報処理装置100は、さらに、記憶部150を備える。記憶部150は、例えば、HDD、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部150には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他、学習済モデル151を記憶する。記憶部150は、情報処理装置100に付随する装置ではなく、ネットワークなどを介して情報処理装置100からアクセス可能なNAS(Network Attached Storage)であってもよい。
収集部121は、ニュース配信サーバ2により配信される複数のニュースを取得する。収集部121は、収集したニュースのそれぞれについて、ニュースのタイトル及び本文を抽出する。収集部121は、収集したニュースのタイトル及び本文を分析部122に通知する。
分析部122は、ニュースのタイトルと本文のそれぞれに対して、例えば自然言語処理を行い、タイトル及び本文に含まれるワードを抽出する。分析部122は、タイトル及び本文に含まれるワードの存在に基づいてタイトル及び本文をベクトル化してクラスタリングし、タイトルベクトル及び本文ベクトルを生成する。分析部122は、例えば、タイトルに含まれるワードに対応するベクトル要素を1、そうでないベクトル要素をゼロとした疎ベクトルであるタイトルベクトルを生成する。そして、分析部122は、タイトルベクトルのベクトル空間上の位置に基づいてタイトルをクラスタリングする。
分析部122は、同様に、例えば、本文に含まれるワードに対応するベクトル要素を1、そうでないベクトル要素をゼロとした疎ベクトルである本文ベクトルを生成する。そして、分析部122は、本文ベクトルのベクトル空間上の位置に基づいて本文をクラスタリングする。分析部122は、クラスタリングの結果として得られたタイトルベクトル及び本文ベクトルを導出部123に通知する。
分析部122は、クラスタリングとしてどのような手法を用いてもよい。分析部122は、例えば、単リンク法(最短距離法)、完全リンク法(最長距離法)、群平均法、Word法(最小分散法)、セントロイド法(重心法)、重み付き平均法、メジアン法、K平均法など公知の手法を用いてよい。
導出部123は、分析部122におけるクラスタリングの結果に基づいて、ニュースのタイトルと本文の合致度を導出する。合致度は、ニュースのタイトルと本文の内容が合致する割合を表す指標値である。例えば、本文の内容を的確かつ端的に表しているタイトルが付与されたニュースでは、合致度が高く導出され、大げさな内容のタイトルが付与されているが本文の内容はタイトルとはかけ離れた内容である場合には、合致度は低く導出される。
導出部123は、ニュースのタイトルと本文の合致度として、例えば、分析部122が生成したタイトルベクトルと本文ベクトルのコサイン類似度を算出する。導出部123は、算出したコサイン類似度をニュースのタイトルと本文の合致度として導出する。ニュースのタイトルと本文の合致度は、他の手法により導出されてもよい。導出部123は、導出した合致度をニュース配信サーバ2に送信する。
生成部124は、収集部121が抽出したニュースのタイトル及び本文に基づいて、学習済モデル151を生成する。生成部124は、例えば、収集部121が収集したニュースから抽出したニュースのタイトル及び本文を学習データとした機械学習を行って最適化された学習済モデルを生成する。
図6は、学習済モデル151の機能を概念的に示す図である。学習済モデル151は、例えば、ニュースのタイトル及び本文を入力データとし、ニュースがフェイクニュースであるか否かを出力データとする。学習済モデル151は、例えば、入力層と中間層と出力層とを有する。
入力層には、ニュースのタイトル及び本文のデータが入力される。出力層からは、ニュースがフェイクニュースであるか否かの結果が出力される。中間層は、例えば、入力層と出力層をつなぐ多層のニューラルネットワークを有する。学習済モデルとしては、例えば、トランスフォーマー、バートが用いられる。学習済モデルによる処理の前処理として、TF-IDF(Term FrequencyーInverse Document Frequency)等でワードを絞り込む処理が行われてもよい。
生成部124は、例えば、何らかの手法でニュースがフェイクニュースであると判定されたときのデータを正解データとし、学習済モデル151の元となる機械学習モデルのパラメータを調整する。生成部124は、入力層への入力データを学習データとし、出力層から出力されるべきデータを正解データとして、バックプロパゲーション等により中間層のパラメータを調整することで、機械学習モデルを最適化することにより、学習済モデル151を生成する。生成部124は、生成した学習済モデル151を記憶部150に格納する。
判定部125は、例えば、記憶部150から学習済モデル151を読み出す。判定部125は、収集部121が抽出したニュースのタイトル及び本文を入力データとして学習済モデル151に入力することで、収集部121が収集したニュースがフェイクニュースである信頼度を判定する。さらに、判定部125は、例えば、導出部123が導出した合致度が低いほど、信頼度を大きく判定する。判定部125は、判定した信頼度をニュース配信サーバ2に送信する。
[処理シーケンス]
次に、情報処理システムMによって実行される一連の処理について説明する。図7は、情報処理システムMにより実行される処理の流れの一例を示すシーケンス図である。まず、投稿者端末1は、作成したニュースをニュース配信サーバ2に投稿する(ステップS1)。投稿者端末1は複数あり、ニュース配信サーバ2には、複数の投稿者端末1からニュースが投稿される。それぞれの投稿者端末1は、ニュース配信サーバ2に対して複数のニュースを投稿する。
ニュース配信サーバ2は、投稿者端末1により投稿されたニュースを収集部221においてし、続いて、決定部222は、収集部221が収集したニュースを分類する(ステップS11)。ニュース配信サーバ2は、決定部222において分類したニュースを情報処理装置100に送信する(ステップS2)。
ニュースを送信された情報処理装置100は、収集部121においてニュースを収集し、収集したニュースのタイトルと本文を抽出する。続いて、分析部122は、収集部121が抽出したニュースのタイトルと本文をそれぞれクラスタリングして(ステップS21)、タイトルベクトル及び本文ベクトルを生成する。
続いて、導出部123は、分析部122が生成したタイトルベクトル及び本文ベクトルを用いて、ニュースのタイトルと本文の合致度を導出する(ステップS22)。続いて、生成部124は、ニュースのタイトル及び本文を学習データとした機械学習を行って最適化された学習済モデルを生成する(ステップS23)。
続いて、判定部125は、学習済モデル151を記憶部150から読み出す。判定部125は、収集部121が抽出したニュースのタイトル及び本文を入力データとして学習済モデル151に入力する。こうして、判定部125は、収集部121が収集したニュースがフェイクニュースである信頼度を判定する(ステップS24)。その後、情報処理装置100は、導出部123が導出した導出度及び判定部125が判定した信頼度をニュース配信サーバ2に送信する(ステップS3)。
ニュース配信サーバ2は、決定部222において、情報処理装置100により送信された信頼度に基づいて、ニュースの優先順位を決定する(ステップS12)。続いて、ニュース配信サーバ2は、複数のニュースについて、優先順位とともに分類したジャンルを示すメタ情報及びタイトルと本文の合致度を付与して端末装置10に配信する(ステップS4)。
ニュースの配信を受けた端末装置10は、配信されたニュースを表示する(ステップS31)。端末装置10は、ニュースを表示するにあたり、ニュースに付与されたメタ情報に基づいてニュースを分類する。さらに、端末装置10は、ニュースに付与された優先順位が高い順に上からニュースを並べて表示する。さらに、端末装置10は、ニュースに付与された合致度をニュースとともに表示する。こうして、情報処理システムMによって実行される一連の処理が終了する。
実施形態の情報処理装置100は、ニュースのタイトルと本文をクラスタリングしてタイトルベクトルと本文ベクトルを生成し、タイトルと本文の合致度を導出する。タイトルと本文の合致度が低いと、ニュースがフェイクニュースである可能性が高くなる傾向が見てとれる。このため、タイトルと本文の合致度を導出して、導出した合致度に応じてニュースを配信することにより、配信されるニュースの内容をユーザに信頼させることができる。
さらに、情報処理装置100は、導出した合致度に基づいて、ニュースがフェイクニュースである信頼度を判定し、合致度が低いほど信頼度を大きく判定する。フェイクニュースである可能性を明確に認識することができる。さらに、本文及びタイトルを学習データとしてニュースがフェイクニュースであると判定されたときのニュースを正解データとした機械学習により、前記ニュースがフェイクニュースであるか否かを判定する学習済モデルを用いて、信頼度を判定する。このため、フェイクニュースの信頼度を容易かつ精度よく判定することができる。
さらに、情報処理システムMは、端末装置10において、ニュースを表示する際に、ニュースの合致度を表示する。このため、端末装置10を占有するユーザは、合致度を確認することにより、ニュースの本文を読む価値があるか否かをおおよそ予想することができる。
[変形例]
上記の実施形態では、決定部222は、ニュースがフェイクニュースである信頼度に基づいて優先順位を決定する。これに対して、決定部222は、ニュースのタイトルと本文の合致度に基づいて優先順位を決定してもよい。この場合、決定部222は、合致度が高いほど優先順位を高く決定すればよい。さらに、決定部222は、ニュースがフェイクニュースである信頼度及びニュースのタイトルと本文の合致度に基づいて優先順位を決定してもよい。
上記の実施形態では、ニュース配信サーバ2は、ニュースに合致度を付与して端末装置10に配信する。これに対して、ニュース配信サーバ2は、合致度に代えてまたは加えて、ニュースに信頼度を付与して端末装置10に配信してもよい。この場合、端末装置10には、ニュースとともに、そのニュースがフェイクニュースである信頼度が表示される。ニュース配信サーバ2は、合致度とともに信頼度を付与したニュースを端末装置10に配信してもよい。
上記の実施形態では、判定部125は、学習済モデル151を用いてニュースがフェイクニュースである信頼度を判定する。これに対して、判定部125は、ニュースのタイトルと本文の合致度に基づいてニュースの信頼度を判定してもよい。判定部125は、例えば、ニュースのタイトルと本文の合致度の逆数をニュースがフェイクニュースである信頼度としてもよい。
上記の実施形態では、情報処理装置100が生成部124を備え、情報処理装置100において、学習済モデル151を生成する。これに対して、情報処理装置100は、生成部124を備えることなく、学習済モデル151を生成しないものでもよい。この場合、情報処理装置100は、別途生成される学習済モデル151を取得して、例えば記憶部150に記憶するようにすればよい。
フェイクニュースには、プロパガンダ、単純なデマ、悪意のある情報、ミスインフォメーション、ディスインフォメーション、マルインフォメーションなどの種類がある。情報処理装置100は、フェイクニュースである信頼度として、これらの種類のフェイクニュースごとに信頼度を導出してもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…投稿者端末
2…ニュース配信サーバ
10…端末装置
100…情報処理装置
110,210…通信部
120,220…処理部
121,221…収集部
122…分析部
123…導出部
124…生成部
125…判定部
150…記憶部
151…学習済モデル
222…決定部
223…配信部
G1…トップページ
G2…ニュースページ
G11…ジャンル
G12…フロント画像
G13…サムネイル
G14…タイトル
G15…合致度
G21…拡大画像
G22…タイトル
G23…合致度
G24…フロント本文
G25…表示継続ボタン
M…情報処理システム

Claims (14)

  1. ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集する収集部と、
    前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングする分析部と、
    前記クラスタリングの結果に基づいて、前記本文と前記タイトルの合致度を導出する導出部と、を備える、
    情報処理装置。
  2. 前記合致度に基づいて、前記ニュースがフェイクニュースである信頼度を判定する判定部と、をさらに備え、
    前記判定部は、前記合致度が低いほど、前記信頼度を大きく判定する、
    請求項1に記載の情報処理装置。
  3. 前記判定部は、前記タイトル及び前記本文を学習データとして、前記ニュースがフェイクニュースであると判定されたときのニュースを正解データとした機械学習により、前記ニュースがフェイクニュースであるか否かを判定する学習済モデルを用いて、前記信頼度を判定する、
    請求項2に記載の情報処理装置。
  4. 前記タイトル及び前記本文を学習データとして、前記ニュースがフェイクニュースであると判定されたときのニュースを正解データとした機械学習により、前記ニュースがフェイクニュースであるか否かを判定する学習済モデルを生成する生成部、をさらに備える、
    請求項2または3に記載の情報処理装置。
  5. 請求項1から4のうちいずれか1項に記載された情報処理装置と、
    ネットワークを介して提供されるニュースを収集し、収集したニュースを分類して端末装置に配信するニュース配信装置と、を備え、
    前記導出部は、前記合致度を前記ニュース配信装置に提供する、
    情報処理システム。
  6. 前記ニュース配信装置は、分類した前記ニュースの優先順位を決定する決定部を備え、
    前記決定部は、前記導出部により提供される前記合致度に基づいて、前記優先順位を決定する、
    請求項5に記載の情報処理システム。
  7. 前記決定部は、前記合致度が高いほど、前記優先順位を高く決定する、
    請求項6に記載の情報処理システム。
  8. 前記ニュース配信装置は、前記合致度を付した前記ニュースを配信する、
    請求項5から7のうちいずれか1項に記載の情報処理システム。
  9. 請求項2から4のうちいずれか1項に記載された情報処理装置と、
    ネットワークを介して提供されるニュースを収集し、収集したニュースを分類して端末装置に配信するニュース配信装置と、を備え、
    前記判定部は、前記信頼度を前記ニュース配信装置に提供する、
    情報処理システム。
  10. 前記ニュース配信装置は、分類した前記ニュースの優先順位を決定する決定部を備え、
    前記決定部は、前記情報処理装置により提供される前記信頼度に基づいて、前記優先順位を決定する、
    請求項9に記載の情報処理システム。
  11. 前記決定部は、前記信頼度が高いほど、前記優先順位を低く決定する、
    請求項10に記載の情報処理システム。
  12. 前記ニュース配信装置は、前記信頼度を付した前記ニュースを配信する、
    請求項9から11のうちいずれか1項に記載の情報処理システム。
  13. コンピュータが、
    ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集し、
    前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングし、
    前記クラスタリングの結果に基づいて、前記本文と前記タイトルの合致度を導出する、
    情報処理方法。
  14. コンピュータに、
    ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集させ、
    前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングさせ、
    前記クラスタリングの結果に基づいて、前記本文と前記タイトルの合致度を導出させる、
    プログラム。
JP2021011645A 2021-01-28 2021-01-28 情報処理装置、情報処理システム、情報処理方法、及びプログラム Active JP7287992B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021011645A JP7287992B2 (ja) 2021-01-28 2021-01-28 情報処理装置、情報処理システム、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021011645A JP7287992B2 (ja) 2021-01-28 2021-01-28 情報処理装置、情報処理システム、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2022115160A true JP2022115160A (ja) 2022-08-09
JP7287992B2 JP7287992B2 (ja) 2023-06-06

Family

ID=82747926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021011645A Active JP7287992B2 (ja) 2021-01-28 2021-01-28 情報処理装置、情報処理システム、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP7287992B2 (ja)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009282795A (ja) * 2008-05-23 2009-12-03 National Institute Of Information & Communication Technology 情報の重要度推定システム及び方法及びプログラム
CN105095368A (zh) * 2015-06-29 2015-11-25 北京金山安全软件有限公司 一种对新闻信息进行排序的方法及装置
JP2016105260A (ja) * 2014-12-01 2016-06-09 ビッグローブ株式会社 サイトまとめ方法、サイトまとめシステム、情報処理装置、及びプログラム
JP2017062612A (ja) * 2015-09-24 2017-03-30 株式会社日立製作所 規制検索装置、及び規制検索方法
JP2017117270A (ja) * 2015-12-25 2017-06-29 株式会社イード 情報処理装置及び方法、並びにプログラム
JP2019507425A (ja) * 2016-01-27 2019-03-14 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited サービス処理方法と、データ処理方法及び装置
JP2019164591A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
CN111061862A (zh) * 2019-12-16 2020-04-24 湖南大学 一种基于注意力机制生成摘要的方法
KR102107502B1 (ko) * 2018-12-13 2020-05-07 줌인터넷 주식회사 거짓된 기사 제목이 포함된 스팸뉴스 탐지를 위한 장치, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
JP2020173774A (ja) * 2019-04-08 2020-10-22 バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド ナレーションを生成するための方法、装置、サーバー、コンピュータ可読記憶媒体及びコンピュータプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009282795A (ja) * 2008-05-23 2009-12-03 National Institute Of Information & Communication Technology 情報の重要度推定システム及び方法及びプログラム
JP2016105260A (ja) * 2014-12-01 2016-06-09 ビッグローブ株式会社 サイトまとめ方法、サイトまとめシステム、情報処理装置、及びプログラム
CN105095368A (zh) * 2015-06-29 2015-11-25 北京金山安全软件有限公司 一种对新闻信息进行排序的方法及装置
JP2017062612A (ja) * 2015-09-24 2017-03-30 株式会社日立製作所 規制検索装置、及び規制検索方法
JP2017117270A (ja) * 2015-12-25 2017-06-29 株式会社イード 情報処理装置及び方法、並びにプログラム
JP2019507425A (ja) * 2016-01-27 2019-03-14 アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited サービス処理方法と、データ処理方法及び装置
JP2019164591A (ja) * 2018-03-20 2019-09-26 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
KR102107502B1 (ko) * 2018-12-13 2020-05-07 줌인터넷 주식회사 거짓된 기사 제목이 포함된 스팸뉴스 탐지를 위한 장치, 이를 위한 방법 및 이 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
JP2020173774A (ja) * 2019-04-08 2020-10-22 バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド ナレーションを生成するための方法、装置、サーバー、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111061862A (zh) * 2019-12-16 2020-04-24 湖南大学 一种基于注意力机制生成摘要的方法

Also Published As

Publication number Publication date
JP7287992B2 (ja) 2023-06-06

Similar Documents

Publication Publication Date Title
US11455465B2 (en) Book analysis and recommendation
CN106708817B (zh) 信息搜索方法及装置
WO2016086724A1 (zh) 一种确定候评项的质量信息的方法与装置
CN111259192A (zh) 音频推荐方法和装置
KR101735312B1 (ko) 소셜 미디어 분석을 기반으로 복합이슈를 탐지하기 위한 장치, 시스템 및 그 방법
US20150379610A1 (en) Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program
CN110909222A (zh) 基于聚类的用户画像建立方法、装置、介质及电子设备
US11010687B2 (en) Detecting abusive language using character N-gram features
JP2019197366A (ja) コンテンツ評価装置、コンテンツ評価方法、プログラム、および記録媒体
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
JP6434954B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US11983395B2 (en) Goal-based dynamic modifications to user interface content
JP7287992B2 (ja) 情報処理装置、情報処理システム、情報処理方法、及びプログラム
EP2915067A1 (en) Text analysis
CN107403352B (zh) 对根据产品评估确定的感兴趣主题进行优先级排序
JP2016177690A (ja) サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム
US20150170035A1 (en) Real time personalization and categorization of entities
WO2021200502A1 (ja) 情報処理装置及び情報処理方法
US20200155949A1 (en) Method for performing game by using activity count
JP7284196B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN110929175A (zh) 对用户评价进行评估的方法、装置、系统及介质
JP2019194793A (ja) 情報処理装置およびプログラム
CN116578693B (zh) 一种文本检索方法及装置
CN111090741B (zh) 一种数据处理方法、装置及系统
JP2019003254A (ja) カテゴリ選択装置、広告配信システム、カテゴリ選択方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230525

R150 Certificate of patent or registration of utility model

Ref document number: 7287992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350