JP7287992B2 - Information processing device, information processing system, information processing method, and program - Google Patents

Information processing device, information processing system, information processing method, and program Download PDF

Info

Publication number
JP7287992B2
JP7287992B2 JP2021011645A JP2021011645A JP7287992B2 JP 7287992 B2 JP7287992 B2 JP 7287992B2 JP 2021011645 A JP2021011645 A JP 2021011645A JP 2021011645 A JP2021011645 A JP 2021011645A JP 7287992 B2 JP7287992 B2 JP 7287992B2
Authority
JP
Japan
Prior art keywords
news
information processing
title
text
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021011645A
Other languages
Japanese (ja)
Other versions
JP2022115160A (en
Inventor
篤慎 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021011645A priority Critical patent/JP7287992B2/en
Publication of JP2022115160A publication Critical patent/JP2022115160A/en
Application granted granted Critical
Publication of JP7287992B2 publication Critical patent/JP7287992B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理装置、情報処理システム、情報処理方法、及びプログラムに関する。 The present invention relates to an information processing device, an information processing system, an information processing method, and a program.

近年、ニュース配信業者がニュースを収集し、収集したニュースを配信するサービスが提供されている。ニュース配信業者が収集するニュースには、偽のニュース、いわゆるフェイクニュースが含まれることがある。フェイクニュースの伝達を阻止するために、従来、人手を介して発見したフェイクニュースの特徴を学習し、学習結果に基づきフェイクニュースを自動的に検知する技術がある(例えば、特許文献1参照)。 In recent years, services have been provided in which news distributors collect news and distribute the collected news. News collected by news distributors may include fake news, so-called fake news. In order to prevent the transmission of fake news, conventionally, there is a technique of learning the characteristics of manually discovered fake news and automatically detecting fake news based on the learning result (see, for example, Patent Document 1).

特開2020-113179号公報Japanese Unexamined Patent Application Publication No. 2020-113179

しかし、多数あるニュースの中からフェイクニュースを見抜くことは簡単ではない。このため、ニュース配信業者により配信されるニュースには、信用度の低いニュースから信用度の高いニュースまで様々なニュースがある。このよう様々なニュース配信業者からニュースを配信されたユーザは、ニュースの内容を見ても一律的にその内容を信頼することが難しいという問題があった。 However, it is not easy to spot fake news from a large number of news. Therefore, the news distributed by news distributors includes various news, from low-credit news to high-credit news. There is a problem that it is difficult for users who have received news delivered from such various news distributors to uniformly trust the content of the news even if they see the content of the news.

本発明は、このような事情を考慮してなされたものであり、配信されるニュースの内容をユーザに信頼させることができる情報処理装置、情報処理システム、情報処理方法、及びプログラムを提供することを目的の一つとする。 The present invention has been made in consideration of such circumstances, and provides an information processing apparatus, an information processing system, an information processing method, and a program that enable users to trust the content of news that is distributed. is one of the purposes.

本発明の一態様は、ニュースの本文と、前記ニュースに付されたタイトルを収集する収集部と、前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングする分析部と、前記クラスタリングの結果に基づいて、前記本文と前記タイトルの合致度を求める分析部と、を備える、情報処理装置である。 According to one aspect of the present invention, a collection unit that collects texts of news and titles attached to the news, and an analysis unit that clusters the texts and the titles based on words included in the texts and the titles. and an analysis unit that obtains a degree of matching between the text and the title based on the result of the clustering.

本発明の一態様によれば、配信されるニュースの内容をユーザに信頼させることができる。 ADVANTAGE OF THE INVENTION According to one aspect of the present invention, users can be made to trust the content of news to be distributed.

情報処理システムMにおいて、情報処理装置100が取り扱うニュースに関する情報の伝達の一例を示す図である。2 is a diagram showing an example of transmission of information on news handled by an information processing apparatus 100 in an information processing system M. FIG. ニュース配信サーバ2の構成の一例を示す図である。2 is a diagram showing an example of the configuration of a news distribution server 2; FIG. 端末装置10に表示されたトップページG1の一例である。It is an example of the top page G1 displayed on the terminal device 10 . 端末装置10に表示されたニュースページG2の一例を示す図である。3 is a diagram showing an example of a news page G2 displayed on the terminal device 10; FIG. 情報処理装置100の構成の一例を示す図である。1 is a diagram illustrating an example of a configuration of an information processing device 100; FIG. 図6は、学習済モデル151の機能を概念的に示す図である。FIG. 6 is a diagram conceptually showing the functions of the trained model 151. As shown in FIG. 情報処理システムMにより実行される処理の流れの一例を示すシーケンス図である。4 is a sequence diagram showing an example of the flow of processing executed by the information processing system M; FIG.

以下、図面を参照し、本発明の情報処理装置、情報処理システム、情報処理方法、及びプログラムの実施形態について説明する。 Hereinafter, embodiments of an information processing apparatus, an information processing system, an information processing method, and a program according to the present invention will be described with reference to the drawings.

[概要]
図1は、情報処理システムMにおいて、情報処理装置100が取り扱うニュースに関する情報の伝達の一例を示す図である。情報処理システムMは、例えば、一以上の投稿者端末1、ニュース配信サーバ2、端末装置10、及び情報処理装置100を含む。情報処理装置100は、ネットワークを介して複数の投稿者端末1、ニュース配信サーバ2、及び複数の端末装置10と接続される。ネットワークは、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、セルラー網などを含む。
[overview]
FIG. 1 is a diagram showing an example of transmission of information on news handled by an information processing apparatus 100 in an information processing system M. As shown in FIG. The information processing system M includes, for example, one or more poster terminals 1 , news distribution servers 2 , terminal devices 10 , and information processing devices 100 . The information processing device 100 is connected to a plurality of poster terminals 1, a news distribution server 2, and a plurality of terminal devices 10 via a network. Networks include WANs (Wide Area Networks), LANs (Local Area Networks), the Internet, cellular networks, and the like.

投稿者は、投稿者端末1を用いて、世の中で起こる様々な事象に関するニュースを作成し、作成したニュースをニュース配信サーバ2に投稿する。投稿者端末1を用いてニュースを投稿する投稿者は、例えば、いわゆるメディアなどのニュースの投稿を業とする法人でもよいし、法人以外の自然人でもよい。ニュース配信サーバ2は、投稿者端末1により投稿されたニュースを端末装置10に配信する。ニュース配信サーバ2は、ニュース配信装置の一例である。 A contributor uses contributor terminal 1 to create news about various events occurring in the world, and posts the created news to news distribution server 2 . A contributor who posts news using contributor terminal 1 may be, for example, a legal entity that posts news, such as so-called media, or a natural person other than a legal entity. The news distribution server 2 distributes news posted by the poster terminal 1 to the terminal device 10 . The news distribution server 2 is an example of a news distribution device.

端末装置10は、例えば、ニュース配信サーバ2によりネットワークを介して配信されることによって提供されるニュースを表示する。端末装置10を占有するユーザは、端末装置10にニュースが表示されることにより、投稿者が投稿するニュースの内容を知ることができる。 The terminal device 10 displays, for example, news distributed by the news distribution server 2 via the network. The user who occupies the terminal device 10 can know the content of the news posted by the contributor by displaying the news on the terminal device 10 .

情報処理装置100は、ニュース配信サーバ2に配信されたニュースを取得する。情報処理装置100は、取得したニュースのタイトルと本文の合致度を示す情報を導出し、取得したニュースがフェイクニュースである信頼度を判定する。情報処理装置100は、導出した合致度及び判定した信頼度の情報をニュース配信サーバ2に送信する。 The information processing device 100 acquires news distributed to the news distribution server 2 . The information processing apparatus 100 derives information indicating the degree of matching between the title and text of the acquired news, and determines the degree of reliability that the acquired news is fake news. The information processing device 100 transmits information on the derived degree of matching and the determined degree of reliability to the news distribution server 2 .

[ニュース配信サーバ2]
ニュース配信サーバ2は、例えば、1以上のプロセッサにより実現される。図2は、ニュース配信サーバ2の構成の一例を示す図である。ニュース配信サーバ2は、例えば、通信部210と、処理部220と、を備える。通信部210は、例えば、NIC等の通信インターフェースを含む。通信部210は、ネットワークを介して、端末装置10や情報処理装置100などと通信する。
[News distribution server 2]
The news distribution server 2 is implemented by, for example, one or more processors. FIG. 2 is a diagram showing an example of the configuration of the news distribution server 2. As shown in FIG. The news distribution server 2 includes, for example, a communication section 210 and a processing section 220 . The communication unit 210 includes, for example, a communication interface such as NIC. The communication unit 210 communicates with the terminal device 10, the information processing device 100, and the like via a network.

処理部220は、例えば、収集部221と、決定部222と、配信部223と、を備える。処理部220の各構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶部装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。上記の全ての構成要素が一つのプロセッサにより実現される必要はなく、適宜、複数のプロセッサによる分散処理などがなされてもよい。 The processing unit 220 includes, for example, a collection unit 221, a determination unit 222, and a distribution unit 223. Each component of the processing unit 220 is realized by executing a program (software) by a hardware processor such as a CPU (Central Processing Unit). Some or all of these components are hardware (circuit part; circuitry) or by cooperation of software and hardware. The program may be stored in advance in a storage device (a storage device with a non-transitory storage medium) such as a HDD (Hard Disk Drive) or flash memory, or may be stored in a detachable storage device such as a DVD or CD-ROM. It may be stored in a storage medium (non-transitory storage medium) and installed in the storage device by mounting the storage medium in the drive device. All the above components need not be implemented by a single processor, and distributed processing by a plurality of processors may be performed as appropriate.

収集部221は、複数の投稿者端末1により投稿される複数のニュースを収集する。収集部221は、収集したニュースをまとめて決定部222に通知する。決定部222は、収集部221により通知されたニュースの内容を選別したり、複数のニュースをジャンルに応じて分類したりする。 The collection unit 221 collects multiple pieces of news posted by multiple poster terminals 1 . The collection unit 221 collectively notifies the determination unit 222 of the collected news. The determination unit 222 selects the content of the news notified by the collection unit 221, and classifies a plurality of news according to genre.

決定部222は、収集部221が分類した複数のニュースを情報処理装置100に送信する。決定部222は、収集部221が分類する前のニュースを情報処理装置100に送信してもよい。情報処理装置100は、ニュース配信サーバ2が送信したニュースの合致度を導出し、信頼度を判定してニュース配信サーバ2に送信する。ニュース配信サーバ2は、情報処理装置100により送信される信頼度の情報に基づいて、分類したニュースの優先順位を決定する。 The determination unit 222 transmits a plurality of pieces of news classified by the collection unit 221 to the information processing device 100 . The determining unit 222 may transmit the news before being classified by the collecting unit 221 to the information processing device 100 . The information processing device 100 derives the matching degree of the news transmitted by the news distribution server 2 , determines the degree of reliability, and transmits it to the news distribution server 2 . The news distribution server 2 determines the priority of the classified news based on the reliability information transmitted by the information processing device 100 .

決定部222は、分類したジャンルを示すメタ情報をニュースに付与する。決定部222は、情報処理装置により送信される合致度をニュースに付与する。決定部222は、ニュースの情報を、付与した優先順位、メタ情報、及び情報処理装置100により送信される合致度とともに配信部223に通知する。配信部223は、決定部222により通知されたニュースの情報を端末装置10に配信する。 The determining unit 222 adds meta information indicating the classified genre to the news. The determining unit 222 gives the degree of matching transmitted by the information processing device to the news. The determining unit 222 notifies the distributing unit 223 of the news information together with the assigned priority, meta information, and degree of matching transmitted by the information processing apparatus 100 . The distribution unit 223 distributes the news information notified by the determination unit 222 to the terminal device 10 .

[端末装置10]
端末装置10は、例えば、スマートフォンであり、画像を表示する表示部と入力部とを兼用するタッチパネルを備える。端末装置10は、スマートフォン以外の携帯電話やタブレット端末、ノート型あるいはデスクトップ型のパーソナルコンピュータ、PDA(Personal Digital Assistant)などの、少なくとも通信機能と表示機能を有するものであればよい。
[Terminal device 10]
The terminal device 10 is, for example, a smart phone, and includes a touch panel that serves both as a display section for displaying images and as an input section. The terminal device 10 may be any device that has at least a communication function and a display function, such as a mobile phone other than a smart phone, a tablet terminal, a notebook or desktop personal computer, or a PDA (Personal Digital Assistant).

端末装置10では、例えば、アプリケーションプログラムやブラウザなどのUA(User Agent)が動作する。端末装置10は、例えば、ニュースを表示させるUAが動作し、ニュース配信サーバ2にリクエストを送信することにより、ニュース配信サーバ2により配信される。そして、端末装置10は、配信されたニュースをタッチパネルに表示可能となる。 In the terminal device 10, for example, a UA (User Agent) such as an application program or a browser operates. The terminal device 10 is distributed by the news distribution server 2 by, for example, operating a UA that displays news and transmitting a request to the news distribution server 2 . Then, the terminal device 10 can display the delivered news on the touch panel.

端末装置10のユーザは、ニュース配信サーバ2によるニュースの配信を受けたいときに、UAを起動(動作)させる。端末装置10のユーザは、UAが動作中である端末装置10を操作することにより、端末装置10に対して、ニュース配信リクエストをニュース配信サーバ2に向けて送信させる。 When the user of the terminal device 10 wants to receive news delivered by the news delivery server 2, the user activates (operates) the UA. The user of the terminal device 10 causes the terminal device 10 to transmit a news distribution request to the news distribution server 2 by operating the terminal device 10 in which the UA is operating.

ニュース配信サーバ2は、端末装置10により送信されるニュース配信リクエストに応じて、ニュースコンテンツとしてのトップページを端末装置10に配信する。端末装置10は、ニュース配信サーバ2により配信されるトップページをタッチパネルに表示する。トップページは、ニュースのタイトルとサムネイルを含むフロント画像の一覧を含むコンテンツである。 The news distribution server 2 distributes a top page as news content to the terminal device 10 in response to a news distribution request transmitted from the terminal device 10 . The terminal device 10 displays the top page distributed by the news distribution server 2 on the touch panel. The top page is content that includes a list of front images including news titles and thumbnails.

図3は、端末装置10に表示されたトップページG1の一例である。図示するように、端末装置10は、トップページG1に、ジャンルG11と、フロント画像G12と、を表示する。ジャンルG11は、トップページG1の上方に表示される。ジャンルG11には、メタ情報としてニュースに付与されるジャンルの内容が含まれる。ジャンルG11は、例えば「主要」「エンタメ」「スポーツ」「国内」「経済」「国際」などのジャンルがタブに表示される。複数のジャンルG11から1つのジャンルG11の1つが選択されると、選択されたジャンルのタブが暗転し、選択されたジャンルのメタ情報が付与されたニュースのフロント画像G12が順に複数表示される。 FIG. 3 is an example of the top page G1 displayed on the terminal device 10. As shown in FIG. As illustrated, the terminal device 10 displays a genre G11 and a front image G12 on the top page G1. The genre G11 is displayed above the top page G1. The genre G11 includes the content of the genre given to the news as meta information. For the genre G11, genres such as "major", "entertainment", "sports", "domestic", "economy", and "international" are displayed in tabs. When one genre G11 is selected from a plurality of genres G11, the tab of the selected genre is darkened, and a plurality of news front images G12 to which the meta information of the selected genre is added are sequentially displayed.

フロント画像G12には、サムネイルG13とタイトルG14と合致度G15とが含まれる。フロント画像G12に含まれるタイトルG14には、文字数の制限が課されている。このため、フロント画像G12のタイトルG14は、ニュースの本文に含まれるニュースのタイトルを簡素化したタイトルであることがある。フロント画像G12は、ニュースに付与された表示優先度が高い順(ランキングが高い順)に上から表示される。 The front image G12 includes a thumbnail G13, a title G14, and a matching degree G15. The title G14 included in the front image G12 is restricted in the number of characters. Therefore, the title G14 of the front image G12 may be a simplified version of the news title included in the body of the news. The front image G12 is displayed from the top in the order of the display priority assigned to the news (high ranking order).

端末装置10は、フロント画像G12が操作されると、フロント画像G12が示すニュースに応じた指定リクエストをニュース配信サーバ2に送信する。ニュース配信サーバ2は、例えば、端末装置10により送信される指定リクエストを受信した場合に、指定リクエストに応じたニュースの本文を端末装置10に配信する。ニュース配信サーバ2によりニュースの本文を配信された端末装置10は、ニュース画像をタッチパネルに表示する。ニュース配信サーバ2は、トップページG1とともにニュースの本文を端末装置10に配信してもよい。 When the front image G12 is operated, the terminal device 10 transmits to the news distribution server 2 a designation request corresponding to the news indicated by the front image G12. For example, when receiving a specified request transmitted from the terminal device 10 , the news delivery server 2 delivers the body of the news corresponding to the specified request to the terminal device 10 . The terminal device 10 to which the text of the news has been distributed by the news distribution server 2 displays the news image on the touch panel. The news distribution server 2 may distribute the text of the news to the terminal device 10 together with the top page G1.

図4は、端末装置10に表示されたニュースページG2の一例を示す図である。図示するように、ニュースページG2には、拡大画像G21と、タイトルG22と、合致度G23と、フロント本文G24と、表示継続ボタンG25とが含まれる。拡大画像G21は、例えば、フロント画像G12に含まれるサムネイルG13を拡大した画像である。フロント画像G12では、狭い領域で複数のニュースを表示することから、サムネイルG13は小さな画像となる。ニュースページG2では、画像を表示する領域を広くとることができる。このため、ニュースページG2に含まれる拡大画像G21は、サムネイルG13より大きな画像とすることができる。 FIG. 4 is a diagram showing an example of the news page G2 displayed on the terminal device 10. As shown in FIG. As shown, the news page G2 includes an enlarged image G21, a title G22, a matching degree G23, a front text G24, and a continue display button G25. The enlarged image G21 is, for example, an enlarged image of the thumbnail G13 included in the front image G12. Since a plurality of pieces of news are displayed in a narrow area in the front image G12, the thumbnail G13 is a small image. The news page G2 can have a large area for displaying images. Therefore, the enlarged image G21 included in the news page G2 can be an image larger than the thumbnail G13.

拡大画像G21の下にタイトルG22が表示される。タイトルG22は、例えば、フロント画像G12に含まれるタイトルG14と共通の内容である。フロント画像G12に含まれるタイトルG14は、表示スペースが狭い場合には、長文を入れることができないことがある。このため、フロント画像G12に含まれるタイトルG14は、タイトルG22を簡略化したタイトルとなる。 A title G22 is displayed below the enlarged image G21. The title G22 has, for example, the same content as the title G14 included in the front image G12. The title G14 included in the front image G12 may not be able to contain a long sentence when the display space is narrow. Therefore, the title G14 included in the front image G12 is a simplified version of the title G22.

拡大画像G21とタイトルG22の間に合致度G23が表示される。合致度G23は、フロントページに表示される合致度と同一の合致度である。タイトルG22の下にフロント本文G24が表示される。フロント本文G24は、ニュースの本文のうち、最初の数行を示す文章である。フロント本文G24の下に表示継続ボタンG25が表示される。表示継続ボタンG25が操作されることにより、ニュースの本文が表示される。ニュースの本文が長い場合には、端末装置10の表示がスクロールされることにより、ニュースの全文が順次表示される。ここで表示されるニュースの本文にも、タイトル及び拡大画像が合わせて表示される。 A matching degree G23 is displayed between the enlarged image G21 and the title G22. The degree of matching G23 is the same degree of matching as displayed on the front page. A front text G24 is displayed below the title G22. The front text G24 is text indicating the first few lines of the news text. A display continuation button G25 is displayed below the front text G24. By operating the display continuation button G25, the text of the news is displayed. When the text of the news is long, the display of the terminal device 10 is scrolled to sequentially display the full text of the news. The title and enlarged image are also displayed together with the text of the news displayed here.

[情報処理装置100の構成]
情報処理装置100は、例えば、1以上のプロセッサにより実現される。図5は、情報処理装置100の構成の一例を示す図である。情報処理装置100は、例えば、通信部110と、処理部120と、記憶部150と、を備える。通信部110は、例えば、NIC等の通信インターフェースを含む。通信部110は、ネットワークを介して、ニュース配信サーバ2などと通信する。
[Configuration of information processing apparatus 100]
The information processing device 100 is implemented by, for example, one or more processors. FIG. 5 is a diagram showing an example of the configuration of the information processing apparatus 100. As shown in FIG. The information processing device 100 includes, for example, a communication unit 110, a processing unit 120, and a storage unit 150. The communication unit 110 includes, for example, a communication interface such as NIC. The communication unit 110 communicates with the news distribution server 2 and the like via a network.

処理部120は、例えば、収集部121と、分析部122と、導出部123と、生成部124と、判定部125と、を備える。処理部120の各構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶部装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。上記の全ての構成要素が一つのプロセッサにより実現される必要はなく、適宜、複数のプロセッサによる分散処理などがなされてもよい。 The processing unit 120 includes, for example, a collection unit 121, an analysis unit 122, a derivation unit 123, a generation unit 124, and a determination unit 125. Each component of the processing unit 120 is implemented by, for example, a hardware processor such as a CPU executing a program (software). Some or all of these components may be realized by hardware (including circuitry) such as LSI, ASIC, FPGA, GPU, etc., or by cooperation of software and hardware. good too. The program may be stored in advance in a storage device (a storage device with a non-transitory storage medium) such as a HDD (Hard Disk Drive) or flash memory, or may be stored in a detachable storage device such as a DVD or CD-ROM. It may be stored in a storage medium (non-transitory storage medium) and installed in the storage device by mounting the storage medium in the drive device. All the above components need not be implemented by a single processor, and distributed processing by a plurality of processors may be performed as appropriate.

情報処理装置100は、さらに、記憶部150を備える。記憶部150は、例えば、HDD、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部150には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他、学習済モデル151を記憶する。記憶部150は、情報処理装置100に付随する装置ではなく、ネットワークなどを介して情報処理装置100からアクセス可能なNAS(Network Attached Storage)であってもよい。 Information processing apparatus 100 further includes storage unit 150 . The storage unit 150 is implemented by, for example, a storage device such as an HDD, flash memory, EEPROM (Electrically Erasable Programmable Read Only Memory), ROM (Read Only Memory), RAM (Random Access Memory). The storage unit 150 stores a learned model 151 in addition to various programs such as firmware and application programs. The storage unit 150 may be a NAS (Network Attached Storage) that can be accessed from the information processing apparatus 100 via a network or the like instead of a device attached to the information processing apparatus 100 .

収集部121は、ニュース配信サーバ2により配信される複数のニュースを取得する。収集部121は、収集したニュースのそれぞれについて、ニュースのタイトル及び本文を抽出する。収集部121は、収集したニュースのタイトル及び本文を分析部122に通知する。 The collection unit 121 acquires multiple pieces of news distributed by the news distribution server 2 . The collection unit 121 extracts the title and text of each piece of news collected. The collection unit 121 notifies the analysis unit 122 of the titles and texts of the collected news.

分析部122は、ニュースのタイトルと本文のそれぞれに対して、例えば自然言語処理を行い、タイトル及び本文に含まれるワードを抽出する。分析部122は、タイトル及び本文に含まれるワードの存在に基づいてタイトル及び本文をベクトル化してクラスタリングし、タイトルベクトル及び本文ベクトルを生成する。分析部122は、例えば、タイトルに含まれるワードに対応するベクトル要素を1、そうでないベクトル要素をゼロとした疎ベクトルであるタイトルベクトルを生成する。そして、分析部122は、タイトルベクトルのベクトル空間上の位置に基づいてタイトルをクラスタリングする。 The analysis unit 122 performs, for example, natural language processing on each of the title and text of the news, and extracts words included in the title and text. The analysis unit 122 vectorizes and clusters the title and text based on the presence of words contained in the title and text to generate a title vector and text vector. The analysis unit 122 generates, for example, a title vector, which is a sparse vector in which vector elements corresponding to words included in the title are set to 1, and other vector elements are set to 0. Then, the analysis unit 122 clusters the titles based on the positions of the title vectors in the vector space.

分析部122は、同様に、例えば、本文に含まれるワードに対応するベクトル要素を1、そうでないベクトル要素をゼロとした疎ベクトルである本文ベクトルを生成する。そして、分析部122は、本文ベクトルのベクトル空間上の位置に基づいて本文をクラスタリングする。分析部122は、クラスタリングの結果として得られたタイトルベクトル及び本文ベクトルを導出部123に通知する。 The analysis unit 122 similarly generates a text vector, which is a sparse vector in which, for example, vector elements corresponding to words included in the text are set to 1, and vector elements that do not are set to zero. Then, the analysis unit 122 clusters the text based on the positions of the text vectors on the vector space. The analysis unit 122 notifies the derivation unit 123 of the title vector and text vector obtained as a result of clustering.

分析部122は、クラスタリングとしてどのような手法を用いてもよい。分析部122は、例えば、単リンク法(最短距離法)、完全リンク法(最長距離法)、群平均法、Word法(最小分散法)、セントロイド法(重心法)、重み付き平均法、メジアン法、K平均法など公知の手法を用いてよい。 The analysis unit 122 may use any method for clustering. The analysis unit 122 uses, for example, a single link method (shortest distance method), a complete link method (longest distance method), a group average method, a Word method (minimum variance method), a centroid method (center of gravity method), a weighted average method, You may use well-known methods, such as the median method and the K mean method.

導出部123は、分析部122におけるクラスタリングの結果に基づいて、ニュースのタイトルと本文の合致度を導出する。合致度は、ニュースのタイトルと本文の内容が合致する割合を表す指標値である。例えば、本文の内容を的確かつ端的に表しているタイトルが付与されたニュースでは、合致度が高く導出され、大げさな内容のタイトルが付与されているが本文の内容はタイトルとはかけ離れた内容である場合には、合致度は低く導出される。 The derivation unit 123 derives the matching degree between the news title and the text based on the clustering result of the analysis unit 122 . The degree of matching is an index value representing the rate at which the title of the news matches the content of the text. For example, news with a title that accurately and concisely describes the content of the main text is derived with a high degree of matching, and although the title is exaggerated, the content of the main text is far from the title. In some cases, the degree of matching is derived low.

導出部123は、ニュースのタイトルと本文の合致度として、例えば、分析部122が生成したタイトルベクトルと本文ベクトルのコサイン類似度を算出する。導出部123は、算出したコサイン類似度をニュースのタイトルと本文の合致度として導出する。ニュースのタイトルと本文の合致度は、他の手法により導出されてもよい。導出部123は、導出した合致度をニュース配信サーバ2に送信する。 The derivation unit 123 calculates, for example, the cosine similarity between the title vector and the text vector generated by the analysis unit 122 as the matching degree between the news title and text. The derivation unit 123 derives the calculated cosine similarity as the matching degree between the news title and text. The degree of matching between news titles and text may be derived by other methods. The derivation unit 123 transmits the derived degree of matching to the news distribution server 2 .

生成部124は、収集部121が抽出したニュースのタイトル及び本文に基づいて、学習済モデル151を生成する。生成部124は、例えば、収集部121が収集したニュースから抽出したニュースのタイトル及び本文を学習データとした機械学習を行って最適化された学習済モデルを生成する。 The generation unit 124 generates the learned model 151 based on the news titles and texts extracted by the collection unit 121 . The generation unit 124 generates an optimized trained model by performing machine learning using, for example, news titles and texts extracted from the news collected by the collection unit 121 as learning data.

図6は、学習済モデル151の機能を概念的に示す図である。学習済モデル151は、例えば、ニュースのタイトル及び本文を入力データとし、ニュースがフェイクニュースであるか否かを出力データとする。学習済モデル151は、例えば、入力層と中間層と出力層とを有する。 FIG. 6 is a diagram conceptually showing the functions of the trained model 151. As shown in FIG. The trained model 151 uses, for example, the title and text of news as input data, and output data as to whether or not the news is fake news. The trained model 151 has, for example, an input layer, an intermediate layer and an output layer.

入力層には、ニュースのタイトル及び本文のデータが入力される。出力層からは、ニュースがフェイクニュースであるか否かの結果が出力される。中間層は、例えば、入力層と出力層をつなぐ多層のニューラルネットワークを有する。学習済モデルとしては、例えば、トランスフォーマー、バートが用いられる。学習済モデルによる処理の前処理として、TF-IDF(Term FrequencyーInverse Document Frequency)等でワードを絞り込む処理が行われてもよい。 The input layer receives news title and text data. The output layer outputs a result indicating whether the news is fake news. The intermediate layer has, for example, a multilayer neural network connecting the input layer and the output layer. As a trained model, for example, Transformer and Vert are used. As pre-processing for processing by the trained model, processing for narrowing down words by TF-IDF (Term Frequency-Inverse Document Frequency) or the like may be performed.

生成部124は、例えば、何らかの手法でニュースがフェイクニュースであると判定されたときのデータを正解データとし、学習済モデル151の元となる機械学習モデルのパラメータを調整する。生成部124は、入力層への入力データを学習データとし、出力層から出力されるべきデータを正解データとして、バックプロパゲーション等により中間層のパラメータを調整することで、機械学習モデルを最適化することにより、学習済モデル151を生成する。生成部124は、生成した学習済モデル151を記憶部150に格納する。 For example, the generation unit 124 treats data obtained when news is determined to be fake news by some method as correct data, and adjusts the parameters of the machine learning model on which the trained model 151 is based. The generation unit 124 uses input data to the input layer as learning data and data to be output from the output layer as correct data, and optimizes the machine learning model by adjusting the parameters of the intermediate layer by back propagation or the like. By doing so, a trained model 151 is generated. The generation unit 124 stores the generated learned model 151 in the storage unit 150 .

判定部125は、例えば、記憶部150から学習済モデル151を読み出す。判定部125は、収集部121が抽出したニュースのタイトル及び本文を入力データとして学習済モデル151に入力することで、収集部121が収集したニュースがフェイクニュースである信頼度を判定する。さらに、判定部125は、例えば、導出部123が導出した合致度が低いほど、信頼度を大きく判定する。判定部125は、判定した信頼度をニュース配信サーバ2に送信する。 The determination unit 125 reads the learned model 151 from the storage unit 150, for example. The determination unit 125 inputs the news titles and texts extracted by the collection unit 121 to the learned model 151 as input data, thereby determining the reliability that the news collected by the collection unit 121 is fake news. Further, for example, the determination unit 125 determines the reliability to be higher as the degree of matching derived by the derivation unit 123 is lower. The determination unit 125 transmits the determined reliability to the news distribution server 2 .

[処理シーケンス]
次に、情報処理システムMによって実行される一連の処理について説明する。図7は、情報処理システムMにより実行される処理の流れの一例を示すシーケンス図である。まず、投稿者端末1は、作成したニュースをニュース配信サーバ2に投稿する(ステップS1)。投稿者端末1は複数あり、ニュース配信サーバ2には、複数の投稿者端末1からニュースが投稿される。それぞれの投稿者端末1は、ニュース配信サーバ2に対して複数のニュースを投稿する。
[Processing sequence]
Next, a series of processes executed by the information processing system M will be described. FIG. 7 is a sequence diagram showing an example of the flow of processing executed by the information processing system M. As shown in FIG. First, the poster terminal 1 posts the created news to the news distribution server 2 (step S1). There are a plurality of poster terminals 1, and news is posted to the news distribution server 2 from the plurality of poster terminals 1. - 特許庁Each contributor terminal 1 posts a plurality of news items to the news distribution server 2 .

ニュース配信サーバ2は、投稿者端末1により投稿されたニュースを収集部221においてし、続いて、決定部222は、収集部221が収集したニュースを分類する(ステップS11)。ニュース配信サーバ2は、決定部222において分類したニュースを情報処理装置100に送信する(ステップS2)。 The news distribution server 2 collects the news posted by the contributor terminal 1 in the collection unit 221, and then the determination unit 222 classifies the news collected by the collection unit 221 (step S11). The news distribution server 2 transmits the news classified by the determination unit 222 to the information processing device 100 (step S2).

ニュースを送信された情報処理装置100は、収集部121においてニュースを収集し、収集したニュースのタイトルと本文を抽出する。続いて、分析部122は、収集部121が抽出したニュースのタイトルと本文をそれぞれクラスタリングして(ステップS21)、タイトルベクトル及び本文ベクトルを生成する。 The information processing apparatus 100 to which the news has been transmitted collects the news in the collection unit 121 and extracts the title and text of the collected news. Subsequently, the analysis unit 122 clusters the news titles and texts extracted by the collection unit 121 (step S21) to generate title vectors and text vectors.

続いて、導出部123は、分析部122が生成したタイトルベクトル及び本文ベクトルを用いて、ニュースのタイトルと本文の合致度を導出する(ステップS22)。続いて、生成部124は、ニュースのタイトル及び本文を学習データとした機械学習を行って最適化された学習済モデルを生成する(ステップS23)。 Subsequently, the derivation unit 123 derives the matching degree between the news title and the text using the title vector and text vector generated by the analysis unit 122 (step S22). Subsequently, the generating unit 124 generates an optimized trained model by performing machine learning using the news title and text as learning data (step S23).

続いて、判定部125は、学習済モデル151を記憶部150から読み出す。判定部125は、収集部121が抽出したニュースのタイトル及び本文を入力データとして学習済モデル151に入力する。こうして、判定部125は、収集部121が収集したニュースがフェイクニュースである信頼度を判定する(ステップS24)。その後、情報処理装置100は、導出部123が導出した導出度及び判定部125が判定した信頼度をニュース配信サーバ2に送信する(ステップS3)。 Subsequently, the determination unit 125 reads the learned model 151 from the storage unit 150 . The determination unit 125 inputs the news titles and texts extracted by the collection unit 121 to the learned model 151 as input data. Thus, the determination unit 125 determines the reliability that the news collected by the collection unit 121 is fake news (step S24). After that, the information processing apparatus 100 transmits the degree of derivation derived by the derivation unit 123 and the degree of reliability determined by the determination unit 125 to the news distribution server 2 (step S3).

ニュース配信サーバ2は、決定部222において、情報処理装置100により送信された信頼度に基づいて、ニュースの優先順位を決定する(ステップS12)。続いて、ニュース配信サーバ2は、複数のニュースについて、優先順位とともに分類したジャンルを示すメタ情報及びタイトルと本文の合致度を付与して端末装置10に配信する(ステップS4)。 The determination unit 222 of the news distribution server 2 determines the priority of the news based on the reliability transmitted from the information processing device 100 (step S12). Subsequently, the news distribution server 2 distributes a plurality of news items to the terminal device 10 by adding meta information indicating the sorted genre together with the priority order and degree of matching between the title and the text (step S4).

ニュースの配信を受けた端末装置10は、配信されたニュースを表示する(ステップS31)。端末装置10は、ニュースを表示するにあたり、ニュースに付与されたメタ情報に基づいてニュースを分類する。さらに、端末装置10は、ニュースに付与された優先順位が高い順に上からニュースを並べて表示する。さらに、端末装置10は、ニュースに付与された合致度をニュースとともに表示する。こうして、情報処理システムMによって実行される一連の処理が終了する。 The terminal device 10 that receives the delivered news displays the delivered news (step S31). When displaying news, the terminal device 10 classifies the news based on the meta information attached to the news. Furthermore, the terminal device 10 arranges and displays news from the top in descending order of the priority assigned to the news. Furthermore, the terminal device 10 displays the degree of matching given to the news together with the news. Thus, a series of processes executed by the information processing system M ends.

実施形態の情報処理装置100は、ニュースのタイトルと本文をクラスタリングしてタイトルベクトルと本文ベクトルを生成し、タイトルと本文の合致度を導出する。タイトルと本文の合致度が低いと、ニュースがフェイクニュースである可能性が高くなる傾向が見てとれる。このため、タイトルと本文の合致度を導出して、導出した合致度に応じてニュースを配信することにより、配信されるニュースの内容をユーザに信頼させることができる。 The information processing apparatus 100 according to the embodiment clusters news titles and texts to generate title vectors and text vectors, and derives the degree of matching between the titles and texts. It can be seen that when the degree of matching between the title and the text is low, there is a tendency for the news to be more likely to be fake news. Therefore, by deriving the matching degree between the title and the text and distributing the news according to the derived matching degree, it is possible to make the user trust the contents of the distributed news.

さらに、情報処理装置100は、導出した合致度に基づいて、ニュースがフェイクニュースである信頼度を判定し、合致度が低いほど信頼度を大きく判定する。フェイクニュースである可能性を明確に認識することができる。さらに、本文及びタイトルを学習データとしてニュースがフェイクニュースであると判定されたときのニュースを正解データとした機械学習により、前記ニュースがフェイクニュースであるか否かを判定する学習済モデルを用いて、信頼度を判定する。このため、フェイクニュースの信頼度を容易かつ精度よく判定することができる。 Further, the information processing apparatus 100 determines the reliability that the news is fake news based on the derived degree of matching, and the lower the degree of matching, the higher the reliability. You can clearly recognize the possibility of fake news. Furthermore, using a learned model that determines whether the news is fake news by machine learning using the text and title as learning data and the news when the news is judged to be fake news as correct data. , to determine the reliability. Therefore, the reliability of fake news can be determined easily and accurately.

さらに、情報処理システムMは、端末装置10において、ニュースを表示する際に、ニュースの合致度を表示する。このため、端末装置10を占有するユーザは、合致度を確認することにより、ニュースの本文を読む価値があるか否かをおおよそ予想することができる。 Furthermore, the information processing system M displays the matching degree of the news when displaying the news on the terminal device 10 . Therefore, the user who occupies the terminal device 10 can roughly predict whether the text of the news is worth reading by checking the degree of matching.

[変形例]
上記の実施形態では、決定部222は、ニュースがフェイクニュースである信頼度に基づいて優先順位を決定する。これに対して、決定部222は、ニュースのタイトルと本文の合致度に基づいて優先順位を決定してもよい。この場合、決定部222は、合致度が高いほど優先順位を高く決定すればよい。さらに、決定部222は、ニュースがフェイクニュースである信頼度及びニュースのタイトルと本文の合致度に基づいて優先順位を決定してもよい。
[Modification]
In the above embodiment, the determination unit 222 determines the priority based on the reliability of the news being fake news. On the other hand, the determining unit 222 may determine the order of priority based on the degree of matching between the news title and text. In this case, the determination unit 222 may determine a higher priority as the degree of matching is higher. Furthermore, the determination unit 222 may determine the priority based on the degree of reliability that the news is fake news and the degree of matching between the title and text of the news.

上記の実施形態では、ニュース配信サーバ2は、ニュースに合致度を付与して端末装置10に配信する。これに対して、ニュース配信サーバ2は、合致度に代えてまたは加えて、ニュースに信頼度を付与して端末装置10に配信してもよい。この場合、端末装置10には、ニュースとともに、そのニュースがフェイクニュースである信頼度が表示される。ニュース配信サーバ2は、合致度とともに信頼度を付与したニュースを端末装置10に配信してもよい。 In the above-described embodiment, the news distribution server 2 distributes the news to the terminal device 10 after giving the degree of matching to the news. On the other hand, the news distribution server 2 may distribute the news to the terminal device 10 by adding reliability to the news instead of or in addition to the degree of matching. In this case, the reliability that the news is fake news is displayed on the terminal device 10 together with the news. The news distribution server 2 may distribute news to the terminal device 10 to which the degree of matching and the degree of reliability are assigned.

上記の実施形態では、判定部125は、学習済モデル151を用いてニュースがフェイクニュースである信頼度を判定する。これに対して、判定部125は、ニュースのタイトルと本文の合致度に基づいてニュースの信頼度を判定してもよい。判定部125は、例えば、ニュースのタイトルと本文の合致度の逆数をニュースがフェイクニュースである信頼度としてもよい。 In the above embodiment, the determination unit 125 uses the learned model 151 to determine the reliability that the news is fake news. On the other hand, the determination unit 125 may determine the reliability of news based on the degree of matching between the title and text of the news. The determination unit 125 may, for example, use the reciprocal of the degree of matching between the title and text of the news as the degree of reliability that the news is fake news.

上記の実施形態では、情報処理装置100が生成部124を備え、情報処理装置100において、学習済モデル151を生成する。これに対して、情報処理装置100は、生成部124を備えることなく、学習済モデル151を生成しないものでもよい。この場合、情報処理装置100は、別途生成される学習済モデル151を取得して、例えば記憶部150に記憶するようにすればよい。 In the above embodiment, the information processing device 100 includes the generating unit 124 and generates the trained model 151 in the information processing device 100 . On the other hand, the information processing apparatus 100 may not include the generation unit 124 and may not generate the trained model 151 . In this case, the information processing apparatus 100 acquires the separately generated learned model 151 and stores it in the storage unit 150, for example.

フェイクニュースには、プロパガンダ、単純なデマ、悪意のある情報、ミスインフォメーション、ディスインフォメーション、マルインフォメーションなどの種類がある。情報処理装置100は、フェイクニュースである信頼度として、これらの種類のフェイクニュースごとに信頼度を導出してもよい。 Fake news includes types such as propaganda, simple hoaxes, malicious information, misinformation, disinformation, and misinformation. The information processing apparatus 100 may derive the reliability of each of these types of fake news as the reliability of fake news.

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。 As described above, the mode for carrying out the present invention has been described using the embodiments, but the present invention is not limited to such embodiments at all, and various modifications and replacements can be made without departing from the scope of the present invention. can be added.

1…投稿者端末
2…ニュース配信サーバ
10…端末装置
100…情報処理装置
110,210…通信部
120,220…処理部
121,221…収集部
122…分析部
123…導出部
124…生成部
125…判定部
150…記憶部
151…学習済モデル
222…決定部
223…配信部
G1…トップページ
G2…ニュースページ
G11…ジャンル
G12…フロント画像
G13…サムネイル
G14…タイトル
G15…合致度
G21…拡大画像
G22…タイトル
G23…合致度
G24…フロント本文
G25…表示継続ボタン
M…情報処理システム
1... contributor terminal 2... news distribution server 10... terminal device 100... information processing apparatus 110, 210... communication units 120, 220... processing units 121, 221... collection unit 122... analysis unit 123... derivation unit 124... generation unit 125 ... determination section 150 ... storage section 151 ... learned model 222 ... determination section 223 ... delivery section G1 ... top page G2 ... news page G11 ... genre G12 ... front image G13 ... thumbnail G14 ... title G15 ... matching degree G21 ... enlarged image G22 ... Title G23 ... Matching degree G24 ... Front text G25 ... Display continuation button M ... Information processing system

Claims (14)

ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集する収集部と、
前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングする分析部と、
前記クラスタリングの結果に基づいて、ユーザの端末に前記本文と前記タイトルとともに表示させる前記本文と前記タイトルの合致度を導出する導出部と、を備える、
情報処理装置。
a collection unit that collects texts of news provided via a network and titles given to the news;
an analysis unit that clusters the text and the title based on words contained in the text and the title, respectively;
a derivation unit that derives a degree of matching between the text and the title to be displayed on a user terminal together with the text and the title, based on the clustering result;
Information processing equipment.
前記合致度に基づいて、前記ニュースがフェイクニュースである信頼度を判定する判定部と、をさらに備え、
前記判定部は、前記合致度が低いほど、前記信頼度を大きく判定する、
請求項1に記載の情報処理装置。
A determination unit that determines the reliability that the news is fake news based on the degree of matching,
The determination unit determines the reliability to be larger as the degree of matching is lower.
The information processing device according to claim 1 .
前記判定部は、前記タイトル及び前記本文を学習データとして、前記ニュースがフェイクニュースであると判定されたときのニュースを正解データとした機械学習により、前記ニュースがフェイクニュースであるか否かを判定する学習済モデルを用いて、前記信頼度を判定する、
請求項2に記載の情報処理装置。
The judging unit judges whether the news is fake news by machine learning using the title and the text as learning data and correct data when the news is judged to be fake news. Determining the reliability using a trained model that
The information processing apparatus according to claim 2.
前記タイトル及び前記本文を学習データとして、前記ニュースがフェイクニュースであると判定されたときのニュースを正解データとした機械学習により、前記ニュースがフェイクニュースであるか否かを判定する学習済モデルを生成する生成部、をさらに備える、
請求項2または3に記載の情報処理装置。
A trained model for determining whether or not the news is fake news by machine learning using the title and the text as learning data and the news when the news is determined to be fake news as correct data. a generator that generates
The information processing apparatus according to claim 2 or 3.
請求項1から4のうちいずれか1項に記載された情報処理装置と、
ネットワークを介して提供されるニュースを収集し、収集したニュースを分類して端末装置に配信するニュース配信装置と、を備え、
前記導出部は、前記合致度を前記ニュース配信装置に提供し、
前記ニュース配信装置は、前記ユーザの端末に前記合致度を前記タイトル及び前記本文とともに表示させる、
情報処理システム。
an information processing apparatus according to any one of claims 1 to 4;
a news distribution device that collects news provided via a network, classifies the collected news, and distributes it to a terminal device;
The derivation unit provides the degree of matching to the news distribution device,
The news distribution device causes the terminal of the user to display the degree of matching together with the title and the text.
Information processing system.
前記ニュース配信装置は、分類した前記ニュースの優先順位を決定する決定部を備え、
前記決定部は、前記導出部により提供される前記合致度に基づいて、前記優先順位を決定する、
請求項5に記載の情報処理システム。
The news distribution device includes a determination unit that determines the priority of the classified news,
The determination unit determines the priority based on the degree of matching provided by the derivation unit.
The information processing system according to claim 5.
前記決定部は、前記合致度が高いほど、前記優先順位を高く決定する、
請求項6に記載の情報処理システム。
The determination unit determines the priority higher as the degree of matching is higher.
The information processing system according to claim 6.
前記ニュース配信装置は、前記合致度を付した前記ニュースを配信する、
請求項5から7のうちいずれか1項に記載の情報処理システム。
The news distribution device distributes the news to which the degree of matching is attached.
The information processing system according to any one of claims 5 to 7.
請求項2から4のうちいずれか1項に記載された情報処理装置と、
ネットワークを介して提供されるニュースを収集し、収集したニュースを分類して端末装置に配信するニュース配信装置と、を備え、
前記判定部は、前記信頼度を前記ニュース配信装置に提供する、
情報処理システム。
an information processing apparatus according to any one of claims 2 to 4;
a news distribution device that collects news provided via a network, classifies the collected news, and distributes it to a terminal device;
The determination unit provides the reliability to the news distribution device,
Information processing system.
前記ニュース配信装置は、分類した前記ニュースの優先順位を決定する決定部を備え、
前記決定部は、前記情報処理装置により提供される前記信頼度に基づいて、前記優先順位を決定する、
請求項9に記載の情報処理システム。
The news distribution device includes a determination unit that determines the priority of the classified news,
The determination unit determines the priority based on the reliability provided by the information processing device.
The information processing system according to claim 9.
前記決定部は、前記信頼度が高いほど、前記優先順位を低く決定する、
請求項10に記載の情報処理システム。
The determination unit determines the priority to be lower as the reliability is higher.
The information processing system according to claim 10.
前記ニュース配信装置は、前記信頼度を付した前記ニュースを配信する、
請求項9から11のうちいずれか1項に記載の情報処理システム。
The news distribution device distributes the news with the reliability attached.
The information processing system according to any one of claims 9 to 11.
コンピュータが、
ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集し、
前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングし、
前記クラスタリングの結果に基づいて、ユーザの端末に前記本文と前記タイトルとともに表示させる前記本文と前記タイトルの合致度を導出する、
情報処理方法。
the computer
collecting the text of the news provided via the network and the title attached to the news,
clustering the text and the title based on words contained in the text and the title, respectively;
Based on the results of the clustering, derive the degree of matching between the text and the title to be displayed on the user's terminal together with the text and the title;
Information processing methods.
コンピュータに、
ネットワークを介して提供されるニュースの本文と、前記ニュースに付されたタイトルを収集させ、
前記本文と前記タイトルに含まれるワードに基づいて、前記本文と前記タイトルをそれぞれクラスタリングさせ、
前記クラスタリングの結果に基づいて、ユーザの端末に前記本文と前記タイトルとともに表示させる前記本文と前記タイトルの合致度を導出させる、
プログラム。
to the computer,
collecting texts of news provided via a network and titles given to the news;
Clustering the text and the title based on words contained in the text and the title, respectively;
Based on the result of the clustering, derive the degree of matching between the text and the title to be displayed together with the text and the title on the user's terminal ;
program.
JP2021011645A 2021-01-28 2021-01-28 Information processing device, information processing system, information processing method, and program Active JP7287992B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021011645A JP7287992B2 (en) 2021-01-28 2021-01-28 Information processing device, information processing system, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021011645A JP7287992B2 (en) 2021-01-28 2021-01-28 Information processing device, information processing system, information processing method, and program

Publications (2)

Publication Number Publication Date
JP2022115160A JP2022115160A (en) 2022-08-09
JP7287992B2 true JP7287992B2 (en) 2023-06-06

Family

ID=82747926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021011645A Active JP7287992B2 (en) 2021-01-28 2021-01-28 Information processing device, information processing system, information processing method, and program

Country Status (1)

Country Link
JP (1) JP7287992B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7564390B1 (en) 2024-02-02 2024-10-08 エヌ・ティ・ティ・コミュニケーションズ株式会社 Information processing device, information processing method, and information processing program

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009282795A (en) 2008-05-23 2009-12-03 National Institute Of Information & Communication Technology System, method, and program for estimating level of importance of information
CN105095368A (en) 2015-06-29 2015-11-25 北京金山安全软件有限公司 Method and device for sequencing news information
JP2016105260A (en) 2014-12-01 2016-06-09 ビッグローブ株式会社 Site consolidation method, site consolidation system, information processing device, and program
JP2017117270A (en) 2015-12-25 2017-06-29 株式会社イード Information processing device, method and program
JP2019164591A (en) 2018-03-20 2019-09-26 ヤフー株式会社 Information processing device, information processing method, and information processing program
JP2019507425A5 (en) 2017-01-17 2020-02-20
CN111061862A (en) 2019-12-16 2020-04-24 湖南大学 Method for generating abstract based on attention mechanism
JP2020173774A (en) 2019-04-08 2020-10-22 バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド Method, device, server, computer-readable storage medium, and computer program for generating narration

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017062612A (en) * 2015-09-24 2017-03-30 株式会社日立製作所 Regulation search device and regulation search method
CN107015976B (en) * 2016-01-27 2020-09-29 阿里巴巴集团控股有限公司 Service processing method, data processing method and device
KR102107502B1 (en) * 2018-12-13 2020-05-07 줌인터넷 주식회사 An apparatus for detecting spam news with false article titles, a method thereof and computer recordable medium storing program to perform the method

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009282795A (en) 2008-05-23 2009-12-03 National Institute Of Information & Communication Technology System, method, and program for estimating level of importance of information
JP2016105260A (en) 2014-12-01 2016-06-09 ビッグローブ株式会社 Site consolidation method, site consolidation system, information processing device, and program
CN105095368A (en) 2015-06-29 2015-11-25 北京金山安全软件有限公司 Method and device for sequencing news information
JP2017117270A (en) 2015-12-25 2017-06-29 株式会社イード Information processing device, method and program
JP2019507425A5 (en) 2017-01-17 2020-02-20
JP2019164591A (en) 2018-03-20 2019-09-26 ヤフー株式会社 Information processing device, information processing method, and information processing program
JP2020173774A (en) 2019-04-08 2020-10-22 バイドゥ ドットコム タイムス テクノロジー (ベイジン) カンパニー リミテッド Method, device, server, computer-readable storage medium, and computer program for generating narration
CN111061862A (en) 2019-12-16 2020-04-24 湖南大学 Method for generating abstract based on attention mechanism

Also Published As

Publication number Publication date
JP2022115160A (en) 2022-08-09

Similar Documents

Publication Publication Date Title
US11455465B2 (en) Book analysis and recommendation
CN106708817B (en) Information searching method and device
US9613268B2 (en) Processing of images during assessment of suitability of books for conversion to audio format
CN111259192B (en) Audio recommendation method and device
US11010687B2 (en) Detecting abusive language using character N-gram features
CN110334356A (en) Article matter method for determination of amount, article screening technique and corresponding device
US20150379610A1 (en) Recommendation information presentation device, recommendation information presentation method, and recommendation information presentation program
JP2011081728A (en) Device, method and program for extracting recommended content
KR20140119269A (en) Apparatus and system for detecting complex issues based on social media analysis and method thereof
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
JP6434954B2 (en) Information processing apparatus, information processing method, and program
JP7287992B2 (en) Information processing device, information processing system, information processing method, and program
JP2016177690A (en) Service recommendation device, service recommendation method, and service recommendation program
WO2016103519A1 (en) Data analysis system, data analysis method, and data analysis program
US11232325B2 (en) Data analysis system, method for controlling data analysis system, and recording medium
WO2021200502A1 (en) Information processing device and information processing method
US11007443B2 (en) Method for performing game by using activity count
JP6993955B2 (en) Information processing equipment, information processing methods, and programs
JP7284196B2 (en) Information processing device, information processing method, and program
CN112711524A (en) Data testing method and device based on AB testing and computer storage medium
CN111090741B (en) Data processing method, device and system
JP2019194793A (en) Information processing apparatus and program
Mol et al. A trustworthy model in E-commerce by mining feedback comments
CN114663200B (en) Product recommendation method and device, electronic equipment and storage medium
JP2019003254A (en) Category selection apparatus, advertisement distribution system, category selection method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230525

R150 Certificate of patent or registration of utility model

Ref document number: 7287992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350