JP7231682B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JP7231682B2
JP7231682B2 JP2021140147A JP2021140147A JP7231682B2 JP 7231682 B2 JP7231682 B2 JP 7231682B2 JP 2021140147 A JP2021140147 A JP 2021140147A JP 2021140147 A JP2021140147 A JP 2021140147A JP 7231682 B2 JP7231682 B2 JP 7231682B2
Authority
JP
Japan
Prior art keywords
content
inappropriate
comment
determination
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021140147A
Other languages
English (en)
Other versions
JP2021193582A (ja
Inventor
隼人 小林
一真 村尾
毅司 増山
義宗 田渕
雅志 沼田
正幸 仲辻
拓実 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2021140147A priority Critical patent/JP7231682B2/ja
Publication of JP2021193582A publication Critical patent/JP2021193582A/ja
Application granted granted Critical
Publication of JP7231682B2 publication Critical patent/JP7231682B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法、およびプログラムに関する。
従来、各種コンテンツをユーザに提供する際に、第三者により投稿されたコンテンツに対する意見、感想等を示すコメントを、コンテンツに合わせて提供するサービスが行われている(例えば、特許文献1参照)。
特開2014-49094号公報
上記のような第三者により投稿されたコメントには、特定の人物に対する誹謗、中傷といった、一般に公開されることが適切でない内容が含まれる場合がある。このような特定の人物を誹謗、中傷するコメントは、公開されるべきものではなく、速やかに削除することが好ましい。このため、コンテンツの提供者は、このような不適切なコメントが含まれていないかを人手により監視し、削除する場合があった。
また、不適切な単語や表現が予め定義された固定のモデルを用いて、不適切なコメントを自動的に検知する方法が行われている。しかしながら、不適切なコメントに利用される表現は多様化、複雑化しており、単純なモデルでは検知できないものも多く存在している。例えば、ポジティブなコメント表現の一部に不適切な表現が組み込まれている場合や、隠語等により不適切な表現がなされている場合は、上記のようなモデルでは検知できない場合があった。また、このような不適切なコメントに利用される表現は次々と生み出されるものであるため、人手によりこれらすべてを監視することは容易ではなく、また、固定のモデルを用いた方法では対応が遅れてしまう場合があった。
本発明は、このような事情を考慮してなされたものであり、不適切コメントの検知を迅速且つ高精度で行うことが可能な情報処理装置、情報処理方法、およびプログラムを提供することを目的の一つとする。
本発明の一態様は、第1コンテンツに対して投稿されたコメントである第2コンテンツを閲覧したユーザによる、前記第2コンテンツが不適切であることを示し且つ前記第2コンテンツ内における不適切な表現の前記ユーザによる指定を含む報告を受け付ける受付部と、前記受付部により受け付けられた前記報告に基づいて、前記第2コンテンツが不適切であるか否かを判定する第1判定部と、を備え、前記第1判定部は、前記受付部により受け付けられた前記報告の件数が閾値以上である場合、前記第2コンテンツが不適切であると判定し、前記受付部は、前記第2コンテンツ内における不適切な内容の種類の前記ユーザによる指定をさらに含む前記報告を受け付け、前記第1判定部は、前記ユーザにより指定された前記第2コンテンツ内における不適切な表現および前記不適切な内容の種類に基づいて、前記第2コンテンツが不適切であるか否かを判定する、情報処理装置である。
本発明の一態様は、このような事情を考慮してなされたものであり、不適切コメントの検知を迅速且つ高精度で行うことが可能である。
実施形態におけるサービス提供装置1の利用環境を示す図である。 実施形態における第2判定部25によって行われる判定処理の一例を説明する図である。 実施形態におけるサービス提供装置1により生成されるニュースページP1の一例を示す図である。 実施形態におけるサービス提供装置1により生成される報告ページP2の一例を示す図である。 実施形態における報告情報記憶部28に記憶された報告情報28Aの一例を示す図である。 実施形態におけるサービス提供装置1による不適切コメントの第1判定処理の流れを示すフローチャートである。 実施形態におけるコンテンツ情報記憶部26に記憶されたコメント情報26Bの一例を示す図である。 実施形態におけるユーザ情報記憶部30に記憶されたユーザ情報30Aの一例を示す図である。 実施形態におけるコンテンツ情報記憶部26に記憶されたコメント情報26Bの一例を示す図である。 実施形態における学習データの一例を示す図である。 実施形態におけるサービス提供装置1による不適切コメントの第2判定処理の流れを示すフローチャートである。 実施形態におけるサービス提供装置1によるニュースページの生成処理の流れを示すフローチャートである。 実施形態におけるサービス提供装置1により生成されるニュースページP1の一例を示す図である。
以下、図面を参照し、本発明の情報処理装置、情報処理方法、およびプログラムの実施形態について説明する。情報処理装置は、一以上のプロセッサ(コンピュータ)により実現される。情報処理装置は、コンテンツに対するコメントを閲覧したユーザにより報告された内容に基づいて、このコメントが不適切なコメントであるか否かを判定する。情報処理装置は、このコメントが不適切なコメントであると判定した場合、このコメントの掲載順位を下げるか、あるいは掲載対象から除外する。
図1は、サービス提供装置1(情報処理装置)の利用環境を示す図である。サービス提供装置1は、ネットワークNWを介して、一以上の端末装置Tと接続され、このネットワークNWを介して互いに通信する。ネットワークNWは、例えば、WAN(Wide Area Network)やLAN(Local Area Network)、インターネット、専用回線、無線基地局、プロバイダなどを含む。
サービス提供装置1は、例えば、ウェブサーバまたはアプリサーバなどと称される。サービス提供装置1は、端末装置Tからの要求に応じて、ブラウザやアプリケーションプログラムによって再生されるコンテンツを提供する。
サービス提供装置1により提供されるコンテンツには、例えば、ブラウザによって参照されるウェブページの他、アプリケーションプログラムによって参照されるアプリページが含まれる。このようなウェブページまたはアプリページには、コメント投稿機能が実装された任意のページが含まれる。例えば、ウェブページには、ニュースサイト、オークションサイト、質問サイト等のページが含まれる。その他、コンテンツには、ミニブログ等のソーシャルネットワークサービス(SNS)において投稿されたメッセージ等も含まれる。以下においては、サービス提供装置1により提供されるコンテンツが、ブラウザによって参照されるウェブページであり、このウェブページがニュースサイトのページである場合を例に挙げて説明する。
サービス提供装置1により提供されるコンテンツは、メインのコンテンツ(第1コンテンツ)と共に、第三者により投稿されたこの第1コンテンツに対する意見、感想等を示すコメントが(第2コンテンツ)とを含むものである。サービス提供装置1は、コメントを閲覧したユーザにより報告された内容に基づいて、そのコメントが、特定の人物に対する誹謗、中傷といった一般に公開されることが適切でない内容が含まれるコメント(以下、「不適切コメント」とも言う)であるか否かを判定する。サービス提供装置1は、あるコンテンツに対して行われたコメントのうち、不適切コメントの掲載順位を下げるか、あるいは削除した上で、ユーザに提供する。
端末装置Tは、サービス提供装置1により提供されるニュースサイトのページを閲覧するユーザによって操作される。端末装置Tは、例えば、パーソナルコンピュータ、スマートフォンなどの携帯電話やタブレット端末、PDA(Personal Digital Assistant)などのコンピュータ装置である。端末装置Tは、ブラウザやアプリケーションプログラムなどのUA(User Agent)が動作して以下の機能を実現する。端末装置Tは、ユーザの操作に基づいて、サービス提供装置1により提供されるニュースサイトのページを要求するリクエストを送信し、リクエストに応じたニュースサイトのページに関する情報をサービス提供装置1から受信して表示する。
[サービス提供装置の構成]
サービス提供装置1は、例えば、通信部10(受付部)と、コンテンツ取得部12と、順位決定部14と、ページ生成部16と、報告情報処理部18(受付部)、第1判定部20と、ラベル付与部22と、学習部24と、第2判定部25と、コンテンツ情報記憶部26と、報告情報記憶部28と、ユーザ情報記憶部30と、モデル記憶部32とを備える。サービス提供装置1に含まれる各機能部は、複数の装置に分散されてもよい。例えば、第1判定部20、ラベル付与部22、および学習部24と、他の機能部とは別体の装置によって実現されてもよい。また、例えば、第1判定部20と、学習部24とは別体の装置によって実現されてもよい。
通信部10は、ネットワークNWを介して、端末装置T等と通信する。通信部10は、例えば、NIC等の通信インターフェースを含む。
コンテンツ取得部12は、ユーザにより要求されたニュースページの記事情報26A(第1コンテンツ)と、この記事情報26Aに対して投稿された1以上のコメントを含むコメント情報26B(第2コンテンツ)とを、コンテンツ情報記憶部26から取得する。
順位決定部14は、コンテンツ取得部12により取得された1以上のコメントの掲載順位を決定する。順位決定部14は、例えば、コメントのクリック率や、コメントに対する評価、コメントに含まれる表現等に基づいて、コメントの掲載順位を決定する。例えば、順位決定部14は、コメントのクリック率が高い順に、コメントの掲載順位を決定する。順位決定部14は、不適切コメントであると判定されたコメントについては、掲載順位を下げるか、あるいは掲載対象から除外するように、コメントの掲載順位を決定する。
ページ生成部16は、コンテンツ取得部12により取得された記事情報26Aと、コメント情報26Bに含まれる1以上のコメントとを含むニュースページを生成し、端末装置Tに送信する。このニュースページ内において、コメント情報26Bに含まれるコメントは、順位決定部14により決定された掲載順位で掲載される。
また、ページ生成部16は、ニュースページに含まれるコメントを閲覧したユーザによる不適切コメントを報告するリクエストを、通信部10を介して受信した場合、報告内容の入力を受け付ける報告ページを生成し、端末装置Tに送信する。
報告情報処理部18は、上記の報告ページに対してユーザにより入力された報告内容を取得し、報告情報記憶部28に記憶させる。
第1判定部20は、報告情報記憶部28に記憶された報告情報28Aに基づいて、コメント情報26Bに含まれるコメントの各々が不適切コメントであるか否かを判定する。
ラベル付与部22は、第1判定部20による判定結果に基づいて、コメント情報26Bに含まれるコメントの各々に対して、不適切なコメントを示すラベル(以下、「不適切ラベル」と呼ぶ)、不適切なコメントである可能性があることを示すラベル(以下、「準不適切ラベル」と呼ぶ)、および不適切なコメントではないことを示すラベル(以下、「適切ラベル」と呼ぶ)のいずれかを付与する。このラベルが付与されたコメントが、学習部24の学習に利用される学習データとなる。
学習部24は、ラベル付与部22によってラベルが付与されたデータ(コメントと、ラベルとの組)を学習データとして機械学習を行い、コメントが不適切コメントであるか否かを判定する判定モデル32Aを生成する。学習部24は、生成した判定モデル32Aを、モデル記憶部32に記憶させる。
第2判定部25は、学習部24により生成された判定モデル32Aを用いて、コメントが不適切コメントであるか否かを判定する。第2判定部25は、例えば、ニュースサイトのページのコメント入力欄に対してユーザにより新たなコメントが入力されると、このコメントが不適切コメントであるか否かを判定することができる。図2は、第2判定部25によって行われる判定処理の一例を説明する図である。第2判定部25は、入力情報としてユーザにより入力されたコメント情報を受け取る。次に、第2判定部25は、モデル記憶部32に記憶された判定モデル32Aを用いて、入力されたコメント情報に含まれるコメントが不適切コメントであるか否かを判定する。次に、第2判定部25は、出力情報として不適切コメントか否かに関する情報を出力する。出力情報は、例えば確率値(不適切な確率0.8等)でもよいし、正例(適切)、負例(不適切)などを示す情報であってもよい。
学習部24および第2判定部25は、例えば、サポートベクターマシンを用いて処理を行ってよい。また、学習部24および第2判定部25は、再帰型ニューラルネットワーク(Recurrent Neural Network:RNN)多層構造のニューラルネットワーク(Deep Neural Network:DNN)、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)などを用いたディープラーニング技術を採用してもよい。
コンテンツ情報記憶部26は、例えば、ニュース記事を示す記事情報26Aと、ニュース記事に対して投稿されたコメントを示すコメント情報26Bとを記憶する。記事情報26Aは、ニュース記事の配信担当者等の操作に基づいて適宜更新されるか、あるいは、日次等の所定のタイミングで実施されるバッチ処理により更新されてよい。コメント情報26Bは、ニュースページに対するユーザによるコメントの投稿処理に基づいて適宜更新されてよい。
報告情報記憶部28は、例えば、報告ページにおいてユーザにより入力された報告内容を示す報告情報28Aを記憶する。
ユーザ情報記憶部30は、例えば、ユーザごとの属性を示す情報を含むユーザ情報30Aを記憶する。モデル記憶部32は、学習部24により生成された判定モデル32Aを記憶する。
サービス提供装置1の各機能部は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。サービス提供装置1は、各機能部を実現するための複数のプロセッサを備えてもよい。また、これらの各機能部のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
サービス提供装置1の各記憶部は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ、またはこれらのうち複数が組み合わされたハイブリッド型記憶装置等により実現される。サービス提供装置1の各記憶部は、単一の装置により実現されてもよい。また、サービス提供装置1の各記憶部の一部または全部は、NASや外部のストレージサーバ等、サービス提供装置1がアクセス可能な外部装置であってもよい。
[報告情報の取得処理]
以下、サービス提供装置1の処理について説明する。まず、サービス提供装置1により実施される不適切コメントの報告情報の取得処理について説明する。図3は、サービス提供装置1により生成され、端末装置Tに表示されるニュースページP1の一例を示す図である。ニュースページP1は、例えば、ニュース記事が表示される記事領域R1と、この記事に対して投稿された第1のコメントが表示される第1コメント領域R2と、第2のコメントが表示される第2コメント領域R3とを含む。尚、ニュースページP1は、3つ以上のコメントを表示するための領域が設定されてもよい。
この第1コメント領域R2および第2コメント領域R3の各々には、コメントを閲覧したユーザによるコメントが不適切であることを示す報告を受け付けるボタンB1と、コメントに対するポジティブな評価の入力を受け付けるボタンB2(「良い」ボタン)と、コメントに対するネガティブな評価の入力を受け付けるボタンB3(「悪い」ボタン)とが含まれる。ボタンB2およびB3の各々には、コメントを閲覧した全ユーザがボタンを押下した合計回数があわせて表示されている。ユーザによるボタンB2またはB3の押下に基づいて、この合計回数が1つ増大される。
ユーザが端末装置Tを操作することにより、ボタンB1が押下されると、ユーザによる報告内容の入力を受け付ける報告ページが端末装置Tに表示される。図4は、図3における第2コメント領域R3のボタンB1が押下された場合に端末装置Tに表示される報告ページP2の一例を示す図である。報告ページP2は、不適切コメントの種類の指定を受け付ける。不適切コメントの種類には、例えば、「性差別」、「国籍差別」、「人種差別」等が含まれる。図4に示す例では、ユーザが不適切コメントの種類ごとに設定されたラジオボタンを選択することにより、種類の指定を受け付けるようになっている。図4に示す例では、「誹謗・中傷」がユーザにより指定された場合を示している。
また、報告ページP2は、コメント内における不適切な表現のユーザによる指定を受け付ける。図4に示す例では、コメント「Bの声が嫌い。二度と出るな。」における「声が嫌い」との表現がユーザにより指定された場合を示している。また、報告ページP2は、不適切な内容の詳細として、コメントに対するユーザの意見等のフリー入力(テキスト入力)を受け付ける。
ユーザが端末装置Tを操作することにより、上記のような報告内容を入力した後、「送信」ボタンを押下することで、サービス提供装置1に不適切コメントに関する情報を報告することが出来る。サービス提供装置1は、端末装置Tから受信した報告内容を報告情報記憶部28に記憶させる。
図5は、報告情報記憶部28に記憶された報告情報28Aの一例を示す図である。この報告情報28Aには、ニュース記事を識別する「記事ID」と、コメントを識別する「コメントID」と、不適切コメントの報告を行ったユーザ(報告者)を識別する「ユーザID」と、上記の報告ページP2においてユーザにより指定された不適切コメントの種類を示す「種類」と、ユーザにより指定された不適切な表現を示す「不適切な表現」と、ユーザにより入力された不適切な内容の詳細を示す「不適切な内容の詳細」とが関連付けされた1以上のデータが含まれる。以上により、サービス提供装置1は、不適切コメントに関する報告情報を収集することができる。
[不適切コメントの判定処理(第1例)]
以下、サービス提供装置1により実施される不適切コメントの判定処理の一例について説明する。図6は、サービス提供装置1による不適切コメントの判定処理の第1例である第1判定処理の流れを示すフローチャートである。この第1判定処理は、例えば、日ごと、週ごと等の所定のタイミングで実施されるバッチ処理により実施されてよい。
まず、サービス提供装置1は、コンテンツ情報記憶部26に記憶されたコメント情報26Bから1件のコメントを抽出し、抽出したコメントに対する報告情報を報告情報記憶部28から抽出する(S101)。
図7は、コンテンツ情報記憶部26に記憶されたコメント情報26Bの一例を示す図である。サービス提供装置1は、例えば、コメント情報26Bから、コメントID「C2」のコメント「Bの声が嫌い。二度と出るな。」を抽出し、このコメントID「C2」を検索キーとして、図5に示される報告情報28Aの中から報告情報を抽出する。
次に、サービス提供装置1は、抽出したコメントに対する報告件数が、所定の閾値以上であるか否かを判定する(S103)。ある程度の件数の報告がなされたコメントは、不適切コメントである可能性が高いことが想定される。このため、サービス提供装置1は、報告件数に基づいて、コメントが不適切コメントであるか否かの一次判断を行う。例えば、抽出したコメントに対する報告件数が、閾値(例えば、10件)以上であるか否かを判定する。
サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上ではないと判定した場合、このコメントが不適切コメントと断定することはできないため、このコメントに対して「適切ラベル」を付与する(S105)。
一方、サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上であると判定した場合、報告内容の信頼性を判定するための以下の処理を行う。あるコメントに対する報告が特定の偏った思想、見解等を持つ一部のユーザにより行われているような場合には、この報告の信頼性が高くない場合がある。例えば、政治的なニュース記事に対するコメントに対して、このコメントとは異なる思想、見解等を持つユーザにより報告がなされている場合には、報告件数は十分であっても、世間一般の判断では必ずしも不適切コメントとは言えない場合がある。このため、サービス提供装置1は、報告を行ったユーザの属性の分布を参照し、この属性に偏りがあるか否かを判定し(S107)、この判定結果(偏り度合い)に基づいて、抽出したコメントが不適切であるか否かを判定する。
サービス提供装置1は、ユーザの属性の分布に偏りが無いと判定した場合、コメントに対する報告内容の信頼性が高いと判定して、このコメントに対して「不適切ラベル」を付与する(S109)。一方、サービス提供装置1は、ユーザの属性の分布に偏りがあると判定した場合、コメントに対する報告内容の信頼性が低いと判定して、このコメントに対して「準不適切ラベル」を付与する(S111)。
図8は、ユーザ情報記憶部30に記憶されたユーザ情報30Aの一例を示す図である。サービス提供装置1は、例えば、抽出したコメントに対して報告を行ったユーザのユーザIDを図5に示される報告情報28Aから取得し、この取得したユーザIDを検索キーとして、このユーザの属性に関する情報をユーザ情報30Aから取得する。そして、サービス提供装置1は、取得したユーザの属性の分布に偏りがあるか否かを判定する。サービス提供装置1は、例えば、ユーザの属性が、「男性」、「30代」にのみ偏っているような場合にはユーザの属性の分布に偏りがあると判定し、コメントに対する報告内容の信頼性が低いと判定して、このコメントに対して「準不適切ラベル」を付与する。
尚、サービス提供装置1は、上記のユーザの属性の分布の偏りの判定を行う場合には、例えば、ユーザの属性に基づいてユーザベクトル(特徴情報)を生成するようにしてよい。ユーザベクトルは、ユーザの属性を要素に置き替えた疎ベクトルで表されるベクトルデータであってよい。あるいは、ユーザベクトルは、ウェブ上でのユーザの行動履歴や、ユーザの属性情報などをもとに生成されてもよい。サービス提供装置1は、このユーザベクトルのベクトル間距離に基づいて、取得したユーザの属性の分布に偏りがあるか否かを判定してよい。
尚、サービス提供装置1は、上記のようなユーザの属性の偏り度合いに基づいて、「準不適切ラベル」をさらに細かく設定してもよい。例えば、サービス提供装置1は、ユーザの属性の偏り度合いに基づいて、「準不適切ラベル」を0から1の数値で表すように設定してもよい。この数値で表された「準不適切ラベル」は、例えば、1に近いほど、不適切である可能性が高いことを示すように設定されてよい。
尚、サービス提供装置1は、コメント情報26Bに含まれる「良い」ボタンB2が押下された回数、「悪い」ボタンB3が押下された回数の情報を用いて、上記のラベルの判定を行ってもよい。例えば、サービス提供装置1は、「悪い」ボタンB3が押下された回数が所定の閾値以上であるコメントについては、「不適切ラベル」を付与してもよい。
サービス提供装置1は、上記の判定結果に関する情報をコメント情報26Bに記憶させてもよい。図9は、判定結果に関する情報が追加されたコメント情報26Bの一例を示す図である。図9に示す例では、ラベル「適切」、「不適切」、「準不適切」が各データに追加されている。
サービス提供装置1は、以上の処理(S101からS111)を、コメント情報26Bに含まれるコメントの各々に対して繰り返し実施する。
次に、サービス提供装置1は、ラベルが付与されたコメント(コメントと、ラベルとの組)を学習データとして機械学習を行い、判定モデル32Aを生成する(S113)。図10は、学習データの一例を示す図である。図10では、図9に示すコメント情報26Bから抽出された「コメント」と「ラベル」との組を学習データとする例を示している。サービス提供装置1は、このような学習データを用いて機械学習を行うことにより生成した判定モデル32Aを、モデル記憶部32に記憶させる。サービス提供装置1の第2判定部25は、ユーザにより新たなコメントが入力されると、上記において生成されてモデル記憶部32に記憶された判定モデル32Aを用いて、入力されたコメントが不適切コメントであるか否かを判定することができる。以上により、サービス提供装置1は本フローチャートの処理を終了する。
尚、サービス提供装置1は、不適切コメントと、不適切コメントの種類との関係を学習するようにしてもよい。また、サービス提供装置1は、コメント全文を学習データとするのではなく、ユーザにより指定された「不適切な表現」の箇所のみを学習データとするようにしてもよい。また、サービス提供装置1は、全てのコメントを学習データとするのではなく、報告内容の信頼性が高いコメントのみを学習データとするようにしてもよい。また、サービス提供装置1は、ニュース記事の本文も学習データに組み入れるようにしてもよい。
[不適切コメントの判定処理(第2例)]
以下、サービス提供装置1により実施される不適切コメントの判定処理の他の例について説明する。図11は、サービス提供装置1による不適切コメントの判定処理の第2例である第2判定処理の流れを示すフローチャートである。この第2判定処理は、例えば、日ごと、週ごと等の所定のタイミングで実施されるバッチ処理により実施されてよい。
まず、サービス提供装置1は、コンテンツ情報記憶部26に記憶されたコメント情報26Bから1件のコメントを抽出し、抽出したコメントに対する報告情報を報告情報記憶部28から抽出する(S201)。
次に、サービス提供装置1は、抽出したコメントに対する報告件数が、所定の閾値以上であるか否かを判定する(S203)。
サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上ではないと判定した場合、不適切コメントと断定することはできないため、このコメントに対して「適切ラベル」を付与する(S205)。
一方、サービス提供装置1は、抽出したコメントに対する報告件数が所定の閾値以上であると判定した場合、報告内容の信頼性を判定するための以下の処理を行う。不適切コメントはその種類に応じて、報告を行うユーザの属性の分布に傾向が表れることが想定される。例えば、「性差別(女性差別)」に関する不適切コメントに対する報告は、このコメントに対して嫌悪感を抱きやすい「女性」のユーザによりなされる傾向がある。このため、「性差別(女性差別)」に関する不適切コメントに対する報告を行ったユーザの属性の多くが「女性」である場合には、その報告の信頼性が高いことが想定される。一方、報告を行ったユーザの属性の多くが「男性」である場合には、その報告の信頼性が低いことが想定される。このため、サービス提供装置1は、不適切コメントの種類ごとに基準となる参照分布を予め定義し、実際に報告を行ったユーザの属性の分布がこの参照分布に類似しているか否かを判定し(S207)、この判定結果(類似性)に基づいて、抽出したコメントが不適切であるか否かを判定する。
尚、サービス提供装置1は、上記のユーザの属性の分布の類似性の判定を行う場合には、例えば、ユーザの属性に基づいてユーザベクトル(特徴情報)を生成し、このユーザベクトルのベクトル間距離に基づいて、取得したユーザの属性の分布が参照分布に類似しているか否かを判定してよい。
サービス提供装置1は、報告を行ったユーザの属性の分布が参照分布に類似していると判定した場合、コメントに対する報告内容の信頼性が高いと判定して、このコメントに対して「不適切ラベル」を付与する(S209)。一方、サービス提供装置1は、報告を行ったユーザの属性の分布がこの参照分布に類似していないと判定した場合、コメントに対する報告内容の信頼性が低いと判定して、このコメントに対して「準不適切ラベル」を付与する(S211)。
尚、サービス提供装置1は、上記のようなユーザの属性の分布の類似性に基づいて、「準不適切ラベル」をさらに細かく設定してもよい。例えば、サービス提供装置1は、ユーザの属性の分布の類似性に基づいて、「準不適切ラベル」を0から1の数値で表すように設定してもよい。この数値で表された「準不適切ラベル」は、例えば、1に近いほど、不適切である可能性が高いことを示すように設定されてよい。
サービス提供装置1は、以上の処理(S201からS211)を、コメント情報26Bに含まれるコメントの各々に対して繰り返し実施する。
次に、サービス提供装置1は、ラベルが付与されたコメント(コメントと、ラベルとの組)を学習データとして機械学習を行い、判定モデル32Aを生成する(S213)。サービス提供装置1は、生成した判定モデル32Aを、モデル記憶部32に記憶させる。以上により、サービス提供装置1は本フローチャートの処理を終了する。
[ニュースページの生成処理]
以下、サービス提供装置1により実施されるニュースページの生成処理の一例について説明する。図12は、サービス提供装置1によるニュースページの生成処理の流れを示すフローチャートである。このニュースページの生成処理は、端末装置Tからのニュースページのリクエストを受信するたびに実施される。
まず、サービス提供装置1は、ユーザの操作に基づいて端末装置Tにより送信されたニュースページを要求するリクエストを受信する(S301)。
次に、サービス提供装置1は、要求されたニュースページの記事情報と、この記事情報に対して投稿されたコメント情報とを、コンテンツ情報記憶部26から取得する(S303)。
次に、サービス提供装置1は、取得したコメントの掲載順位を仮決定する(S305)。サービス提供装置1は、例えば、コメントのクリック率や、コメントに対する評価、コメントに含まれる表現等に基づいて、コメントの掲載順位を仮決定する。例えば、サービス提供装置1は、コメントのクリック率が高い順に、コメントの掲載順位を仮決定する。
次に、サービス提供装置1は、掲載順位が仮決定されたコメントの中から1件のコメントを抽出し、抽出したコメントに不適切ラベルあるいは準不適切ラベルが付与されているか否かを判定する(S307)。サービス提供装置1は、抽出したコメントに不適切ラベルあるいは準不適切ラベルが付与されていると判定した場合、このコメントの掲載順位を下げるか、あるいは掲載対象から除外するように、コメントの掲載順位を決定する(S309)。一方、サービス提供装置1は、抽出したコメントに不適切ラベルあるいは準不適切ラベルが付与されていないと判定した場合、すなわち、抽出したコメントが適切コメントであると判定した場合、上記の掲載順位を下げる等の処理は行わない。
次に、サービス提供装置1は、全コメントに対する処理が完了した否かを判定する(S311)。サービス提供装置1は、全コメントに対する処理が完了していないと判定した場合、未処理のコメントを抽出し、上記の処理を繰り返す。一方、サービス提供装置1は、全コメントに対する処理が完了したと判定した場合、取得した記事情報と、コメント情報に含まれるコメントとを含むニュースページを生成し、端末装置Tに送信する(S313)。このニュースページにおいて、コメントは上記の掲載順位決定処理により決定された掲載順位で掲載される。
図13は、サービス提供装置1により生成されたニュースページP1の一例を示す図である。ニュースページP1に含まれるコメントに関して、不適切ラベルあるいは準不適切ラベルが付与されたコメントは、掲載順位が下位に設定されているか、あるいは掲載対象から除外されている。以上により、本フローチャートの処理を終了する。
[新たに投稿されたコメントの不適切判定処理]
以下、サービス提供装置1により実施される新たに投稿されたコメントの不適切判定処理の一例について説明する。サービス提供装置1は、例えば、ユーザによる端末装置Tの操作に基づいてニュースサイトのページのコメント入力欄に対して新たなコメントが投稿され、この新たなコメントを投稿するリクエストを受信した場合、モデル記憶部32に記憶された判定モデル32Aを用いて、この新たなコメントが不適切であるか否かを判定する。このような判定により、新たに投稿されたコメントが不適切であるか否かをリアルタイムで判定し、不適切であると判定されたコメントの掲載順位を下位に設定するか、あるいは掲載対象から除外するように制御することができる。
例えば、サービス提供装置1は、新たなコメントが不適切ではないと判定した場合、このコメントに対して「適切ラベル」を付与する。一方、サービス提供装置1は、投稿された新たなコメントが不適切であると判定した場合、このコメントに対して「不適切ラベル」を付与する。サービス提供装置1は、ラベルを付与したコメントを、コンテンツ情報記憶部26のコメント情報26Bに記憶させる。
尚、サービス提供装置1は、不適切であるか否かについて断定できないコメントに対しては、「準不適切ラベル」を付与してもよい。また、サービス提供装置1は、判定モデル32Aを用いた判定結果に基づいて、「準不適切ラベル」をさらに細かく設定してもよい。例えば、サービス提供装置1は、「準不適切ラベル」を0から1の数値で表すように設定してもよい。この数値で表された「準不適切ラベル」は、例えば、1に近いほど、不適切である可能性が高いことを示すように設定されてよい。
以上説明した実施形態のサービス提供装置1によれば、不適切コメントの検知を迅速且つ高精度で行うことが可能である。また、実施形態のサービス提供装置1によれば、不適切なコメントの掲載順位を下げる、あるいは掲載対象から除外することで、不適切なコメントが閲覧される機会を自動的に低減させることが可能である。
尚、サービス提供装置1は、コメントに基づいてコメントベクトル(特徴情報)を生成するようにしてよい。コメントベクトルは、分散表現化されたでベクトルデータであってよい。サービス提供装置1は、既知の不適切コメントのコメントベクトルと、新たなコメントのコメントベクトルとのベクトル間距離に基づいて、新たなコメントが、不適切コメントであるか否かを判定してよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1‥サービス提供装置、10‥通信部、12‥コンテンツ取得部、14‥順位決定部、16‥ページ生成部、18‥報告情報処理部、20‥第1判定部、22‥ラベル付与部、24‥学習部、25‥第2判定部、26‥コンテンツ情報記憶部、28‥報告情報記憶部、30‥ユーザ情報記憶部、32‥モデル記憶部、T‥端末装置、NW‥ネットワーク

Claims (4)

  1. 第1コンテンツに対して投稿されたコメントである第2コンテンツを閲覧したユーザによる、前記第2コンテンツが不適切であることを示し且つ前記第2コンテンツ内における不適切な表現の前記ユーザによる指定を含む報告を受け付ける受付部と、
    前記受付部により受け付けられた前記報告に基づいて、前記第2コンテンツが不適切であるか否かを判定する第1判定部と、
    前記第2コンテンツと、前記第1判定部による前記第2コンテンツが不適切であるか否かを示す判定結果を示すラベルと、の関係を学習して、判定モデルを生成する学習部と、
    前記学習部により生成された前記判定モデルを用いて、前記第2コンテンツが不適切であるか否かを判定する第2判定部と、
    を備え、
    前記第1判定部は、前記受付部により受け付けられた前記報告の件数が閾値以上であり且つ前記ユーザの属性の分布に偏りがある場合、前記第2コンテンツが不適切であると判定する、
    情報処理装置。
  2. 前記第1判定部により前記第2コンテンツが不適切であると判定された場合、前記第2コンテンツの掲載順位を下げるまたは掲載対象から除外するように、前記第2コンテンツの掲載順位を決定する順位決定部と、
    前記順位決定部により決定された掲載順位に基づいて、前記第1コンテンツと前記第2コンテンツとを含むウェブページを生成するページ生成部と、
    を備える、請求項1に記載の情報処理装置。
  3. コンピュータが、
    第1コンテンツに対して投稿されたコメントである第2コンテンツを閲覧したユーザによる、前記第2コンテンツが不適切であることを示し且つ前記第2コンテンツ内における不適切な表現の前記ユーザによる指定を含む報告を受け付け、
    受け付けられた前記報告に基づいて、前記第2コンテンツが不適切であるか否かを判定する第1判定を行い、
    前記第2コンテンツと、前記第1判定による前記第2コンテンツが不適切であるか否かを示す判定結果を示すラベルと、の関係を学習して、判定モデルを生成し、
    生成された前記判定モデルを用いて、前記第2コンテンツが不適切であるか否かを判定する第2判定を行う、
    情報処理方法であって、
    前記第1判定は、受け付けられた前記報告の件数が閾値以上であり且つ前記ユーザの属性の分布に偏りがある場合、前記第2コンテンツが不適切であると判定する、
    情報処理方法。
  4. コンピュータに、
    第1コンテンツに対して投稿されたコメントである第2コンテンツを閲覧したユーザによる、前記第2コンテンツが不適切であることを示し且つ前記第2コンテンツ内における不適切な表現の前記ユーザによる指定を含む報告を受け付けさせ、
    受け付けられた前記報告に基づいて、前記第2コンテンツが不適切であるか否かを判定する第1判定を行わせ、
    前記第2コンテンツと、前記第1判定による前記第2コンテンツが不適切であるか否かを示す判定結果を示すラベルと、の関係を学習させて、判定モデルを生成させ、
    生成された前記判定モデルを用いて、前記第2コンテンツが不適切であるか否かを判定する第2判定を行わせる、
    プログラムであって、
    前記第1判定は、受け付けられた前記報告の件数が閾値以上であり且つ前記ユーザの属性の分布に偏りがある場合、前記第2コンテンツが不適切であると判定する、
    プログラム。
JP2021140147A 2018-02-19 2021-08-30 情報処理装置、情報処理方法、およびプログラム Active JP7231682B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021140147A JP7231682B2 (ja) 2018-02-19 2021-08-30 情報処理装置、情報処理方法、およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018026741A JP6937707B2 (ja) 2018-02-19 2018-02-19 情報処理装置、情報処理方法、およびプログラム
JP2021140147A JP7231682B2 (ja) 2018-02-19 2021-08-30 情報処理装置、情報処理方法、およびプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018026741A Division JP6937707B2 (ja) 2018-02-19 2018-02-19 情報処理装置、情報処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2021193582A JP2021193582A (ja) 2021-12-23
JP7231682B2 true JP7231682B2 (ja) 2023-03-01

Family

ID=67773800

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018026741A Active JP6937707B2 (ja) 2018-02-19 2018-02-19 情報処理装置、情報処理方法、およびプログラム
JP2021140147A Active JP7231682B2 (ja) 2018-02-19 2021-08-30 情報処理装置、情報処理方法、およびプログラム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2018026741A Active JP6937707B2 (ja) 2018-02-19 2018-02-19 情報処理装置、情報処理方法、およびプログラム

Country Status (1)

Country Link
JP (2) JP6937707B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7431926B1 (ja) 2022-11-13 2024-02-15 倉内 馨子 インターネットを使用した炎上防止システム
JP7284336B1 (ja) * 2022-12-27 2023-05-30 ヤフー株式会社 コンテンツ提供装置、コンテンツ提供方法、およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151609A1 (en) 2011-12-09 2013-06-13 Yigal Dan Rubinstein Content Report Management in a Social Networking System
US20140172989A1 (en) 2012-12-14 2014-06-19 Yigal Dan Rubinstein Spam detection and prevention in a social networking system
US20150088897A1 (en) 2013-09-24 2015-03-26 Yahali Sherman Automatic removal of inappropriate content

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8856165B1 (en) * 2010-03-26 2014-10-07 Google Inc. Ranking of users who report abuse
JP6209335B2 (ja) * 2013-02-13 2017-10-04 ソニーネットワークコミュニケーションズ株式会社 情報処理装置および情報処理方法
JP6415183B2 (ja) * 2014-08-25 2018-10-31 キヤノン株式会社 サーバ装置、その制御方法及びプログラム
JP2016071569A (ja) * 2014-09-29 2016-05-09 グリー株式会社 プログラム、制御方法及び情報処理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130151609A1 (en) 2011-12-09 2013-06-13 Yigal Dan Rubinstein Content Report Management in a Social Networking System
US20140172989A1 (en) 2012-12-14 2014-06-19 Yigal Dan Rubinstein Spam detection and prevention in a social networking system
US20150088897A1 (en) 2013-09-24 2015-03-26 Yahali Sherman Automatic removal of inappropriate content

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小田桐 優理,コンテンツプラットホームにおける機械学習、データセット公開・モデル公開による産学の発展,電子情報通信学会誌,一般社団法人電子情報通信学会,2017年01月01日,第100巻 第1号,pp.25~31

Also Published As

Publication number Publication date
JP2019144722A (ja) 2019-08-29
JP6937707B2 (ja) 2021-09-22
JP2021193582A (ja) 2021-12-23

Similar Documents

Publication Publication Date Title
CN110046299B (zh) 用于自动地执行隐式消息搜索的计算机化系统和方法
US11438294B2 (en) System and method for auto-formatting messages based on learned message templates
JP6367289B2 (ja) オンライン・ソーシャル・ネットワークにおけるネットワーク指向の製品ロールアウト
US20190342415A1 (en) Event information push method, event information push apparatus, and storage medium
JP6145576B2 (ja) オンライン・ソーシャル・ネットワークにおける大規模ページ推薦
AU2011202431B2 (en) Methods, Apparatus, and Articles of Manufacture to Rank Users in an Online Social Network
JP7231682B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20150033141A1 (en) System and method for providing an interactive message inbox
CN109889430A (zh) 消息推送方法、装置、计算机设备及存储介质
EP2382761A1 (en) Predictive engine for interactive voice response system
US9596205B2 (en) System and method for mailing list identification and representation
US20190036862A1 (en) System and method for triaging in a message system on send flow
TW201205307A (en) Method, apparatus and computer program product for efficiently sharing information
US10621680B2 (en) System and method for alerting users to digital content objects of potential interest
WO2016169411A1 (zh) 一种信息处理方法及其设备
CN112241327A (zh) 分享信息处理方法、装置、存储介质与电子设备
US20230325947A1 (en) Automatic analysis of digital messaging content method and apparatus
US10719217B2 (en) Efficiently sharing user selected information with a set of determined recipients
CN105453081A (zh) 回答人员相关问题
US10560408B2 (en) Computerized system and method for selectively communicating HTML content to a user's inbox as a native message
Mubin et al. HCI research in the Middle East and North Africa: a bibliometric and socioeconomic overview
CN116955817A (zh) 内容推荐方法、装置、电子设备以及存储介质
US10645053B2 (en) Generating a new user base using attractive e-mail addresses
CN103365858B (zh) 基于一查询序列由多个源设备获取搜索结果的方法与设备
KR20050112882A (ko) 신뢰성 있는 컨텐츠를 제공하는 컨텐츠 검색 시스템 및 그방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230216

R150 Certificate of patent or registration of utility model

Ref document number: 7231682

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350