JP2022147013A - 情報処理装置、制御方法、及びプログラム - Google Patents

情報処理装置、制御方法、及びプログラム Download PDF

Info

Publication number
JP2022147013A
JP2022147013A JP2021048091A JP2021048091A JP2022147013A JP 2022147013 A JP2022147013 A JP 2022147013A JP 2021048091 A JP2021048091 A JP 2021048091A JP 2021048091 A JP2021048091 A JP 2021048091A JP 2022147013 A JP2022147013 A JP 2022147013A
Authority
JP
Japan
Prior art keywords
information
user
evaluation
determination
review
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021048091A
Other languages
English (en)
Inventor
有里 上原
Yuri UEHARA
智也 鏑木
Tomoya Kaburagi
勇人 山野上
Yuto Yamanoue
慎也 加藤
Shinya Kato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2021048091A priority Critical patent/JP2022147013A/ja
Publication of JP2022147013A publication Critical patent/JP2022147013A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】不正なレビューを適切に判定する。【解決手段】ユーザにより入力される商品に対する評価情報と、前記ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、前記評価情報が不正であるか否かを判定する判定部を備える。【選択図】図3

Description

本発明は、情報処理装置、制御方法、及びプログラムに関する。
近年、EC(Electronic Commerce;電子商取引)サイトにおける商品の購入が浸透している。ユーザがECサイトを介して商品を購入する場合、実店舗とは異なり、実際に商品を手にとって確認することや、試用することは難しい。このため、ユーザは、商品を購入した第三者による、商品に対するレビューを参照し、商品を購入するか否かを検討する。
特開2019-095919号公報
しかしながら、売り主側が商品を不当に販売するために、レビューを不正に自作して投稿することや、商品を購入していない第三者に対してレビューの投稿を依頼する事案が発生している。このように投稿された不正なレビューが存在することにより、ECサイトの信頼性が低下し、ユーザと売り主との間の公正な取引が担保されない。ECサイトの信頼性の低下を防ぎ、公正な取引を担保するために、不正なレビューを検出し排除することが求められる。
本発明は、不正なレビューを適切に判定できる情報処理装置、制御方法、及びプログラムを提供することにある。
上記問題を解決するために、本発明の一態様は、ユーザにより入力される商品に対する評価情報と、前記ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、前記評価情報が不正であるか否かを判定する判定部を備えることを特徴とする情報処理装置である。
また、本発明の一態様は、上記の情報処理装置において、記判定部は、複数の判定要素について前記評価情報の不正度を示す各判定値を取得し、前記複数の判定要素それぞれの重みが適用された各判定値の合計に基づいて、前記評価情報が不正であるか否かを判定し、前記判定部による判定結果が、管理者による前記評価情報の判定結果と異なる場合に前記重みを更新する更新部、をさらに備えることを特徴とする。
また、本発明の一態様は、上記の情報処理装置において、前記ユーザ情報は、前記ユーザが購入した前記商品の購入履歴を含み、前記判定部は、前記購入履歴が前記評価情報の対象の前記商品を含まない場合、前記評価情報が不正であると判定することを特徴とする。
また、本発明の一態様は、上記の情報処理装置において、前記判定部は、複数の判定要素について前記評価情報が不正であるか否かを判定し、前記複数の判定要素は、前記評価情報に含まれる前記商品に対する評価文の言語解析、対象の前記商品の前記ユーザによる購入時期から前記評価情報の入力時期までの期間、前記対象の商品の登録時期から前記評価情報の前記入力時期までの期間、及び、前記ユーザ情報のうち、少なくとも二つの組み合わせを有することを特徴とする。
また、本発明の一態様は、上記の情報処理装置において、前記判定部は、前記複数の判定要素のうち前記評価文の言語解析に基づいて判定する場合、前記評価文と、当該評価情報の認定結果とを学習データとして用いた機械学習によって得られた学習済みモデルに基づいて、前記評価文を入力として前記評価情報が不正であるか否かを判定することを特徴とする。
また、本発明の一態様は、上記の情報処理装置において、前記ユーザ情報は、前記ユーザの属性情報、前記ユーザが購入した前記商品の購入履歴、前記ユーザが投稿した前記評価情報の履歴、及び前記評価情報の認定履歴の少なくともいずれかを含み、前記判定部は、前記複数の判定要素のうちユーザ情報に基づいて判定する場合、前記ユーザ情報と、当該ユーザ情報のユーザが入力した前記評価情報の認定結果とを学習データとして用いた機械学習によって得られた学習済みモデルに基づいて、前記ユーザ情報を入力として前記評価情報が不正であるか否かを判定することを特徴とする。
また、本発明の一態様は、上記の情報処理装置において、前記判定部は、前記各判定値の合計値と閾値との差分が所定範囲内である場合に、前記管理者による前記評価情報の判定を指示することを特徴とする。
また、本発明の一態様は、ユーザにより入力される商品に対する評価情報と、前記ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、前記評価情報が不正であるか否かを判定する制御方法である。
また、本発明の一態様は、コンピュータに、ユーザにより入力される商品に対する評価情報と、前記ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、前記評価情報が不正であるか否かを判定する処理を実行させることを特徴とするプログラムである。
本発明によれば、不正なレビューを適切に判定することができる。
本実施形態における情報処理システムの構成例を示す図である。 本実施形態における情報処理装置の機能ブロックの一例を示す図である。 本実施形態におけるレビューの認定処理を説明するフローチャートを示す図である。 重み情報DBの一例を示す図である。 本実施形態における重み更新処理を説明するフローチャートを示す図である。
以下、本発明の一実施形態による情報処理装置、情報処理装置の制御方法、及びプログラムについて、図面を参照して説明する。
図1は、本実施形態における情報処理システムの構成例を示す図である。図1に示す情報処理システムは、情報処理装置100と、端末装置300とを備える。情報処理装置100と端末装置300とは、インターネットなどのネットワークを介して接続される。
本実施形態の情報処理装置100は、EC(Electronic Commerce:電子商取引)サイトを提供するWebサーバである。Webサーバは、インターネット上にWebサイトを公開し、端末装置300のブラウザに対して情報の表示を提供する。ECサイトは、Webサイトを通じて商品を販売するサービスである。情報処理装置100は、インターネット上にECサイトを公開するとともに、ECサイトにアクセスした端末装置300による商品の購買指示を受け付ける。
端末装置300は、例えば、スマートフォン、タブレット型端末、パーソナルコンピュータなどの通信端末である。端末装置300は、ネットワークを介して情報処理装置100からECサイトの表示情報を受信し、ディスプレイに表示させる。端末装置300は、ユーザの操作に応答して、商品の購入指示を情報処理装置100に送信する。なお、図1は一つの端末装置300を例示しているが、この例に限定されるものではない。
情報処理装置100は、例えば、CPU(Central Processing Unit)10と、通信部11と、主記憶装置12と、補助記憶装置13とを備える。情報処理装置100において、CPU10と、通信部11と、主記憶装置12と、補助記憶装置13とは、バスを介した情報の入出力が可能である。情報処理装置100は、通信部11を介して、端末装置300と通信可能に接続される。補助記憶装置13は、例えば磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。
図2は、本実施形態における情報処理装置100の機能ブロックの一例を示す図である。情報処理装置100のCPU10は、例えば、主記憶装置12又は補助記憶装置13に記録されるプログラムを読み出して実行する。これにより、情報処理装置100は、主記憶装置12上にECサイト管理部110、及びAPI(Application programming interface)コンポーネントを備える装置として機能する。
情報処理装置100の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。
ECサイト管理部110は、販売管理部111、レビュー登録部112、及びフィードバック登録部113を有する。ECサイト管理部110は、販売管理データベース(DB)114、ユーザ情報データベース(DB)115、及びレビュー管理データベース(DB)116をさらに有する。
販売管理部111は、ECサイトにおける商品の販売サービスを管理する。販売管理部111は、端末装置300からの要求に応じて、販売管理DB114及びユーザ情報DB115を参照して、Webページの情報を生成し、端末装置300に表示させる。販売管理部111は、端末装置300から商品の購入指示を受信すると、商品の販売処理を実行し、実行結果を端末装置300に送信する。販売管理部111は、販売処理の実行結果を販売管理DB114及びユーザ情報DB115に反映させる。
レビュー登録部112は、ECサイトにおける商品に対するレビューの投稿を制御する。レビュー登録部112は、ECサイト上で、ユーザによる商品に対するレビューの投稿を受け付ける。レビュー登録部112は、端末装置300からレビューの投稿指示を受信すると、APIを使用して当該レビューがサクラによるレビューであるか否かを認定する。レビュー登録部112は、サクラによるレビューではないと認定されたレビューを、ECサイトに掲載させる。
レビューは、例えば、商品に対する評価値や評価文を含む評価情報である。評価値は、例えば、5段階等の相対評価で示された数値である。評価文は、商品に対する感想や、商品に対する評価を示す文章である。評価情報は、レビューの投稿日時を含んでもよい。サクラは、例えば、売り主又は売り主に依頼された人物であり、特定の商品の評判を演出する者を示す。サクラによるレビューは、商品の評判が良いことを不正に演出するための評価値や評価文を含む評価情報である。以下、サクラによるレビューを、不正なレビューとも称する。
フィードバック登録部113は、レビュー登録部112のサクラによるレビューであるか否かの認定結果と、ECサイトの管理者による認定結果とが異なる場合に、フィードバックを実行する。フィードバック登録部113は、フィードバックとして、APIを使用して、サクラによるレビューであるか否かの認定のために参照される重みを更新する。
販売管理DB114は、ECサイト上で販売される商品の情報を記憶するデータベースである。例えば、販売管理DB114は、各商品について、商品管理番号、商品名、商品の画像、定価、在庫数、ECサイトへの商品の登録日時等の情報を関連付けて記憶する。販売管理DB114は、商品を購入したユーザのID、購入日、及び、商品の発送日等を関連付けてさらに記憶する。
ユーザ情報DB115は、ECサイトを利用するユーザに関する情報(以下、ユーザ情報)を記憶するデータベースである。例えば、ユーザ情報DB115は、ユーザのID、属性情報、商品を購入した履歴を示す購入履歴、及びレビューの投稿履歴等を関連付けて記憶する。購入履歴は、過去に購入した商品のID、数量、購入日時、配送先の住所、購入頻度、購入を指示した端末装置300のIPアドレス等を含む。投稿履歴は、過去に投稿したレビューの内容、及び当該レビューがサクラによるレビューであるか否かの認定結果を含む。属性情報は、ユーザの性別、年齢、住所、職業等をさらに含んでもよい。
レビュー管理DB116は、ECサイト上で投稿されたレビューを格納するデータベースである。例えば、レビュー管理DB116は、レビューの対象の商品のID、投稿された評価値及び評価文、投稿者(ユーザ)のID、投稿日時等を関連付けて記憶する。レビュー管理DB116は、レビューがサクラによるレビューであるか否かを示す認定結果をさらに記憶する。
APIコンポーネント120は、履歴判定部121、複合判定部122、重み更新部123、及び重み情報データベース(DB)を有する。履歴判定部121及び複合判定部122は、ECサイト管理部110のレビュー登録部112によって呼び出されて実行される。重み更新部123は、ECサイト管理部110のフィードバック登録部113から呼び出されて実行される。
履歴判定部121は、レビューを投稿したユーザの商品の購入履歴を参照して、レビューがサクラによるレビューであるか否かを認定する。複合判定部122は、複数の判定要素に基づいて、レビューがサクラによるレビューであるか否かを認定する。本実施の形態における複数の判定要素は、例えば、言語解析、購入時期判定、商品登録時期判定、ユーザ情報判定を含む。複合判定部122は、言語解析部201、購入時期判定部202、商品登録時期判定部203、ユーザ情報判定部204、及び総合値判定部205を有する。以下、言語解析部201、購入時期判定部202、商品登録時期判定部203、及びユーザ情報判定部204を各判定部とも称する。
言語解析部201は、投稿されたレビューの評価文が日本語として正確性を解析し、日本語として不正確である度合いを示す判定値を算出する。言語解析部201は、例えば、評価文の文書の構成、評価文の長さ、他の評価文との類似性、及び評価文の日本語の用法の適切さ等の解析を行う。判定値は、例えば、数値「0」~「1」の間の値である。判定値は、値「1」に近づくほど、日本語として不正確であることを示し、値「0」に近づくほど、正確であることを示す。
購入時期判定部202は、投稿されたレビューの対象商品の購入時期からレビューの投稿時期までの期間を示す購入後期間に基づいて、値「0」又は値「1」を示す判定値を取得する。判定値が値「1」の場合、サクラによるレビューであることを示し、値「0」の場合、サクラによるレビューではないことを示す。商品登録時期判定部203は、投稿されたレビューの対象商品のECサイトへの登録時期からレビューの投稿時期までの期間を示す登録後期間に基づいて、数値「0」~「1」の間の判定値を取得する。判定値は、値「1」に近づくほど、サクラによるレビューである可能性が高いことを示し、値「0」に近づくほど、当該可能性が低いことを示す。
ユーザ情報判定部204は、ユーザ情報に基づいて、ユーザがサクラである可能性を示す判定値を算出する。判定値は、例えば、数値「0」~「1」の間の値である。判定値は、値「1」に近づくほど、ユーザがサクラである可能性が高いことを示し、値「0」に近づくほど、当該可能性が低いことを示す。
総合値判定部205は、各判定部が算出した判定値に基づいて、総合判定値を算出する。総合値判定部205は、重み情報DB124を参照して各判定部に設定された重みを取得し、判定値に重みを適用した各重み付判定値を算出する。総合値判定部205は、各判定部の重み付判定値を合算し、総合判定値を算出する。総合値判定部205は、算出した総合判定値と閾値との比較に基づいて、投稿されたレビューがサクラによるレビューであるか否かを認定する。
重み更新部123は、フィードバック登録部113による呼び出しに応じて、重み情報DB124に記憶される各判定部に対応する重みを更新する。本実施の形態において、例えば、重みは、各判定部の重みの合計値が値「1.0」になるような値に設定される。重み情報DB124の一例については、図4で後述する。
図3は、本実施形態におけるレビューの認定処理を説明するフローチャートである。端末装置300は、ブラウザに表示されるECサイト上で、ユーザによるレビューの投稿を受ける。レビューが投稿されると、端末装置300は、レビューの投稿依頼を情報処理装置100に送信する。レビューの投稿依頼の受信に応じて、情報処理装置100のレビュー登録部112は、投稿されたレビューの評価文、及び投稿者(ユーザ)のユーザ情報をパラメータとして入力し、APIを呼び出す。これにより、図3に示す認定処理が実行される。
APIコンポーネント120の履歴判定部121は、レビューを投稿したユーザの商品の購入履歴を参照して、レビューがサクラによるレビューであるか否かを認定する(ステップS101)。履歴判定部121は、入力情報からユーザの商品の購入履歴を取得し、レビューの対象の商品の購入履歴が含まれるか否かを判定する。対象商品の購入履歴が含まれていない場合(ステップS101のNo)、履歴判定部121は、投稿されたレビューがサクラによるレビューであると認定する(ステップS110)。履歴判定部121は、サクラによるレビューであることを示す認定結果を、APIの呼び出し元のレビュー登録部112に出力する。
一方、対象商品の購入履歴が含まれている場合(ステップS101のYes)、APIコンポーネント120の複合判定部122は、複数の判定要素に基づいて、レビューがサクラによるレビューであるか否かを認定する。ユーザは、売り主から委託を受けて、商品を購入してレビューを投稿している場合がある。このため、複合判定部122は、対象商品の購入履歴が含まれる場合、ステップS102~S109によって、レビューがサクラによるレビューであるか否かをさらに判定する。ステップS102~S105の処理は、並列して実行されてもよいし、所定の順番で実行されてもよい。
複合判定部122の言語解析部201は、投稿されたレビューの評価文が日本語として正確か否かを解析し、日本語として不正確である度合いを示す判定値を取得する(ステップS102)。この場合、判定値は、数値「0」~「1」の間の値である。判定値は、日本語として正確な文章である程、値「0」に近い値を示し、不正確である程、値「1」に近い値を示す。言語解析部201は、複数の項目を解析して判定値を取得する。複数の解析項目は、評価文の文書構成、評価文の長さ、他のレビューの評価文との類似性、及び評価文における日本語の適切さ等を含む。
評価文の文書構成は、例えば、評価文を形態素解析及び構文解析した場合における、品詞の係り受けや助詞の用い方等を示す。評価文の長さは、例えば、評価文の全体の文字数、評価文が含む各文の文字数等を示す。他のレビューの評価文との類似性は、日本語として不正確な文章との類似度を示す。類似度は、例えば、文体や単語等の一致度合いである。日本語の適切さは、例えば、単語の用い方や送り仮名の使い方等の日本語としての適切さを示す。
言語解析部201は、一例として、教師データを学習した学習済みのモデルを用いて、投稿された評価文を入力とし、日本語として不正確である度合いを示す判定値を算出する。教師データは、例えば、複数の評価文、及び当該評価文が日本語として不正確であるか否かを示すラベルを含む。モデルの生成に当たり、例えば、目的変数として日本語として不正確であるか否かが設定され、説明変数として上述の複数の解析項目のうち少なくとも二つが設定される。例えば、決定木分析等の手法にしたがって、日本語として不正確である度合いを導出可能なモデルが生成される。
このように、言語解析部201は、評価文の文章の傾向に基づいて、日本語として不正確である度合いを示す判定値を取得する。これにより、例えば、助詞の使用方法の傾向や、文章の長さ等に基づいて、日本語として不正確であるか否かを推定することができる。また、係り受けの用い方や、使用頻度の高い単語に注目することにより、日本語として不正確である度合いを推定することができる。
言語解析部201は、他の分析方法にしたがってモデルを生成してもよい。または、言語解析部201は、教師無し学習にしたがって、モデルを生成してもよい。言語解析部201が用いる解析項目の例は、上述した例に限定されるものではない。言語解析部201は、評価文の言語や、誤記の内容等を説明変数として用いて、モデルを生成してもよい。
購入時期判定部202は、購入後期間に基づいて、値「0」又は値「1」を示す判定値を取得する(ステップS103)。購入時期判定部202は、購入後期間として、レビューの対象商品の購入時期からレビューの投稿時期までの期間を取得する。購入時期は、ECサイト上でユーザが対象の商品を購入した日時である。レビューの投稿時期は、ECサイト上でユーザが対象の商品に対するレビューを投稿した日時である。
購入時期判定部202は、購入後期間が所定の期間内であるか否かを判定する。購入後期間が所定の期間内である場合、購入時期判定部202は、サクラによるレビューではないことを示す判定値「0」を取得する。一方、購入後期間が所定の期間外である場合、購入時期判定部202は、サクラによるレビューであることを示す判定値「1」を取得する。所定の期間は、例えば、日数である。一例として、所定の期間は、ユーザの手元に商品が到達した後から数カ月以内である。
購入後期間が所定の期間内である場合、レビューの投稿時期が、ユーザの手元に商品が到達した後の期間であって、到達してから数カ月が経過する前の期間であることを示す。この場合、ユーザが実際に商品を手にとって検証し、商品が意識されている期間内にレビューが投稿された可能性が高い。このため、ユーザは自身の意志にしたがってレビューを投稿している可能性が高いことが想定される。したがって、購入時期判定部202は、投稿されたレビューがサクラによるレビューでないことを示す判定値「0」を取得する。
一方、購入後期間が所定の期間外である場合、ユーザの手元に商品が到達する前の期間、若しくは、商品が到達してから数カ月が経過した後の期間であることを示す。この場合、ユーザが実際に商品を手にとる前にレビューが投稿された可能性が高い。若しくは、商品が意識されなくなった後にレビューが投稿された可能性がある。このため、商品の売り主からの委託に応じて、ユーザが商品を購入しレビューを投稿している可能性が高いことが想定される。したがって、購入時期判定部202は、投稿されたレビューがサクラによるレビューであることを示す判定値「1」を取得する。
商品登録時期判定部203は、登録後期間に基づいて、数値「0」~「1」の間の判定値を取得する(ステップS104)。商品登録時期判定部203は、登録後期間として、投稿されたレビューの対象商品のECサイトへの登録時期からレビューの投稿時期までの期間を取得する。登録時期は、ECサイトにおける販売対象の商品として、当該商品が登録、掲載された日時である。レビューの投稿時期は、ECサイト上でユーザが対象の商品に対するレビューを投稿した日時である。
商品登録時期判定部203は、登録後期間が短いほど値「1」に近づき、登録後期間が長いほど値「0」に近づいた判定値を取得する。前述したとおり、値「1」は、サクラによるレビューである可能性が高いことを示し、値「0」は、サクラによるレビューである可能性が低いことを示す。
登録後期間が短い場合、商品のECサイトへの登録後、間もなくレビューが投稿された場合を示す。この場合、登録後期間が短いほど、商品の売り主からの委託に応じてレビューが投稿されている可能性が高いことが想定される。これにより、商品登録時期判定部203は、判定値として、登録後期間が短いほど値「1」に近い値を取得する。一方、登録後期間が長いほど、商品の売り主からの委託に応じてレビューが登録されている可能性が低いことが想定される。これにより、商品登録時期判定部203は、判定値として、登録後期間が長いほど値「0」に近い値を取得する。
このように、購入後期間又は登録後期間に注目することにより、投稿されたレビューが、商品を不当に販売するために投稿されたレビューであるか否かを推定することができる。換言すると、レビューに含まれる評価文だけでなく、当該レビューが投稿されたタイミングに着目することにより、サクラによるレビューをより適切に検出することができる。
ユーザ情報判定部204は、ユーザ情報に基づいて、ユーザがサクラである可能性を示す判定値を算出する(ステップS105)。判定値は、例えば、数値「0」~「1」の間の値である。判定値は、ユーザがサクラである可能性が低い程、値「0」に近い値を示し、可能性が高い程、値「1」に近い値を示す。ユーザ情報は、例えば、ユーザの属性に関する情報(属性情報)、ユーザが購入した商品の購入履歴、ユーザが投稿したレビューの投稿履歴、及びレビューの認定履歴を含む。
属性情報は、例えば、ユーザの性別、年齢、住所、職業等を含む。購入履歴は、例えば、過去に購入した商品のID、数量、購入日時、配送先の住所、購入頻度、購入を指示した端末装置300のIPアドレス等を含む。レビューの投稿履歴は、対象商品のID、投稿された評価値及び評価文、投稿日時等を含む。認定履歴は、ユーザが過去に投稿した各レビューについて、サクラによるレビューであるとして認定された履歴を示す。
ユーザ情報判定部204は、一例として、教師データを学習した学習済みのモデルを用いて、投稿されたユーザ情報を入力とし、ユーザがサクラである可能性を示す判定値を算出する。教師データは、例えば、ユーザ情報、及び、当該ユーザ情報のユーザがサクラであるか否かを示すラベルを含む。モデルの生成に当たり、例えば、目的変数としてユーザがサクラであるか否かが設定され、説明変数として上述のユーザ情報うちの少なくとも二つの情報が設定される。例えば、決定木分析等の手法にしたがって、サクラである可能性を導出可能なモデルが生成される。
サクラによるレビューであると認定された履歴を有する場合、サクラである可能性が高いことが推定される。また、初めてレビューを投稿する場合、定期的にレビューを投稿するユーザより、サクラである可能性が高いことが推定される。これにより、例えば、過去に投稿したレビューがサクラによるレビューであると認定された履歴や、投稿頻度等の傾向を学習することで、ユーザがサクラである可能性を推定することができる。
また、サクラであると認定されたユーザのユーザ情報の特性を学習することにより、サクラである可能性を推定してもよい。例えば、サクラによるレビューであると認定されたユーザの住所、年齢、投稿文の使用言語等を学習して、モデルが生成される。これにより、投稿者であるユーザのユーザ情報の特性が、サクラであると認定されたユーザと近い場合に、投稿者がサクラである可能性が高いと推定できる。これにより、不正なレビューを投稿した履歴を有していないユーザについても、サクラである可能性を推定することができる。
なお、ユーザ情報判定部204は、他の分析方法にしたがってモデルを生成してもよい。ユーザ情報判定部204は、教師無し学習に基づいて、モデルを生成してもよい。また、ユーザ情報は、上述した例に限定されるものではない。例えば、ユーザ情報は、職業や、購入頻度の高い商品の種別等を含んでいてもよい。
総合値判定部205は、ステップS102~S105で各判定値が取得した判定値に基づいて、総合判定値を算出する(ステップS106)。総合値判定部205は、重み情報DB124を参照して各判定部に対して設定される重みを取得する。総合値判定部205は、取得した各判定値に重みを適用して重み付判定値を算出し、各重み付判定値を合算し、総合判定値を算出する。
図4は、重み情報DB124の一例を示す図である。図4の例によると、言語解析に基づく判定には重み「0.4」が設定される。また、購入時期に基づく判定には重み「0.3」が設定される。同様にして、商品登録時期に基づく判定には重み「0.2」が設定され、ユーザ情報に基づく判定には重み「0.1」が設定される。本実施の形態において、各判定部の重みは、合計値が値「1」になるような値に設定される。
図3のフローチャートに戻り、総合値判定部205は、算出した総合判定値と閾値との差分を算出する。総合値判定部205は、総合判定値と閾値との差分が所定の範囲内に収まるか否かを判定する(ステップS107)。差分が所定の範囲内に収まる場合(ステップS107のYes)、総合判定値と閾値とが近似しており、認定が曖昧であることを示す。このため、総合値判定部205は、ECサイトの管理者に対して、管理者による認定を依頼する。総合値判定部205は、管理者への認定依頼を呼び出し元に出力して処理を終了する(ステップS108)。レビュー登録部112は、認定依頼を取得すると、投稿されたレビューをレビュー管理DB116に格納するとともに、非掲載ステータスに設定する。
一方、差分が所定の範囲内に収まらない場合(ステップS107のNo)、総合判定値が閾値を大幅に超える場合、または、総合判定値が閾値を大幅に下回る場合を示す。総合値判定部205は、総合判定値と閾値との比較に基づいて認定を行う。総合判定値が閾値を超える場合(ステップS109のYes)、総合値判定部205は、投稿されたレビューがサクラによるレビューであると認定する。一方、総合判定値が閾値を以内である場合(ステップS109のNo)、総合値判定部205は、投稿されたレビューがサクラによるレビューではないと認定する。総合値判定部205は、認定結果を呼び出し元に出力して処理を終了する。
取得した認定結果がサクラによるレビューではないことを示す場合、レビュー登録部112は、投稿されたレビューをレビュー管理DB116に格納するとともに、掲載可ステータスに設定する。これにより、当該レビューがECサイトに掲載される。一方、認定結果がサクラによるレビューであることを示す場合、レビュー登録部112は、投稿されたレビューをレビュー管理DB116に格納するとともに、非掲載ステータスに設定する。これにより、当該レビューはECサイトに掲載されない。
図3のフローチャートにおいて、総合値判定部205は、総合判定値と閾値との差分が所定の範囲内に収まるか否かを判定した(ステップS107)。ただし、ステップS107の処理は省略されてもよい。または、総合値判定部205は、総合判定値と閾値との比較に基づきサクラによるレビューであるか否かを認定後に、ステップS107の処理を実行してもよい。この場合、総合値判定部205は、差分が所定の範囲内のレビューについて、閾値との比較に基づく認定結果に加えて、管理者への認定依頼を出力する。
図3のフローチャートにおいて、総合値判定部205は、レビューの投稿時に、当該レビューがサクラによるレビューであるか否かを判定する場合を例示した。ただし、この例に限定されるものではない。ECサイトに既に掲載されているレビューに対して、図3の認定処理が行われてもよい。この場合、掲載されているレビューに対して、サクラによるレビューであるか否かの認定処理が行われる。掲載されているレビューがサクラによるレビューであると認定された場合、レビュー登録部112は、当該レビューを非掲載ステータスに変更する。
図5は、本実施形態における重みの更新処理を説明するフローチャートである。例えば、ECサイトの管理者は、新たに投稿されたレビューの一部又は全部を対象として、実際に目を通して、サクラによるレビューであるか否かを認定する。または、管理者は、認定依頼が通知されたレビューを対象として認定を行う。フィードバック登録部113は、管理者による認定結果をパラメータとして入力し、APIを呼び出す。これにより、図5に示す重みの更新処理が実行される。
重み更新部123は、管理者による認定結果と、レビュー登録部112による認定結果とが一致するか否かを判定する(ステップS201)。双方の認定結果が一致する場合(S201のYes)、重み更新部123は重みの更新処理を行わない。一方、認定結果が一致しない場合(S201のNo)、重み更新部123は重みの更新処理を行う(ステップS202)。重みの更新処理の詳細を説明する。
レビュー登録部112による認定結果がサクラによるレビューではないことを示し、管理者による認定結果がサクラによるレビューであることを示す場合を例示する。例えば、管理者は、認定時に、言語解析、購入時期、商品登録時期、及びユーザ情報のうち、サクラによるレビューであると認定した理由を選択する。レビュー登録部112は、APIを呼び出す時に、パラメータに、管理者が選択した理由を指定する。重み更新部123は、パラメータに指定された理由に基づいて、当該理由に対応する判定部の重みが高くなるように重みを算出し、重み情報DB124を更新する。
または、重み更新部123は、複合判定部122の各判定部が取得した判定値に基づいて、重みを更新してもよい。この場合、重み更新部123は、対象のレビューに対して各判定部が取得した判定値を取得し、当該判定値に重みを適用した場合の総合判定値が管理者による認定結果と合致するように、重みを算出する。レビュー登録部112による認定結果がサクラによるレビューであることを示し、管理者による認定結果がサクラによるレビューではないことを示す場合についても同様である。
または、レビュー登録部112は、管理者に各判定部の重みを入力させてもよい。管理者は、レビューがサクラによるレビューであると認定する場合、各判定部の重みの変更値をさらに入力する。重み更新部123は、入力された各判定部の重みの変更値に基づいて、重み情報DB124を更新する。
以上のように、本実施の形態における情報処理装置100は、ユーザにより入力される商品に対する評価情報と、ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、評価情報が不正であるか否かを判定する判定部(121、122)を備える。これにより、情報処理装置100は、投稿されたレビューの評価文やユーザ情報に基づいて、投稿されたレビューがサクラによる不正なレビューであるか否かを認定することができる。
本実施の形態における情報処理装置100では、判定部は、複数の判定要素について評価情報の不正度を示す各判定値を取得し、複数の判定要素それぞれの重みを適用した各判定値の合計に基づいて、評価情報が不正であるか否かを判定する。また、情報処理装置100は、判定部による判定結果が、管理者による評価情報の判定結果と異なる場合に重みを更新する更新部(重み更新部123)、をさらに備える。これにより、情報処理装置100は、管理者による認定結果を判定処理にフィードバックすることができる。この結果、APIによる認定結果が、管理者による認定結果に近づくように、恒常的に認定の精度を向上させていくことができる。
本実施の形態におけるユーザ情報は、ユーザ情報は、ユーザが購入した商品の購入履歴を含む。判定部は、購入履歴が評価情報の対象の商品を含まない場合、評価情報が不正であると判定する。これにより、レビューの投稿者がレビューの対象商品を購入していない場合、投稿されたレビューをサクラによる不正であると認定し、掲載対象から排除することができる。
本実施の形態における複数の判定要素は、評価情報に含まれる商品に対する評価文の言語解析、対象の商品のユーザによる購入時期から評価情報の入力時期までの期間、対象の商品の登録時期から評価情報の入力時期までの期間、及び、ユーザ情報のうち、少なくとも二つの組み合わせを有する。これにより、情報処理装置100は、複数の判定要素に基づくことにより、サクラによるレビューであるか否かを、多面的により高精度に認定することができる。
判定部は、複数の判定要素のうち評価文の言語解析に基づいて判定する場合、評価文と、当該評価情報の認定結果とを学習データとして用いた機械学習によって得られた学習済みモデルに基づいて、評価文を入力として評価情報が不正であるか否かを判定する。これにより、情報処理装置100は、評価文の傾向を学習することにより、日本語として不適正な度合いをより高精度に判定することができる。この結果、サクラによるレビューであるか否かを、より高精度に認定することができる。
ユーザ情報は、ユーザの属性情報、ユーザが購入した商品の購入履歴、ユーザが投稿した評価情報の履歴、及び評価情報の認定履歴の少なくともいずれかを含む。判定部は、複数の判定要素のうちユーザ情報に基づいて判定する場合、ユーザ情報と、当該ユーザ情報のユーザが入力した評価情報の認定結果とを学習データとして用いた機械学習によって得られた学習済みモデルに基づいて、ユーザ情報を入力として評価情報が不正であるか否かを判定する。これにより、情報処理装置100は、サクラであるユーザのユーザ情報の傾向を学習することにより、ユーザがサクラであるか否かをより適切に判定することができる。この結果、サクラによるレビューであるか否かを、より高精度に認定することができる。
判定部は、各判定値の合計値と閾値との差分が所定範囲内である場合に、管理者による評価情報の判定を指示する。これにより、情報処理装置100は、複数の判定要素ついて判定した結果、サクラによるレビューであるか否かが明確ではない場合に、管理者による認定処理を依頼することができる。これにより、サクラによるレビューをより確実に排除することができる。
なお、上述した情報処理装置100が備える各構成は、内部に、コンピュータシステムを有している。そして、上述した情報処理装置100が備える各構成の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより上述した情報処置装置100が備える各構成における処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD-ROM等の非一過性の記録媒体であってもよい。
また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部又は外部に設けられた記録媒体も含まれる。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に情報処理装置100が備える各構成で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
また、上述した機能の一部又は全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。上述した各機能は個別にプロセッサ化してもよいし、一部、又は全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、又は汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
100…情報処理装置、110…ECサイト管理部、111…販売管理部、112…レビュー登録部、113…フィードバック登録部、114…販売管理データベース、115…ユーザ情報データベース、116…レビュー管理データベース、120…APIコンポーネント、121…履歴判定部、122…複合判定部、123…重み更新部、201…言語解析部、202…購入時期判定部、203…商品登録時期判定部、204…ユーザ情報判定部、205…総合値判定部、300…端末装置

Claims (9)

  1. ユーザにより入力される商品に対する評価情報と、前記ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、前記評価情報が不正であるか否かを判定する判定部を備えることを特徴とする情報処理装置。
  2. 前記判定部は、複数の判定要素について前記評価情報の不正度を示す各判定値を取得し、前記複数の判定要素それぞれの重みが適用された各判定値の合計に基づいて、前記評価情報が不正であるか否かを判定し、
    前記判定部による判定結果が、管理者による前記評価情報の判定結果と異なる場合に前記重みを更新する更新部、をさらに備える、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記ユーザ情報は、前記ユーザが購入した前記商品の購入履歴を含み、
    前記判定部は、前記購入履歴が前記評価情報の対象の前記商品を含まない場合、前記評価情報が不正であると判定する、
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記判定部は、複数の判定要素について前記評価情報が不正であるか否かを判定し、
    前記複数の判定要素は、前記評価情報に含まれる前記商品に対する評価文の言語解析、対象の前記商品の前記ユーザによる購入時期から前記評価情報の入力時期までの期間、前記対象の商品の登録時期から前記評価情報の前記入力時期までの期間、及び、前記ユーザ情報のうち、少なくとも二つの組み合わせを有する、
    ことを特徴とする請求項1から請求項3のいずれか一項に記載の情報処理装置。
  5. 前記判定部は、前記複数の判定要素のうち前記評価文の言語解析に基づいて判定する場合、前記評価文と、当該評価情報の認定結果とを学習データとして用いた機械学習によって得られた学習済みモデルに基づいて、前記評価文を入力として前記評価情報が不正であるか否かを判定する、
    ことを特徴とする請求項4に記載の情報処理装置。
  6. 前記ユーザ情報は、前記ユーザの属性情報、前記ユーザが購入した前記商品の購入履歴、前記ユーザが投稿した前記評価情報の履歴、及び前記評価情報の認定履歴の少なくともいずれかを含み、
    前記判定部は、前記複数の判定要素のうちユーザ情報に基づいて判定する場合、前記ユーザ情報と、当該ユーザ情報のユーザが入力した前記評価情報の認定結果とを学習データとして用いた機械学習によって得られた学習済みモデルに基づいて、前記ユーザ情報を入力として前記評価情報が不正であるか否かを判定する、
    ことを特徴とする請求項4に記載の情報処理装置。
  7. 前記判定部は、前記各判定値の合計値と閾値との差分が所定範囲内である場合に、前記管理者による前記評価情報の判定を指示する、
    ことを特徴とする請求項2に記載の情報処理装置。
  8. ユーザにより入力される商品に対する評価情報と、前記ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、前記評価情報が不正であるか否かを判定する、
    制御方法。
  9. コンピュータに、
    ユーザにより入力される商品に対する評価情報と、前記ユーザに関する情報を有するユーザ情報との少なくとも何れかを含む入力情報に基づいて、前記評価情報が不正であるか否かを判定する、
    処理を実行させることを特徴とするプログラム。
JP2021048091A 2021-03-23 2021-03-23 情報処理装置、制御方法、及びプログラム Pending JP2022147013A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021048091A JP2022147013A (ja) 2021-03-23 2021-03-23 情報処理装置、制御方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021048091A JP2022147013A (ja) 2021-03-23 2021-03-23 情報処理装置、制御方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2022147013A true JP2022147013A (ja) 2022-10-06

Family

ID=83463632

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021048091A Pending JP2022147013A (ja) 2021-03-23 2021-03-23 情報処理装置、制御方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2022147013A (ja)

Similar Documents

Publication Publication Date Title
TWI759620B (zh) 確定用戶金融違約風險的方法及裝置與電腦可讀儲存媒體及計算設備
CN107341716B (zh) 一种恶意订单识别的方法、装置及电子设备
US7497374B2 (en) Fraud risk advisor
US9064212B2 (en) Automatic event categorization for event ticket network systems
US8234692B2 (en) System and method for processing an upload of a program with export compliance information
US8060532B2 (en) Determining suitability of entity to provide products or services based on factors of acquisition context
CN109711955B (zh) 基于当前订单的差评预警方法、系统、黑名单库建立方法
WO2019084922A1 (zh) 信息处理方法和系统、服务器、终端、计算机存储介质
CN105590055A (zh) 用于在网络交互系统中识别用户可信行为的方法及装置
TWI751590B (zh) 違規推定系統、違規推定方法及程式產品
CN112529663B (zh) 商品推荐方法、装置、终端设备及存储介质
US8688508B1 (en) System and method for evaluating correction submissions with supporting evidence
WO2023000491A1 (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN114547475B (zh) 一种资源推荐方法、装置及系统
CN110009297A (zh) 一种基于信用的资质信息审核方法、装置及设备
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
WO2021048902A1 (ja) 学習モデル適用システム、学習モデル適用方法、及びプログラム
JP2022147013A (ja) 情報処理装置、制御方法、及びプログラム
US10353929B2 (en) System and method for computing critical data of an entity using cognitive analysis of emergent data
US20170228750A1 (en) Server and price setting support method
JP2020004161A (ja) 審査支援装置、審査支援方法、およびサービス提供方法
US20220027916A1 (en) Self Learning Machine Learning Pipeline for Enabling Binary Decision Making
CN114925261A (zh) 关键词确定方法、装置、设备、存储介质及程序产品
CN112085240A (zh) 抢购商品交易数据处理方法及系统
CN114912946B (zh) 一种确定用户分层的方法、装置、存储介质和电子设备