JP2022154872A - アノマリ検知方法、検知装置、及びコンピュータプログラム - Google Patents
アノマリ検知方法、検知装置、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2022154872A JP2022154872A JP2021058130A JP2021058130A JP2022154872A JP 2022154872 A JP2022154872 A JP 2022154872A JP 2021058130 A JP2021058130 A JP 2021058130A JP 2021058130 A JP2021058130 A JP 2021058130A JP 2022154872 A JP2022154872 A JP 2022154872A
- Authority
- JP
- Japan
- Prior art keywords
- data
- anomaly
- model
- processing unit
- anomalies
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 86
- 238000004590 computer program Methods 0.000 title claims abstract description 7
- 238000000034 method Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 description 124
- 238000000605 extraction Methods 0.000 description 27
- 238000013145 classification model Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 11
- 230000009193 crawling Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000013480 data collection Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 5
- 238000013075 data extraction Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000009474 immediate action Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004801 process automation Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】ゲームのアノマリに関するコメントを24時間365日態勢で検知することが可能なアノマリ検知方法、検知装置、及びコンピュータプログラムを提供する。【解決手段】アノマリ検知方法は、ゲームアプリケーションに関して投稿されたデータを収集し、データが入力された場合に、前記データが前記ゲームアプリケーションのアノマリに関するデータを出力するように学習済みのモデルに、収集したデータを入力し、前記モデルから出力されるデータに基づき、収集されたデータの内、アノマリに関するデータであると判断されたデータを記憶する。【選択図】図1
Description
本発明は、所定のゲームのアノマリに関するコメントを検知するアノマリ検知方法、検知装置、及びコンピュータプログラムに関する。
ビデオゲームにおけるシナリオ、アクション、グラフィック、及びBGM等の要素は、データ量が増加し、複雑になり、選択肢が多岐に亘るようになってきている。特許文献1には、オープンワールドをベースとしたゲームのテストプロセスを人間に任せる場合には、かなりの人月を要することに触れられている。
オンラインゲームでは、アップデート及びイベント追加が適宜実施されることが多い。例えば、このようなアップデートやイベント追加時にそのゲームにおいて停止やバグ等のアノマリが起こることがあり、上記ゲームの運営者はこれらアノマリに迅速に対応しないと、該ゲームに対する不評が広まり、該ゲームからのユーザ離れに繋がってしまう恐れがある。このようなアノマリは上記アップデートやイベント追加時やその近傍のタイミング以外でも起こり得るものであり、アノマリに関する事象が起こってしまった場合、なるべく早く運営側が、上記アノマリが起こったことを認識することが求められている。
本発明は、所定のWebサイト(例えば、電子掲示板やSocial Networking Service(SNS)等)において所定のゲームのアノマリに関するコメントを24時間365日体勢で検知することが可能なアノマリ検知方法、検知装置、及びコンピュータプログラムを提供することを目的とする。
本開示の一実施形態のアノマリ検知方法は、ゲームアプリケーションに関して投稿されたデータを収集し、データが入力された場合に、前記データが前記ゲームアプリケーションのアノマリに関するデータを出力するように学習済みのモデルに、収集したデータを入力し、前記モデルから出力されるデータに基づき、収集されたデータの内、アノマリに関するデータであると判断されたデータを記憶する。
本開示の一実施形態の検知装置は、ゲームアプリケーションに関して投稿されたデータを収集する収集部と、データが入力された場合に、前記データに対して前記ゲームアプリケーションのアノマリに関するデータを出力するように学習済みのモデルを記憶する第1記憶部と、収集したデータを前記モデルに入力し、前記モデルから出力されるデータに基づき、収集されたデータの内、アノマリに関するデータであると判断されたデータを記憶する第2記憶部とを備える。
本開示の一実施形態のコンピュータプログラムは、コンピュータに、ゲームアプリケーションに関して投稿されたデータを収集し、データが入力された場合に、前記データが前記ゲームアプリケーションのアノマリに関するデータを出力するように学習済みのモデルに、収集したデータを入力し、前記モデルから出力されるデータに基づき、収集されたデータの内、アノマリに関するデータであると判断されたデータを記憶する処理を実行させる。
本開示のアノマリ検知方法、検知装置、及びコンピュータプログラムでは、検知対象のゲームアプリケーションに関してゲームユーザから投稿されたデータが自動的に収集され、学習済みモデルを利用して、アノマリに関するデータである可能性が高いデータが記憶される。
ユーザから投稿されるデータは、テキストデータ、画像データ、音声データ、又は動画像データである。データは、テキストデータ、画像データ、音声データ、及び動画像データの2つ以上の組み合わせであってもよい。
本開示の一実施形態のアノマリ検知方法は、前記モデルは、データが入力された場合に、前記データが前記ゲームアプリケーションのアノマリに関するデータである可能性に対応するスコアを出力するように学習され、前記スコアに基づき、入力したデータがアノマリに関するデータであるか否かを判断する。
本開示のアノマリ検知方法では、記憶されたデータには、学習済みモデルを利用して、アノマリに関する分類のデータが対応付けられる。分類は例えば「バグ」、「停止」、「クラッシュ」等である。
本開示のアノマリ検知方法では、データの収集は定期的に実行されてもよい。周期が終了する都度、周期別にアノマリに関するデータであるか否かの判断、及び分類が実行されてもよい。周期は、可変として設定を受け付けてもよい。
本開示の一実施形態のアノマリ検知方法は、記憶されたアノマリに関するデータの一覧を含むレポートを作成し、レポートの作成を外部へ通知する。
本開示のアノマリ検知方法では、レポートを作成し、オペレータが操作するコンピュータからレポートの閲覧を可能とする。レポートとして閲覧できることにより、対処までのスピードを上げることが可能である。
本開示の一実施形態のアノマリ検知方法は、前記レポートには、各データへアクセスするためのリンクが含まれている。
本開示のアノマリ検知方法では、作成されるレポートを介して、オペレータは、ゲームユーザから投稿されたデータ(一次情報)にあたることが可能である。
本開示によれば、所定のWebサイトにおいて所定のゲームのアノマリに関するコメントを24時間365日体勢で検知することが可能となる。
本発明をその実施の形態を示す図面を参照して具体的に説明する。
本発明は、所望のコメントをユーザが投稿し閲覧できるWebサイト(電子掲示板やSNS等)に投稿されている多数のコメントから、所定のゲームのアノマリに関するコメントを抽出するものである。
本明細書において、「アノマリ」とは、所定のゲームについて運営上早急に対処しなければならない事象であって、エラー、不具合、バグ、ゲームの停止、ゲームの強制終了等といったゲームの少なくとも一部の要素に対する異常に関するものである。よって、例えば所定のゲームのアノマリに関するコメントは、該所定のゲームにおいてエラーやバグが生じていることを示すコメントやそれらを注意喚起するコメント等である。
本発明は、所望のコメントをユーザが投稿し閲覧できるWebサイト(電子掲示板やSNS等)に投稿されている多数のコメントから、所定のゲームのアノマリに関するコメントを抽出するものである。
本明細書において、「アノマリ」とは、所定のゲームについて運営上早急に対処しなければならない事象であって、エラー、不具合、バグ、ゲームの停止、ゲームの強制終了等といったゲームの少なくとも一部の要素に対する異常に関するものである。よって、例えば所定のゲームのアノマリに関するコメントは、該所定のゲームにおいてエラーやバグが生じていることを示すコメントやそれらを注意喚起するコメント等である。
図1は、本開示のアノマリ検知システム100の概要図である。本実施形態に係るアノマリ検知システム100は、スマートフォン又はタブレット端末をハードウェアとする所謂モバイルゲームと呼ばれるアプリケーションにおけるアノマリに関するコメントを検知する。ゲームを実行するハードウェアはモバイル機器に限らず、家庭用ゲーム機やアーケードゲーム機のような所謂ゲームコンソールや、パーソナルコンピュータであっても良い。検知対象は、モバイルゲームアプリケーションやゲームソフトウエア(以下、ゲームアプリという)に限らず、スマートフォン又はタブレット端末等の情報処理装置を主なハードウェアとして利用するアプリケーションを含む。
アノマリ検知システム100は、検知装置1と、検知対象のゲームアプリの製作者が使用するクライアント装置2とを含む。検知装置1は、所謂インターネットと接続可能なネットワークに接続されている。検知装置1はシステム内又はシステム外のネットワークNに接続されているサーバ装置を介して、クライアント装置2との間でデータを送受信する。
検知装置1は、インターネット経由で、検知対象のゲームアプリに関するデータをクローリングによって収集する。検知装置1は、収集したデータを分類し、分類毎にレポートを出力する。検知装置1は、クローリングを24時間漏れなく実行し続け、記憶部11に記憶する。なお、クローリングについては、所定の時間帯のみに行うように設定しても良い。検知装置1は、逐次記憶されたデータに対して自動的に分類処理を実行する。検知装置1は、分類処理の結果からレポートを作成し、通知する。本作成や通知のタイミングは所望に応じて設定することができる(例えば、1時間毎等)。
従前では、検知対象のゲームアプリについて、担当スタッフが検知対象のゲームアプリに関するSNS、ブログ等における投稿テキストを収集し、レポートとしてまとめて関係者に共有していた。これら作業は人手であるためにコストや手間に鑑みると24時間における投稿テキスト全てを収集することは困難であった。よって、上記収集やレポート作成等は、所定の時間帯毎に行うことになる。この場合、収集に係る時間帯以外の時間に投稿されたテキストは検知対象外となって漏れに繋がったり、次の収集に係る時間帯での収集となってタイムラグが大きくなったりすることがあった。しかも、投稿テキストからアノマリに関するものを抽出することは、ゲームアプリのユーザが多い程に困難になることもある。すなわち、ゲームアプリのユーザが多いほど、該ゲームアプリのファンによるイラスト、写真、感想(単なる批判や、面白いといったコメント)の投稿も大量になり、これらはアノマリ検知対象外であるから抽出外としなければならない。
図1に示す本開示のアノマリ検知システム100では、検知装置1は自動的に、検索対象のWebサイトからクローリングを続け、記憶する。検知装置1は、クローリングによって収集されたデータを、期間を区切りながら順次分類する。これにより、収集されるデータから漏れる投稿データの数を低減させることができる。
分類されたデータに、例えば同じ内容(趣旨)のテキスト、音声、及び動画が含まれる場合、いずれかを代表的なデータとし(名寄せ)、その代表的なデータに同じ内容のデータの件数を付加したものでまとめられるとよい。
検知装置1は、クローリングによって収集したデータの抽出と、抽出した後のデータの分類とを、学習済みのモデルによって実行してもよい。予めこれまで手動で抽出してきたデータ、分類してきたデータによって教師あり学習を実施済のモデルを用いるとよい。
検知装置1は、分類されたデータからレポートを作成し、記憶すると共にサーバ装置へアップロードし、クライアント装置へ通知する。レポートは、分類されたデータの羅列であってもよいし、図表化されてもよい。通知方法は、サーバ装置が実現する機能であるデータ共有、メッセージ交換、又は電子メールをよるものでよい。
クライアント装置2でのレポート表示では、直感的に分かりやすく、且つ漏れなく表示されることが望まれる。表計算ソフトにまとめたものが逐次データ共有アプリケーションにその都度保存されてもよい。まとめられたレポートには、各投稿テキストへの直接的リンクが含まれることが望ましい。
このようなアノマリ検知システム100を実現するための各装置の構成及び処理内容について詳細を説明する。図2は、アノマリ検知システム100の各装置の構成を示すブロック図である。検知装置1は、処理部10、記憶部11及び通信部12を備える。
検知装置1は、以下の説明においては1台のサーバコンピュータによって構成されるものとして説明するが、複数台のサーバコンピュータをネットワークで通信接続して分散処理させる態様であってもよい。検知装置1は、公衆ネットワークを介して情報処理装置から通信接続が可能なクラウド型のサーバであってもよいし、仮想的又は実体的なプライベートネットワークを介して各クライアント装置2と通信接続するオンプレミス型のサーバであってもよい。
処理部10は、CPU(Central Processing Unit )及び/又はGPU(Graphics Processing Unit)を用いたプロセッサである。処理部10は、記憶部11に記憶されている検知プログラム1Pに基づき、対象のゲームアプリに関するデータを収集し、抽出及び分類を実行する。
記憶部11は、例えばハードディスク、SSD(Solid State Drive)等の不揮発性メモリを用いる。記憶部11は、処理部10が参照するデータを記憶する。記憶部11は、検知プログラム1Pを記憶する。記憶部11は、抽出に用いる学習済みの抽出モデル11Mと、分類に用いる学習済みの分類モデル12Mを記憶する。検知プログラム1Pは、記録媒体9に記憶してある検知プログラム9Pを処理部10が読み出して記憶部11に複製したものであってもよい。抽出モデル11M又は分類モデル12Mについても、記録媒体9に記憶してある抽出モデル91M又は分類モデル92Mを処理部10が読み出して記憶部11に複製したものであってもよい。
記憶部11は、後述する処理によって抽出され分類されたアノマリに関するデータを記憶する。このアノマリに関するデータを記憶する記憶部11は、フラッシュメモリ等の外部記憶媒体であって、検知装置1から取り出し可能であってもよい。
通信部12は、ネットワークNを介したデータ通信を実現する。通信部12は具体的には、例えばネットワークカードである。処理部10は、通信部12によってインターネット上のデータにアクセスし、クローリングを実行する。
クライアント装置2は、例えばラップトップ型パーソナルコンピュータである。クライアント装置2は、デスクトップ型パーソナルコンピュータでもよいし、タブレット端末や、所謂スマートフォンであってもよい。
クライアント装置2は、処理部20、記憶部21、通信部22、表示部23及び操作部24を備える。処理部20は、CPU及び/又はGPUを用いたプロセッサである。処理部20は、記憶部21に記憶されているクライアントプログラム2Pに基づき、サーバ装置を介して検知装置1から取得するレポートを表示部23に表示させる。
記憶部21は、例えばハードディスク、フラッシュメモリ、SSD等の不揮発性メモリを用いる。記憶部21は、処理部20が参照するデータを記憶する。記憶部21は、クライアントプログラム2Pを記憶する。
通信部22は、ネットワークNを介したデータ通信を実現する。通信部22は具体的には、例えばネットワークカードである。処理部20は、通信部22によってサーバ装置を介して検知装置1からデータを取得できる。
表示部23は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ等のディスプレイである。表示部23は、記憶部21に記憶されているデータに基づく情報、又は検知装置1から提供されるデータを含む画面を表示する。表示部23は、タッチパネル内蔵型ディスプレイであってもよい。
操作部24は、処理部20との間で入出力が可能なキーボード及びポインティングデバイス等のユーザインタフェースである。操作部24は、音声入力部であってもよい。操作部24は、表示部23に内蔵されたタッチパネルであってもよい。操作部24は、物理ボタンであってもよい。
図3は、検知装置1によるデータ収集及び抽出処理手順の一例を示すフローチャートである。検知装置1は、以下に示す処理を、所定のタイミングで繰り返し実行する。所定のタイミングは周期的に到来してもよいし、所定の条件を満たすことによって到来してもよい。
処理部10は、ネットワークNを介して検知対象として設定されたWebサイト(所定のコミュニティサイト、掲示板サイト、SNS、又は投稿サイト等)にアクセスし、検知対象のゲームアプリに関して対象期間に投稿されたデータ(テキスト、音声、画像又は動画)を取得する(ステップS101)。対象期間は、今回のタイミングの到来時点から遡って前回のタイミングの到来時点までの期間である。
対象期間の設定は、オペレータからクライアント装置2によって設定可能としても良い。これにより、ユーザが投稿してから製作者に伝達されるまでの時間を短縮でき、アノマリ検知の即時性が実現される。期間限定のイベントや、大型アップデート直後など、製作者側でアノマリの頻度の高まりを予想できる場合、この期間の区切りを変更して検知の頻度を高めることも可能である。
ステップS101において処理部10は、所定のコミュニティサイトであればそのゲームアプリに関する「グループ」毎にアクセスする。処理部10は、掲示板サイトであれば所謂「板」、「ジャンル」、「スレッド」、又は「トピック」毎にアクセスする。処理部10は、SNS又は投稿サイトであれば、そのゲームの名前のハッシュタグ、ゲームに登場するキャラクタ名等のキーワードを用いて抽出したデータを取得する。処理部10は、対象のゲームアプリに関する全データをクローリングしてもよいし、ステップS101の時点で、予め指定されているキーワードを基にデータを選別して取得してもよい。
処理部10は、取得したデータからデータを選択し(ステップS102)、抽出モデル11Mに与える(ステップS103)。
ステップS103において処理部10は、選択したデータをテキストにして形態素解析してから単語リスト(ベクトル)として抽出モデル11Mへ与えるとよい。データが音声である場合、処理部10は音声認識を実行してから形態素解析を実行するとよい。データが画像である場合、処理部10は、画像に含まれる文字を文字認識するか、又はメタデータをテキスト化してから形態素解析を実行するとよい。動画である場合、処理部10は画像に含まれる文字の文字認識及び音声の音声認識の両方を実行してもよい。
処理部10は、抽出モデル11Mからのスコアに基づいてバグ、不具合等のアノマリに関するデータであるか否かを判断する(ステップS104)。
ステップS104において処理部10は、抽出モデル11Mから、入力された単語リストの単語夫々に対するアノマリに関するデータである可能性の高さに対応するスコアを取得する。抽出モデル11MはNeural Networkを用いる。例えば、TextCNN(Convolutional Neural Network)を用いたモデルである。時系列要素を加味して学習するRNN(Recurrent Neural Network)、再帰型ニューラルネットワーク(LSTM:Long short-term memory/ GRU:Gated Recurrent Unit)等を用いてもよい。抽出モデル11Mは、これまでの人手による抽出実績によって予め学習されていてもよいし、新たに作成される教師データによって学習されてもよい。抽出モデル11Mは例えば、「バグ」、「不具合」、「クラッシュ」、「問題」、「止まる」、「おかしい」等の単語に対してアノマリである高い可能性を与えて学習されるとよい。処理部10は、単語夫々について抽出モデル11Mから得られたスコアを総計し、データ全体に対するアノマリに関するデータか否かのスコアを算出する。アノマリに関するデータであるか否かの抽出モデル11Mはこれに限らず、テキストの解析に関する公知の方法を用いてよい。ステップS103及びS104において処理部10は、ネガティブ(又はポジティブ)なデータである可能性の高さに対応するスコアを出力する抽出モデル11Mを用いてネガティブなデータであるか否かを判断してもよい。
処理部10は、アノマリに関するデータであると判断された場合(S104:YES)、そのデータを記憶部11に記憶し(ステップS105)、処理をステップS106へ進める。アノマリに関するデータでないと判断された場合(S104:NO)、処理部10は処理をステップS106へ進める。
ステップS105において処理部10は、ステップS103で形態素解析したデータの単語リストを記憶してもよい。ステップS105において処理部10は、取得したデータの元データ(サイト、投稿)に直接的にアクセスできるリンクデータを対応付けて記憶するとよい。
処理部10は、ステップS101で取得したデータ全てについて抽出モデルに与える処理を完了したか否かを判断し(ステップS106)、完了したと判断された場合(S106:NO)、処理をステップS102へ戻す。
取得したデータ全てについて抽出モデルに与えたと判断された場合(S106:YES)、処理部10は、処理を終了する。
処理部10は、図3のフローチャートに示した処理手順を、所定のサイト別に実行してもよい。図3のフローチャートに示した処理手順により、対象のゲームアプリのアノマリに関するデータを抽出した結果が記憶部11に記憶される。
図4は、検知装置1によるデータ分類処理手順の一例を示すフローチャートである。検知装置1は、以下に示す処理を、検知装置1のデータ収集及び抽出処理の終了後直ちに実行するとよい。以下の処理の実施タイミングと図3のデータ収集及び抽出処理の実施タイミングとはそれぞれ独立していてもよく、並行して実行されてもよい。
処理部10は、記憶部11に検知対象のゲームについてアノマリに関する抽出済みのデータを読み出す(ステップS201)。
処理部10は、読み出したデータを、分類モデル12Mに与える(ステップS202)。ステップS202において処理部10は、読み出したデータをテキストにして形態素解析してから分類モデルへ与えるとよい。形態素解析済みの単語リストが記憶されている場合、その単語リストを与えるとよい。分類モデル12Mは、これまでの人手による分類実績によって予め学習されているとよい。分類は例えば、「バグ」、「不具合」、「停止・クラッシュ」、及び「改善要望」等である。処理部10は、分類モデル12Mから、入力された単語リストの単語夫々に対して予め設定されている分類のいずれに属する可能性が高いかを示すスコアを取得する。分類モデル12Mは、テキストの分類の公知の方法を採用できる。分類モデル12Mは、分類と共に、深刻度の高さに対応するスコアを出力するように学習されてもよい。
処理部10は、分類モデル12Mからのスコアに基づいて与えたデータの分類を示す分類データを、読み出したデータに対応付けて記憶部11に記憶する(ステップS203)。処理部10は、取得したスコアに基づいてデータ全体に対する分類がいずれに属するかを判定する。
処理部10は、未分類のデータが記憶部11に残っているか否かを判断する(ステップS204)。処理部10は、残っていると判断された場合(S204:YES)、処理をステップS201へ戻し、未分類のデータを読み出して処理を続行する。
ステップ204で残っていないと判断された場合(S204:NO)、処理部10は、分類処理を終了する。
図4のフローチャートに示した処理手順によって、所定のサイトやSNSから、アノマリに関するデータである可能性が高いとして抽出されたデータが分類される。記憶部11に、分類されたデータ(テキスト、音声、画像又は動画)が分類データと対応付けて記憶される。これらのデータを、分類データと共にクライアント装置2から読み出して表示できることで、製作者が不具合、バグ等をより迅速に把握できる。分類されたデータ夫々に、分類データと共に、そのデータの元データにアクセスするためのリンクが対応付けられて記憶されている。これにより、記憶部11に記憶されているそれらのデータをクライアント装置2が読み出し、検知対象のゲームアプリのユーザが投稿した一次情報を、オペレータが確認することも容易である。
図5は、検知装置1によるレポート作成処理手順の一例を示すフローチャートである。検知装置1は、以下に示す処理を、検知装置1のデータ分類処理の終了後直ちに実行するとよい。以下の処理の実施タイミングと、図3のデータ収集及びデータ抽出処理の実施タイミングと、図4のデータ分類処理の実施タイミングとはそれぞれ独立していてもよく、並行して実行されてもよい。
処理部10は、記憶部11に分類データが対応付けられた分類済のデータを、分類毎に読み出す(ステップS301)。ステップS301において処理部10は、単語リスト又は元のデータ(テキスト、音声、画像又は動画)を読み出す。音声、画像又は動画である場合、処理部10は、それらをテキスト化したものを読み出してもよい。
処理部10は、分類毎のデータ数を計数し(ステップS302)、データ数を分類データ及び時間情報と対応付けて記憶する(ステップS303)。処理部10は、分類毎に、重複するデータをまとめる(ステップS304)。ステップS304は必須ではない。ステップS304において処理部10は、分類別に1つのデータを選択し、同一分類の他のデータについて選択したデータと内容が重複するか否か、即ちテキストが重複するかを1つずつ判断する。重複度が所定の度合い以上である場合、選択したデータに対する重複数を加算する。選択したデータとそのデータの重複数を、データの識別データと対応付けて記憶する。処理部10は、データの選択を繰り返して重複するデータをまとめる。
処理部10は、分類毎のデータ数、時間情報、選択されたデータのテキスト及びその重複数の一覧を記述したドキュメントデータをレポートとして作成する(ステップS305)。ステップS305において処理部10は、表計算データ、文書データ、電子メール、又は特定のHTMLデータを作成する。レポートの作成のステップは、検知装置1に表示部を備えて、記憶部11から分類毎にデータを読み出して例えば表計算ソフトで一覧表示させるステップ、一覧表示されたデータをソートするステップ等をRPA(Robotic Process Automation)によって自動化して実現してもよい。
処理部10は、レポートを作成したことをクライアント装置2へ通知し(ステップS306)、処理を終了する。
ステップS306において処理部10は、レポートへのリンクを含むメッセージ、メール等によって通知する。通知対象は、予め設定されているとよい。例えば、分類毎に通知すべきオペレータのオペレータ識別データが記憶されていてもよい。オペレータ識別データは、メールアドレス、データ共有アプリケーション又はメッセージアプリケーションにおけるアカウントでもよい。オペレータ識別データは、データ共有アプリケーションにおけるコミュニティID、又はチームIDであってもよい。
レポートの通知は、抽出され分類済のデータが記憶された外部記憶媒体の送達であってもよい。例えば、可搬型のフラッシュメモリに逐一記憶されてもよい。
図5のレポート作成処理は必須ではない。図4のフローチャートに示した分類処理の手順の段階で、全データへの分類が終了したと判断された場合に(S204:NO)、検知装置1の処理部10は、クライアント装置2へステップS306の通知をしてもよい。
図3から図5のフローチャートに示した処理手順によるアノマリ検知を、具体例を挙げて説明する。アノマリ検知システム100は、特定のゲームアプリにおけるアノマリに関するコメント検知を実行する。特定のゲームアプリの製作者は、例えばこのゲームアプリに関するコミュニティサイトのアドレスを予め検知装置1の記憶部11に記憶させておく。特定のゲームアプリのコミュニティサイトは、ゲーム攻略サイトにおけるゲーム毎のメッセージ投稿サイト、掲示板である。これらの投稿サイト、掲示板が、イベントや攻略テーマ別に分別されていてもよい。製作者は、掲示板サイトの特定の「板」、「ジャンル」を指定するURLを指定し、記憶部11に記憶させておいてもよい。「板」及び「ジャンル」の指定に限らず、検索キーワードであってもよい。製作者は、SNSにおける検索キーワードを指定し、記憶部11に記憶させておいてもよい。検知装置1はサーバ機能を有し、クライアント装置2からこれらの指定を受け付け、記憶してもよい。検索キーワードを指定する場合、ユーザが利用する略語等を併せて指定する必要がある。
以下に説明する具体例では、ゲームアプリの略称が「ABC」であって、「これバグだとおもう」という画像データを添付した書き込みが投稿されていることが想定する。また、具体例では、「フリーズしてしまった」、「表示が変」等の書き込みがコミュニティサイトに投稿されていることを想定する。
検知装置1の処理部10は、記憶されているアドレス、URL、検索キーワードを用いてデータを取得する(S101)。処理部10は例えば、コミュニティサイト「ABC」の攻略のためのサイトの内の指定されたアドレスにアクセスし、書き込まれたテキストを取得する。処理部10は、テキストと共に画像データがアップロードされている場合はその画像データとを取得する。このとき処理部10は、書き込みの時間が対象期間に含まれるものに絞って取得する。コミュニティサイトに対して処理部10は、指定されたサイトの対象期間に書き込まれたデータをふるいに掛けずに取得する。処理部10は、検索キーワードで検索せずにデータを取得することによって、検索から漏れるデータをできるだけ低減することができる。処理部10は例えば、SNSから「ABC」を検索キーワードとしてユーザから投稿されたデータを取得してもよい。
上述したように、検知装置1によるデータ取得の周期は、オペレータによってクライアント装置2から設定可能とするとよい。周期が所定の初期値よりも短く設定された場合、ユーザによる投稿から分類完了までの時間を短縮することができる。ゲームアプリケーションのイベント、更新等が予定されていない、ハードウェアのOS更新がない等、アノマリの発生の可能性が低い期間は、周期を所定の初期値よりも長く設定するという運用が可能である。
処理部10は、取得したデータを形態素解析して得られた単語リストを抽出モデル11Mへ与える(S103)。抽出モデル11Mは例えば上述したように、単語リストに含まれる単語毎にアノマリに関する書込み、コメントである可能性の高さを示すスコアを出力する。処理部10は、単語リストに含まれる単語毎のスコアを総計してデータ全体がアノマリに関する可能性の高さを示すスコアを算出する。このとき「バグ」、「不具合」、「クラッシュ」、「障害」等の特定の単語に重みを付与し、これらの単語が含まれる書込み、コメントについては高確率にアノマリに関するデータであると判断できるとよい。抽出モデル11M自体が、これらの単語に対する重みを大きく付与して学習されていてもよい。単語リストに含まれる単語数でスコアを除算し、総計ではなくアノマリに関するデータであると判断されやすい単語の出現確率といった数値としてスコアが算出されてもよい。
処理部10は、データ全体に対して算出されたスコアが所定値以上であるか否かによって、アノマリに関するデータであるか否かを判断する(S104)。具体例の「これバグだとおもう」という画像データを添付した書き込みがコミュニティサイトに投稿されている場合、形態素解析では「これ/バグ/だ/と/おもう」と分析される。「これ」「だ」「と」等の助詞の単語に対してスコアは算出されず、「バグ」の名詞の単語に対してアノマリに関する可能性の高さを示すスコアが算出される。「バグ」については大きな重みが付与されることで、このスコアの算出結果によって処理部10は、「これバグだとおもう」という書き込みのテキスト及び添付の画像データは、アノマリに関するデータであると判断する。
添付された画像データに対して処理部10は、抽出モデル11Mへ与える前段階にて、文字認識を実行してもよい。画像データはゲーム画面又はゲーム画面を再現したイラストである可能性がある。ゲーム画面である場合、処理部10は、文字認識の結果、ゲーム画面に含まれる敵及び味方キャラクタ名、台詞、ステータスの数値、状態、特殊効果のためのスキル名、選択された技の名前等をテキスト化し、データの関連データとすることができる。書き込みに添付されているデータが画像データではなく、動画像データ、又は音声データであっても、処理部10は同様に、テキスト化し、関連データとすることができる。
処理部10は、添付されたデータをテキスト化した関連データについてもステップS103で抽出モデル11Mへ与えてもよい。しかしながら、書き込みのテキストと同様のレベルで取扱うと、ネガティブな台詞に基づいてアノマリに関するデータであると認識する可能性がある。抽出モデル11Mへは画像認識の結果のテキストを与えず、画像認識によって得られた関連データは、後の分類時に使用するとよい。
処理部10は、アノマリに関するデータであると判断した対象のデータを記憶する(S105)。ステップS105について上述したしたように処理部10は、取得した「これバグだとおもう」という書き込みのテキスト、テキストに添付された画像データ、及び単語リストを記憶する。処理部10は、「これバグだとおもう」というテキスト及び添付された画像データを含む書き込み自体へアクセスするためのURLを共に記憶するとよい。直接的にアクセスするためのURLではなく、キャッシュデータとして記憶してもよい。画像データが添付されている場合、処理部10は、画像データから認識されたテキストを記憶してもよい。上述したように、分類時に使用するためである。
処理部10は、分類処理にて、記憶部11に記憶された「これバグだとおもう」というテキストを含むデータを読み出す。処理部10は、元のテキスト又は画像認識若しくは音声認識で得られたテキストを読み出してもよい。形態素解析後の単語リストが記憶されている場合、処理部10はこれを読み出すとよい。
処理部10は、読み出したデータの形態素解析後の単語リストを分類モデル12Mに与え(S202)、分類モデル12Mから得られる単語毎の各分類に対するスコアに基づき、分類を決定する。「これ/バグ/だ/と/おもう」のデータを分類モデル12Mへ与えた場合、処理部10は、「バグ」という単語に対して「バグ」の分類である可能性が高いスコアが取得できる。その他の「これ/だ/と/おもう」の単語に対しては汎用的な単語であるためにスコアが算出されない可能性がある。処理部10は、「バグ」以外の分類に対するスコアを取得できず、「これ/バグ/だ/と/おもう」のデータに対して「バグ」の分類を示す分類データ(識別番号)を対応付けて記憶する。なお分類処理は、分類モデル12Mを使用する処理に限らなくてもよい。
ステップS202において処理部10は、「バグ」の大分類に対し、データに対応付けられている添付の画像データから得られたキャラクタ名、台詞等の関連データによってより詳細に分類してもよい。
分類処理の結果、記憶部11には期間毎に、抽出されたデータと、データの分類を示す分類データとが蓄積される。
具体例では処理部10は、レポートを作成する。処理部10は、分類済のデータを分類毎に読み出し(S301)、まとめる(S304)。処理部10は、「これバグだとおもう」という書き込み、「バグってない?」、「バグだわ」、「バグを発見」、「バグが発生している」といった書き込みはまとめられるとよい。処理部10は、「バグ」の分類データが対応付けられているデータの内、特定の単語、例えば「バグ」が共通し、且つ、「バグ」の単語以外の単語が汎用的な単語である場合に、重複度合いが高いと判断してもよい。処理部10は、特定の単語以外の単語、「発見」「思う」が相互に類似関係にあるか否かを、類語辞書、共起辞書等を用いて判断し、類似関係にある場合には重複度合いを高めるように処理してもよい。処理部10はその他、公知の言語処理を用いて文意の重複を判断してもよい。
処理部10は、ステップS302の計数、及び/又は、まとめた結果をレポートとして作成する(S305)。具体例では、処理部10は、レポートを表計算データ及び文書データの両方で作成する。処理部10は、各行に抽出された分類済のデータのテキスト及びそのデータへアクセスするためのリンクデータを、分類別に記述するレポートを表計算データで作成する。ここでいう表計算データとは、表計算アプリケーションで閲覧可能な形式のデータを意味する。処理部10は、レポートを、分類毎に、まとめられたデータのテキスト及び重複数を記述した文書データで作成する。文書データは、リンクデータ等を含まなくてもよい。文書データには、まとめられたデータの代表的なデータの書き込みテキスト及び画像データが複数含まれるとよい。
処理部10は、作成したレポートを、ファイル共有アプリケーションへアップロードする。処理部10は、ファイル共有アプリケーションにおけるそのレポート(表計算データ、文書データ等)へのリンクデータを含むメッセージを、メッセージアプリケーションにおける開発者のチームIDに対して送信することによって通知する。クライアント装置2では、メッセージアプリケーションを介して通知を受信できる。処理部10は、分類毎に、通知先のオペレータを識別する識別データを変更してもよい。処理部10は、開発者であるオペレータの識別データには、各データへのリンクを含む表計算データへのリンクを含むメッセージを送信し、企画者であるオペレータの識別データには、文書データへのリンクを含むメッセージを送信してもよい。チームID、コミュニティIDを分別して通知してもよい。
具体例におけるクライアント装置2での表示例を、図面を参照して説明する。図6は、クライアント装置2における表示例を示す図である。図6は、メッセージアプリケーションのホーム画面230を示す。図6は、製作者の内の、開発者のオペレータがそのアカウントでログインした場合のホーム画面230の表示例を示す。開発者であるオペレータのアカウントでメッセージアプリケーションを起動させた場合、図6に示すように、ホーム画面230には、アカウントが参加しているプロジェクト毎の、チーム又はテーマ等のリストエリア231と、リスト中から選択されたチーム又はテーマにおけるメッセージの表示エリア232とが含まれる。
リストエリア231に含まれている、「ABC」というプロジェクトにおける「アノマリレポート」というチーム(テーマ)に対し、通知が1通届いていることがアイコン233で示されている。
表示エリア232には、選択されたチーム又はテーマにおける他のオペレータとのメッセージの内容が表示される。図6の表示例では、検知装置1から「アノマリレポート」がアップロードされている旨のメッセージ内容が表示されている。表示エリア232には、レポートへのリンクを示すアイコン234が表示されている。アイコン234が操作部24によって選択された場合、アイコン234に対応付けられているデータ共有アプリケーション内のレポートへのアドレスに基づいて、レポート表示画面が表示部23に表示される。
図7は、レポート表示画面235の内容例を示す図である。レポート表示画面235は、データ共有アプリケーション内で起動する表計算アプリケーションによって表形式でレポートを表示する。図7の例では、分類毎にデータのテキストの一覧が示されている。テキストの隣のセルに示される数は、同じ趣旨のデータの数、即ち重複数である。重複数に対して操作部24で操作をした場合に、全てのデータの一覧が展開されてもよい。
図7の例では「バグ」、「停止」の分類が表示されている。「バグ」の分類に対応付けて、「これバグだとおもう」という書き込みのデータ、及び同趣旨の重複数が表示されている。図7の例では「これバグだと思う」と同趣旨の「バグを発見」、「バグが発生している」等の書き込みのテキストが行に分けて表示されている。同趣旨のデータに対応する各行には、各データを直接的確認するためのリンク、各データに対応付けて記憶された関連データのテキストが含まれている。
「バグ」の分類にはその他、「表示が変」という書き込みのデータ、及び、重複数が表示されている。「表示が変」と同趣旨のデータとして「表示がバグってる」という書き込みのデータが表示されている。
「停止」の分類には、「フリーズしてしまった」という書き込みのデータ、及び重複数が表示されている。
図7の例では分類毎に、重複数の多い順にデータをソートして表示している。同趣旨の書き込みが多いほど、他よりも早くオペレータが確認でき、アノマリ発生からの時間差をより短くすることができる。分類についても、検知件数が多い分類をより上位に表示するようにしてもよい。判定される深刻度の高さでソートして表示されてもよい。
このようにして、オペレータは、検知装置1によって自動的に、もれなくクローリングされたデータを、まとめて確認することができる。分類別に表示されることにより、オペレータは、対処すべき内容をまとめて確認できる。アノマリを早急に対応することが、スマートフォンをハードウェアとするゲームアプリのアクティブユーザの離脱を防ぐために有効である。特定とはいえ、検知対象のゲームアプリに関するサイトへの書き込みを全て確認することは大きなコストを要するが、検知装置1によって自動的に収集、抽出、分類されたデータをレポートとして確認することで人手及び時間的なコストの削減ができる。自動的に24時間365日クローリングが可能であるから、アノマリによる訴求力低下のリスクを低減することができる。
レポートは、図7に示したように重複数が共に表示されることで、アノマリの認知件数の多さを他と比較して把握することができる。各データには、その元の書き込み、投稿テキストへアクセスするためのリンクが対応付けられていることで、オペレータが一次情報を確認し、前後の情報からアノマリの要因をより早く推定し、より早く対処、手配することが可能になる。
図7に示したようなアノマリに関するデータ(コメント)として検知されたデータに対し、オペレータがアノマリでないものを指摘して検知装置1へフィードバックしてもよい。検知装置1は、アノマリでないが抽出モデル11Mによってアノマリに関するデータであると判断されたデータを用いて、抽出モデル11Mを再学習してもよい。
図6に示したメッセージアプリケーション、又は図7に示したデータ共有アプリケーションを介して、検知装置1へ、クローリングの対象とすべき特定のコミュニティサイト、板、ジャンル、検索キーワード等の指定、周期の指定、が実行できてもよい。例えば検知装置1は、データ共有アプリケーションに検知装置1に与えられたアカウントで接続し、記憶してある設定ファイルを参照し、設定ファイルに含まれる検索キーワード等を読み込んで記憶部11に記憶して使用する。
上述のように開示された実施の形態は全ての点で例示であって、制限的なものではない。本発明の範囲は、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内での全ての変更が含まれる。
100 アノマリ検知システム
1 検知装置
10 処理部
11 記憶部
1P 検知プログラム
2 クライアント装置
20 処理部
23 表示部
24 操作部
2P クライアントプログラム
1 検知装置
10 処理部
11 記憶部
1P 検知プログラム
2 クライアント装置
20 処理部
23 表示部
24 操作部
2P クライアントプログラム
Claims (7)
- ゲームアプリケーションに関して投稿されたデータを収集し、
データが入力された場合に、前記データが前記ゲームアプリケーションのアノマリに関するデータを出力するように学習済みのモデルに、収集したデータを入力し、
前記モデルから出力されるデータに基づき、収集されたデータの内、アノマリに関するデータであると判断されたデータを記憶する
アノマリ検知方法。 - 前記モデルは、データが入力された場合に、前記データが前記ゲームアプリケーションのアノマリに関するデータである可能性に対応するスコアを出力するように学習され、
前記スコアに基づき、入力したデータがアノマリに関するデータであるか否かを判断する
請求項1に記載のアノマリ検知方法。 - 前記モデルは、データが入力された場合に、前記データに関する前記ゲームアプリケーションのアノマリの分類を判別するように学習され、
前記アノマリに関するデータに、前記モデルに基づいて判別された分類を示すデータを対応付けて記憶する
請求項1又は2に記載のアノマリ検知方法。 - 前記ゲームアプリケーションに関して投稿されたデータを定期的に収集し、
収集したデータを周期別に、周期が終了する都度前記モデルへ入力する
請求項1から請求項3のいずれか1項に記載のアノマリ検知方法。 - 記憶されたアノマリに関するデータの一覧を含むレポートを作成し、
レポートの作成を外部へ通知する
請求項1から請求項4のいずれか1項に記載のアノマリ検知方法。 - ゲームアプリケーションに関して投稿されたデータを収集する収集部と、
データが入力された場合に、前記データに対して前記ゲームアプリケーションのアノマリに関するデータを出力するように学習済みのモデルを記憶する第1記憶部と、
収集したデータを前記モデルに入力し、前記モデルから出力されるデータに基づき、収集されたデータの内、アノマリに関するデータであると判断されたデータを記憶する第2記憶部と
を備える検知装置。 - コンピュータに、
ゲームアプリケーションに関して投稿されたデータを収集し、
データが入力された場合に、前記データが前記ゲームアプリケーションのアノマリに関するデータを出力するように学習済みのモデルに、収集したデータを入力し、
前記モデルから出力されるデータに基づき、収集されたデータの内、アノマリに関するデータであると判断されたデータを記憶する
処理を実行させるコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021058130A JP2022154872A (ja) | 2021-03-30 | 2021-03-30 | アノマリ検知方法、検知装置、及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021058130A JP2022154872A (ja) | 2021-03-30 | 2021-03-30 | アノマリ検知方法、検知装置、及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022154872A true JP2022154872A (ja) | 2022-10-13 |
Family
ID=83557665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021058130A Pending JP2022154872A (ja) | 2021-03-30 | 2021-03-30 | アノマリ検知方法、検知装置、及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022154872A (ja) |
-
2021
- 2021-03-30 JP JP2021058130A patent/JP2022154872A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wongkoblap et al. | Researching mental health disorders in the era of social media: systematic review | |
JP7283067B2 (ja) | 通信プラットフォームにおける割り込み会話のデタングル化システムと方法、非構造化メッセージを解析する方法、プログラム、及びコンピュータ装置 | |
CN109690529B (zh) | 按事件将文档编译到时间线中 | |
US10535106B2 (en) | Selecting user posts related to trending topics on online social networks | |
US8156138B2 (en) | System and method for providing targeted content | |
Jiang et al. | Recommending new features from mobile app descriptions | |
US9805022B2 (en) | Generation of topic-based language models for an app search engine | |
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
US9639846B2 (en) | System and method for providing targeted content | |
WO2020005571A1 (en) | Misinformation detection in online content | |
CN111538931B (zh) | 基于大数据的舆情监控方法、装置、计算机设备及介质 | |
US10108698B2 (en) | Common data repository for improving transactional efficiencies of user interactions with a computing device | |
US20170091313A1 (en) | Domain-specific unstructured text retrieval | |
US11573995B2 (en) | Analyzing the tone of textual data | |
US20230214679A1 (en) | Extracting and classifying entities from digital content items | |
US20130346401A1 (en) | Topical affinity badges in information retrieval | |
CN112749328B (zh) | 搜索方法、装置和计算机设备 | |
CN108733791A (zh) | 网络事件检测方法 | |
JP2023536831A (ja) | データ分析及びレポート生成のためのインタラクティブなインターフェース | |
CN115033668B (zh) | 故事脉络构建方法、装置、电子设备和存储介质 | |
Ayyalasomayajula et al. | Reddit social media text analysis for depression prediction: using logistic regression with enhanced term frequency-inverse document frequency features. | |
Stanik et al. | Which app features are being used? Learning app feature usages from interaction data | |
Francombe et al. | Assessing the implementation of digital innovations in response to the COVID-19 pandemic to address key public health functions: Scoping review of academic and nonacademic literature | |
Olson et al. | Along the margins: Marginalized communities’ ethical concerns about social platforms | |
US20170293691A1 (en) | Identifying Abandonment Using Gesture Movement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20220228 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240321 |