JP2019519009A

JP2019519009A - データソースに基づく業務カスタマイズ装置、方法、システム及び記憶媒体

Info

Publication number: JP2019519009A
Application number: JP2018537628A
Authority: JP
Inventors: 健宗王; 章成黄; 天博呉; 京肖
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2017-05-05
Filing date: 2017-06-30
Publication date: 2019-07-04
Anticipated expiration: 2037-06-30
Also published as: US11544639B2; KR102171974B1; JP6573418B2; AU2017408797B2; AU2017408797A1; TWI677828B; US20200302346A1; KR20190022440A; SG11201900260VA; EP3441891A1; WO2018201601A1; CN107038256B; EP3441891A4; TW201843622A; CN107038256A

Abstract

本発明は、データソースに基づく業務カスタマイズ装置、方法、システム及びコンピュータ読み取り可能な記憶媒体に関する。データソースに基づく業務カスタマイズ装置は、記憶手段と、処理手段と、記憶手段に記憶されており、且つ処理手段上で動作するデータソースに基づく業務カスタマイズシステムとを含み、データソースに基づく業務カスタマイズシステムが処理手段により実行されるとき、所定の各データソースにおけるユーザ生成コンテンツを取得するステップと、予めトレーニングして生成されるユーザグループタグ識別モデルを用いてユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップと、ユーザグループタグとグループ業務との所定のマッピング関係に基づき、各データソースに対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信して各データソースについてグループ業務のカスタマイズを行うステップとを実現する。本発明は広範囲で業務カスタマイズを行って、業務カスタマイズの効率を高めることができる。

Description

「関連出願の相互参照」
本願は、パリ条約に基づき、２０１７年５月５日に出願された中国特許出願第２０１７１０３１３９９５０号の「データソースに基づく業務カスタマイズ装置、方法及びコンピュータ読み取り可能な記憶媒体」と題する中国特許出願の優先権を主張し、当該出願の全体が参照によりここに組み込まれる。

本発明は、インターネット技術分野に関し、特にデータソースに基づく業務カスタマイズ装置、方法、システム及びコンピュータ読み取り可能な記憶媒体に関する。

ユーザ生成コンテンツ（ＵｓｅｒＧｅｎｅｒａｔｅｄＣｏｎｔｅｎｔ、ＵＧＣ）は、ユーザがウェブサイトやその他の公開媒体を活用して生成するコンテンツである。このようなコンテンツとして、ウェイボー（ミニブログサイト）や掲示板への投稿、ユーザが自ら製作するオーディオとビデオ、Ｑ＆Ａ、各種のニュースが挙げられ、単独で伝達して表示したり再生させたりできる。現在、銀行や保険会社など、多くの金融会社は、このようなユーザ生成コンテンツに基づき分析して、ユーザごとに挙動特徴タグを決定し、当該タグに基づき、対応する業務をカスタマイズし、業務内容を説明するようにしている。

しかしながら、ユーザごとに挙動特徴タグを決定し、業務のカスタマイズを行うという従来の方法では、インターネットに膨大なユーザ生成コンテンツが流れるために効率が低く、業務をカスタマイズする際に大きな限界がある。

本発明は、グループ的なデータソースに基づき、広範囲で業務カスタマイズを行って、業務カスタマイズの効率を高めるために、データソースに基づく業務カスタマイズ装置、方法、システム及びコンピュータ読み取り可能な記憶媒体を提供することを目的とする。

上記の目的を達成すべく、本発明は、データソースに基づく業務カスタマイズ装置を提供し、前記データソースに基づく業務カスタマイズ装置は、記憶手段と、処理手段と、前記記憶手段に記憶されており、且つ前記処理手段上で動作するデータソースに基づく業務カスタマイズシステムと、を含み、前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されるとき、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップＳ１と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップＳ２と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップＳ３と、を実現する。

上記の目的を達成すべく、本発明は、データソースに基づく業務カスタマイズ方法をさらに提供し、前記データソースに基づく業務カスタマイズ方法は、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップＳ１と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップＳ２と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップＳ３と、を含む

上記の目的を達成すべく、本発明は、データソースに基づく業務カスタマイズシステムをさらに提供し、前記データソースに基づく業務カスタマイズシステムは、
所定の各データソースにおけるユーザ生成コンテンツを取得する取得モジュールと、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別する識別モジュールと、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行う決定モジュールと、を含む。

本発明は、コンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ読み取り可能な記憶媒体に、データソースに基づく業務カスタマイズシステムが記憶されており、前記データソースに基づく業務カスタマイズシステムが処理手段により実行されるとき、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップＳ１と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップＳ２と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップＳ３と、を実現する。

本発明は、所定の各データソースにおけるユーザ生成コンテンツを取得し、ユーザグループタグ識別モデルを用いて各データソースに対応するユーザグループタグを識別し、そして各データソースに対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信するものであり、本発明は、ユーザグループタグ識別モデルを用いて、各データソースにおけるユーザを迅速に、かつ正確に識別することで、各データソースに対応するユーザグループタグを識別し、グループ的なデータソースに対応するユーザグループタグに基づき、グループ業務のカスタマイズを行うことにより、広範囲で業務カスタマイズを行い、業務カスタマイズの効率を高めることができる。

本発明の各実施例を実現する環境の非限定例の概略図である。図１のデータソースに基づく業務カスタマイズ装置の一実施例のハードウェア構成の概略図である。本発明のデータソースに基づく業務カスタマイズシステムの一実施例の概略構造図である。本発明のデータソースに基づく業務カスタマイズ方法の実施例１のフローチャートである。本発明のデータソースに基づく業務カスタマイズ方法の実施例２のフローチャートである。

本発明の目的、技術的解決手段及び利点をより明瞭にするために、以下に、実施例及び図面を踏まえて本発明を詳細に説明する。ただし、本明細書に記載される実施例は、本発明を限定せず、説明的なものに過ぎない。当業者は、本発明の実施例に基づき、創造的な労働をすることなく得られる他の全ての実施例は、本発明の保護範囲に含まれるものとする。

なお、本明細書における「第１」、「第２」などの用語は、記載上の便宜を図るためのものに過ぎず、重要性を示唆するものでも、技術的特徴の数を示すものでもない。これにより、「第１」又は「第２」で限定される特徴は、少なくとも１つの当該特徴を含み、又はそれらしき意味を成すものである。また、各実施例による技術的解決手段を互いに組み合わせることはできるが、ただし、このような組み合わせは当業者が実現可能な範囲に限定されており、技術的解決手段の組み合わせによって矛盾が生じたり、実現できなかったりする場合は、当該技術的解決手段の組み合わせを認めず、本発明が請求する保護範囲にないものとする。

図１は、本発明の各実施例を実現する環境の非限定例の概略図を示す。図１によると、本実施例において、本発明は、データソースに基づく業務カスタマイズ装置１、端末２、及びネットワーク３からなる環境を含むが、これらに限定されない環境に用いることができる。データソースに基づく業務カスタマイズ装置１は、例えば、携帯電話、スマートフォン、ノートＰＣ、ブロードキャストレシーバ、パーソナルデジタルアシスタント（ＰＤＡ）、タブレットＰＣ、ポータブルメディアプレーヤ（ＰＭＰ）、ナビゲーション装置などの携帯型機器、又はデジタルＴＶ、デスクトップＰＣ、ノートＰＣ、サーバなどの固定端末である。端末機器２は、キーボード、マウス、リモートコントローラ、タッチパッド、又は音声制御機器などの手段によりユーザとマンマシンインタラクションを行うあらゆる電子製品、例えば、ＰＣ、タブレットＰＣ、スマートフォン、パーソナルデジタルアシスタント、ゲーム機、インターネットプロトコル放送テレビ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌＴｅｌｅｖｉｓｉｏｎ、ＩＰＴＶ）、ウェアラブル端末、ナビゲーション装置などの携帯型機器、又はデジタルＴＶ、デスクトップＰＣ、ノートＰＣ、サーバなどの固定端末を含むが、これらに限定されない。ネットワーク３は、例えば、イントラネット（Ｉｎｔｒａｎｅｔ）、インターネット（Ｉｎｔｅｒｎｅｔ）、ＧＳＭ(登録商標)（ＧｌｏｂａｌＳｙｓｔｅｍｏｆＭｏｂｉｌｅｃｏｍｍｕｎｉｃａｔｉｏｎ）、ＷＣＤＭＡ（登録商標）（ＷｉｄｅｂａｎｄＣｏｄｅＤｉｖｉｓｉｏｎＭｕｌｔｉｐｌｅＡｃｃｅｓｓ）、４Ｇネットワーク、５Ｇネットワーク、ブルートゥース（登録商標）（Ｂｌｕｅｔｏｏｔｈ（登録商標））、Ｗｉ−Ｆｉなどの無線又は有線ネットワークである。データソースに基づく業務カスタマイズ装置１はネットワーク３を介して１つ又は複数の端末２とそれぞれ通信接続を確立する。

データソースに基づく業務カスタマイズ装置１は、予め設定された又は記憶されているコマンドに従って、数値計算及び／又は情報処理を自動的に行う機器である。データソースに基づく業務カスタマイズ装置１として、コンピュータ、単一のネットワークサーバ、複数のネットワークサーバからなるサーバ群、もしくはクラウドコンピューティングに基づく大量のホストやネットワークサーバからなるクラウド型機器が挙げられ、クラウドコンピューティングとは、分散コンピューティングの１種であり、疎結合されている複数のコンピュータクラスターからなる大型仮想コンピュータを指すものである。

図２は、図１のデータソースに基づく業務カスタマイズ装置１に係るハードウェア構成の非限定例の概略図を示す。図２によると、本実施例では、データソースに基づく業務カスタマイズ装置１が、システムバスなどを介して互いに通信可能に接続される記憶手段１１と、処理手段１２と、ネットワークインタフェース１３とを含むが、これらに限定されない。図２は要素１１、要素１２、及び要素１３を備えるデータソースに基づく業務カスタマイズ装置１を示しているが、必ずしも示された全ての要素で実施するとは限らず、代替案として、より多い又はより少ない数の要素で実施してもよい。

このうち、記憶手段１１は少なくとも１つのタイプの読み取り可能な記憶媒体を含む。前記読み取り可能な記憶媒体は、フラッシュメモリ、ハードディスク、マルチメディアカード、カード型記憶手段（例えば、ＳＤ又はＤＸメモリ）、ランダムアクセスメモリ（ＲＡＭ）、スタティックランダムアクセスメモリ（ＳＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、電気的消去可能なプログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、磁気記憶手段、磁気ディスク、ＣＤＲＯＭなどの不揮発性記憶媒体を含む。いくつかの実施例では、記憶手段１１が、データソースに基づく業務カスタマイズ装置１の内部記憶手段、例えば、データソースに基づく業務カスタマイズ装置１のハードディスク又はメモリであり、別の実施例では、記憶手段１１が、データソースに基づく業務カスタマイズ装置１の外部記憶手段、例えば、データソースに基づく業務カスタマイズ装置１に搭載される外付けハードディスク、スマートメディアカード（ＳｍａｒｔＭｅｄｉａ（登録商標）Ｃａｒｄ、ＳＭＣ）、セキュアデジタル（ＳｅｃｕｒｅＤｉｇｉｔａｌ、ＳＤ）カード、フラッシュカード（ＦｌａｓｈＣａｒｄ）などである。なお、記憶手段１１は、データソースに基づく業務カスタマイズ装置１の内部記憶手段とその外部記憶手段の両方を含んでもよい。本実施例では、記憶手段１１が一般的に、データソースに基づく業務カスタマイズ装置１にインストールされるオペレーティングシステム及び各種アプリケーションソフトウェア、例えば、前記データソースに基づく業務カスタマイズシステムのプログラムコードなどを記憶するために用いられる。また、記憶手段１１は、すでに出力された又は出力する各種データを一時的に記憶するためにも用いられる。

いくつかの実施例では、処理手段１２が、例えば、中央処理装置（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＣＰＵ）、コントローラ、マイクロコントローラ、マイクロプロセッサ、又はその他のデータ処理チップである。処理手段１２は一般的に、データソースに基づく業務カスタマイズ装置１全体の動作、例えば、端末機器２とのデータ交換又は通信に関連する制御や処理などの実行を制御するために用いられる。本実施例では、処理手段１２が、記憶手段１１に記憶されているプログラムコードを実行し又はデータを処理し、例えば、前記データソースに基づく業務カスタマイズシステムなどを実行するために用いられる。

ネットワークインタフェース１３は、無線ネットワークインタフェース、又は有線ネットワークインタフェースを含んでもよい。ネットワークインタフェース１３は一般的に、データソースに基づく業務カスタマイズ装置１とその他の電子機器の間に通信接続を確立するために用いられる。本実施例では、ネットワークインタフェース１３は主に、ネットワーク３を介してデータソースに基づく業務カスタマイズ装置１と１つ又は複数の端末２を接続させることで、データを伝送するチャンネルと通信接続を確立するために用いられる。

データソースに基づく業務カスタマイズシステムは、記憶手段１１に記憶されており、記憶手段１１に記憶されている少なくとも１つのコンピュータ読み取り可能なコマンドを含み、前記少なくとも１つのコンピュータ読み取り可能なコマンドが処理手段１２により実行されることで、本発明の各実施例のブロックチェーンにおける取引方法を実現する。上記のとおり、当該少なくとも１つのコンピュータ読み取り可能なコマンドは、その各部分で実現する機能の違いにより、異なる論理モジュールに分けることができ、例えば、図３に示すように、取得モジュール、識別モジュール及び決定モジュールを含む。

前記データソースに基づく業務カスタマイズシステムが処理手段１２により実行されるとき、次に示すステップＳ１、ステップＳ２、及びステップＳ３を実現する。

ステップＳ１において、所定の各データソースにおけるユーザ生成コンテンツを取得する。

本実施例では、所定のデータソースは、例えば、ミニブログサイト、掲示板又はニュースサイトなどである。データソースには大量のユーザが登録しており、ユーザは誰でも自らユーザ生成コンテンツを製作することができる。

本実施例では、業務カスタマイズシステムが各データソースにおけるユーザ生成コンテンツをリアルタイムに取得することで、各データソースから最新のユーザ生成コンテンツを取得してもよいが、システムの負荷を減らすため、各データソースにおけるユーザ生成コンテンツを定時的に（例えば１時間ごとに）取得してもよい。

具体的には、データソースにユーザ生成コンテンツが生成されると、そのユーザ生成コンテンツを自動的に前記業務カスタマイズシステムに送信し、又は所定のサーバの記憶エリアに記憶し、そして業務カスタマイズシステムにより当該サーバから当該ユーザ生成コンテンツを取得してもよい。

ステップＳ２において、予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別する。

ただし、予めトレーニングして生成されるユーザグループタグ識別モデルは機械学習モデル、例えば、サポートベクターマシンモデル、ランダムフォレストモデルなどであり、当然のことながら、これら以外のモデルでもよい。

好ましくは、ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立されるモデルであり、エントロピーを最大にする確率分布をユーザの挙動属性の確率分布とし、ユーザグループタグ識別モデルのモデル定義関数は、ユーザの挙動属性の分布関数を含み、ユーザの挙動属性の分布関数は各ユーザに対応する挙動属性の確率分布状况を記述する。ユーザの挙動属性の分布関数は、
である。当該ユーザの挙動属性の分布関数は指数分布関数であり、ただし、ｘはユーザ、ｙはユーザタグ（例えば、「資産運用」、「証券」、「保険」など）、f_ｊ（ｘ，ｙ）はユーザｘのｊ番目の挙動属性（ユーザの挙動属性とはデータソースにおけるその動作を指し、例えば、データソースでのコンテンツ発表や発言などである）、Ｆはユーザｘの挙動属性の総数、λ_ｊ,ｙ＝｛λ_１,ｙ，λ_２,ｙ，λ_３,ｙ，・・・，λ_F,ｙ｝はユーザの挙動属性の確率分布（すなわち）、Ｚ（ｘ）は正規化因子である。Ｚ（ｘ）は正規化によりユーザの挙動属性の分布関数
を［０，１］にリスケーリングするためのものであり、その値は
である。

本実施例では、最大エントロピー原理に基づき確立されるユーザグループタグ識別モデルは、各データソースのユーザグループタグを迅速に、かつ正確に識別するためのものである。

さらに、上記のユーザの挙動属性の分布関数によると、ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、最適化関数は最適解、又は最大の評価値を求めるアルゴリズムを構築するためのものであり、前記最適化関数は、
であり、ただし、λ_ｊ,ｙは
とし（すなわちユーザの挙動属性の確率分布）、P（x_i，y_i）はユーザグループタグにおけるユーザｘ_ｉのタグｙ_ｉの出現確率、
はユーザの挙動属性の尤度関数、
は正規化因子、βは最適化関数の正規化の度合いをコントロールするパラメータである。βの値の範囲は［０，１］、好ましくはβ＝０．６である。

ａｒｇｍａｘは最大点作用素を探索し、いずれのユーザにおいても最大値となるように解くことを意味し、そして各データソースのユーザグループタグはで表すことができる。

ステップＳ３において、ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行う。

本実施例では、予めマッピングによりユーザグループタグと対応するグループ業務を関連付け、例えば、ユーザグループタグが「資産運用」、又は「証券」である場合、マッピングにより当該ユーザグループタグと株式業務、基金業務、債券業務、先物業務又は保険業務等などのグループ業務を関連付け、また、ユーザグループタグが「保険」である場合、マッピングにより当該ユーザグループタグと財産保険業務、生命保険業務、自動車保険業務、海上保険業務などのグループ業務を関連付け、また、ユーザグループタグが「生命保険」である場合、マッピングにより当該ユーザグループタグと生命保険業務（投資型、貯蓄型、個人年金型又は通常型などを含む）、健康保険業務又は損害保険業務などのグループ業務を関連付け、そしてユーザグループタグとグループ業務のマッピング関係を、例えばリストなどの形で記憶する。

各データソースのユーザグループタグが識別された後、記憶されているユーザグループタグとグループ業務のマッピング関係に基づき対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信し、例えば、グループ業務の営業マンの端末に送信し、そして営業マンは当該データソースにおける全てのユーザに対してグループ業務のカスタマイズを行って業務内容を説明する。

従来技術と比べて、本実施例は、所定の各データソースにおけるユーザ生成コンテンツを取得し、ユーザグループタグ識別モデルを用いて各データソースに対応するユーザグループタグを識別し、そして各データソースに対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信するものであり、本実施例は、ユーザグループタグ識別モデルを用いて、各データソースにおけるユーザを迅速に、かつ正確に識別することで、各データソースに対応するユーザグループタグを識別し、グループ的なデータソースに対応するユーザグループタグに基づき、グループ業務のカスタマイズを行うことにより、広範囲で業務カスタマイズを行い、業務カスタマイズの効率を高めることができる。

好ましい実施例として、上記の図１の実施例をベースに、ユーザグループタグ識別モデルを速く解くために、その解くプロセスは反復法で解くステップを含み、当該ステップは、微分した結果を０とする式を求めることを目的とする。当該反復法で解くステップは、次のとおりである。

確定するデータソースの挙動属性の分布関数を仮定し、
と記し、ただし
である。
と仮定し、ユーザの挙動属性の確率分布を解くとき、上記の最適化関数により、
を得て、
不等式-logα≧αにより、
＝
を得て、
また、イェンセンの不等式（Ｊｅｎｓｅｎ’ｓｉｎｅｑｕａｌｉｔｙ）
により、
を得て、微分すると、
（微分した結果を０とする式）を得る。

好ましくは、上記の反復法でユーザグループタグ識別モデルを解く各ステップにおいて、さらに微分的手法により反復法で解き、これによって上記の式
を０とするときの近似解を速く解くことを目的とする。

式
を
と仮定し、各反復法で解くステップでは、いずれも微分した結果を０とするが、この式はae^bx+cx+d=0に類似する形式で、解くのは困難であるため、Ｎｅｗｔｏｎ−Ｒａｐｈｓｏｎ法で解く。つまり、ｘが極めて小さな値であるため、
となり、
であるため、
このように繰り返せば、
（上記の微分した結果を０とする式の近似解）を得て、
となると終了し（ただしは収束精度をコントロールする値）、解くプロセスが完了する。

好ましい実施例として、上記の図２の実施例をベースに、トレーニングにより、データソースのユーザグループタグを迅速に、かつ正確に識別するモデルを得るために、前記データソースに基づく業務カスタマイズシステムが処理手段１２により実行されてステップＳ１を行う前に、さらに、次に示すステップＳ０１、ステップＳ０２、ステップＳ０３及びステップＳ０４を行う。

ステップＳ０１において、所定の数（例えば１０００個）のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記する。ただし、各グループデータサンプルに、１つ又は複数のユーザグループタグを注記し、ユーザグループタグは例えば、「資産運用」、「保険」などである。

ステップＳ０２において、前記グループデータサンプルを所定の第１比率（例えば５０％）を占めるトレーニングセットと所定の第２比率を占める検証セット（例えば２５％）に分け、ただし前記第１比率と第２比率の和は１以下である。

ステップＳ０３において、前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証する。

ステップＳ０４において、正確度が所定の閾値（例えば９８．５％）より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップＳ２におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、例えば、データソースを３００個増加し、そして増加分のデータソースを含めて再度トレーニングを行う。

図４は、本発明のデータソースに基づく業務カスタマイズ方法の一実施例のフローチャートを示す。図４によると、当該データソースに基づく業務カスタマイズ方法は、次に示すステップＳ１、ステップＳ２、及びステップＳ３を含む。

好ましくは、ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立されるモデルであり、エントロピーを最大にする確率分布をユーザの挙動属性の確率分布とし、ユーザグループタグ識別モデルのモデル定義関数は、ユーザの挙動属性の分布関数を含み、ユーザの挙動属性の分布関数は各ユーザに対応する挙動属性の確率分布状况を記述する。ユーザの挙動属性の分布関数は、
である。当該ユーザの挙動属性の分布関数は指数分布関数であり、ただし、ｘはユーザ、ｙはユーザタグ（例えば、「資産運用」、「証券」、「保険」など）、f_j(x,y)はユーザｘのｊ番目の挙動属性（ユーザの挙動属性とはデータソースにおけるその動作を指し、例えば、データソースでのコンテンツ発表や発言などである）、Ｆはユーザｘの挙動属性の総数、λ_ｊ,ｙ＝｛λ_１,ｙ，λ_２,ｙ，λ_３,ｙ，・・・，λ_F,ｙ｝はユーザの挙動属性の確率分布（すなわち）、Ｚ（ｘ）は正規化因子である。Ｚ（ｘ）は正規化によりユーザの挙動属性の分布関数
を［０，１］にリスケーリングするためのものであり、その値は
である。

さらに、上記のユーザの挙動属性の分布関数によると、ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、最適化関数は最適解、又は最大の評価値を求めるアルゴリズムを構築するためのものであり、前記最適化関数は、
であり、ただし、λ_ｊ,ｙは
とし（すなわちユーザの挙動属性の確率分布）、P(x_i,y_i)はユーザグループタグにおけるユーザｘ_ｉのタグｙ_ｉの出現確率、
はユーザの挙動属性の尤度関数、
は正規化因子、βは最適化関数の正規化の度合いをコントロールするパラメータである。βの値の範囲は［０，１］、好ましくはβ＝０．６である。

本実施例では、予めマッピングによりユーザグループタグと対応するグループ業務を関連付け、例えば、ユーザグループタグが「資産運用」、又は「証券」である場合、マッピングにより当該ユーザグループタグと株式業務、基金業務、債券業務、先物業務又は保険業務等などのグループ業務を関連付け、また、ユーザグループタグが「保険」である場合、マッピングにより当該ユーザグループタグと財産保険業務、生命保険業務、自動車保険業務、海上保険業務などのグループ業務を関連付け、また、ユーザグループタグが「生命保険」である場合、マッピングにより当該ユーザグループタグと生命保険業務（投資型、貯蓄型、個人年金型又は通常型などを含む）、健康保険業務、損害保険業務などのグループ業務を関連付け、そしてユーザグループタグとグループ業務のマッピング関係を、例えばリストなどの形で記憶する。

好ましい実施例として、上記の図４の実施例をベースに、ユーザグループタグ識別モデルを速く解くために、その解くプロセスは反復法で解くステップを含み、当該ステップは、微分した結果を０とする式を求めることを目的とする。当該反復法で解くステップは、次のとおりである。

好ましい実施例として、図５に示すように、上記の図４の実施例をベースに、トレーニングにより、データソースのユーザグループタグを迅速に、かつ正確に識別するモデルを得るために、ステップＳ１前に、さらに、次に示すステップＳ０１、ステップＳ０２、ステップＳ０３及びステップＳ０４を含む。

本発明は、コンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ読み取り可能な記憶媒体に、データソースに基づく業務カスタマイズシステムが記憶されており、前記データソースに基づく業務カスタマイズシステムが処理手段により実行するとき、上記のデータソースに基づく業務カスタマイズ方法のステップを実現する。

本発明の実施例に付与した番号は、記載上の便宜を図るためのものに過ぎず、実施例に優劣をつけるものではない。

当業者は、実施形態に関する上記の記載により、上記の実施例の方法は、ソフトウェアと必要な汎用ハードウェアプラットフォームを組み合わせる方式でも、ハードウェアでも実現できるが、多くの場合には、前者がより好ましい実施形態であることを理解できるであろう。これにより、本発明の技術的解決手段の趣旨又は従来技術について改良した部分を、ソフトウェア製品の形で表現でき、当該コンピュータソフトウェア製品は、１つの記憶媒体（例えば、ＲＯＭ／ＲＡＭ、磁気ディスク、ＣＤＲＯＭ）に記憶されており、且つ、端末機器（例えば、携帯電話、コンピュータ、サーバ、空調装置、又はネットワーク機器）により本発明の各実施例に記載の方法を実行するための複数のコマンドを含む。

上記の内容は、本発明の好ましい実施例を記載したに過ぎず、これをもって本発明の特許請求の範囲を限定するものではなく、本発明の明細書及び図面の内容に基づいてなされた均等な構造やプロセスにおける均等な変更、又はその他の関連する技術分野への直接的もしくは間接的な適用は、いずれも本発明の特許保護の範囲に含まれるものとする。

Claims

データソースに基づく業務カスタマイズ装置であって、
記憶手段と、処理手段と、前記記憶手段に記憶されており、且つ前記処理手段上で動作するデータソースに基づく業務カスタマイズシステムとを含み、前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されるとき、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップＳ１と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップＳ２と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップＳ３と、を実現することを特徴とするデータソースに基づく業務カスタマイズ装置。
前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
であり、ただし、前記ｘはユーザ、前記ｙはユーザタグ、前記ｆ_ｊ（ｘ，ｙ）はユーザｘのｊ番目の特徴の属性、λ_ｊ,ｙ＝｛λ_１,ｙ，λ_２,ｙ，λ_３,ｙ,・・・,λ_F,ｙ｝はユーザの挙動属性の確率分布、前記Ｚ（ｘ）は正規化因子であることを特徴とする請求項１に記載のデータソースに基づく業務カスタマイズ装置。
前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
であり、ただし、前記P(x_i,y_ｉ)はユーザグループタグにおけるユーザｘ_ｉのタグｙ_ｉの出現確率、前記
はユーザの挙動属性の尤度関数、前記
は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項２に記載のデータソースに基づく業務カスタマイズ装置。
前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項２又は請求項３に記載のデータソースに基づく業務カスタマイズ装置。
前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されてステップＳ１を行う前に、さらに、
所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記するステップＳ０１と、
前記グループデータサンプルを所定の第１比率を占めるトレーニングセットと所定の第２比率を占める検証セットに分ける（ただし前記第１比率と第２比率の和は１以下である）ステップＳ０２と、
前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証するステップＳ０３と、
正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップＳ２におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うステップＳ０４と、を行うことを特徴とする請求項１、請求項２又は請求項３に記載のデータソースに基づく業務カスタマイズ装置。
データソースに基づく業務カスタマイズ方法であって、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップＳ１と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップＳ２と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップＳ３と、を含むことを特徴とするデータソースに基づく業務カスタマイズ方法。
前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
であり、ただし、前記ｘはユーザ、前記ｙはユーザタグ、前記ｆ_ｊ（ｘ，ｙ）はユーザｘのｊ番目の特徴の属性、λ_ｊ,ｙ＝｛λ_１,ｙ，λ_２,ｙ，λ_３,ｙ,・・・,λ_F,ｙ｝はユーザの挙動属性の確率分布、前記Ｚ（ｘ）は正規化因子であることを特徴とする請求項６に記載のデータソースに基づく業務カスタマイズ方法。
前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
であり、前記P(x_i,y_i)はユーザグループタグにおけるユーザｘ_ｉのタグｙ_ｉの出現確率、前記
はユーザの挙動属性の尤度関数、前記
は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項７に記載のデータソースに基づく業務カスタマイズ方法。
前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項７又は請求項８に記載のデータソースに基づく業務カスタマイズ方法。
前記ステップＳ１を行う前に、
所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記するステップＳ０１と、
前記グループデータサンプルを所定の第１比率を占めるトレーニングセットと所定の第２比率を占める検証セットに分ける（ただし前記第１比率と第２比率の和は１以下である）ステップＳ０２と、
前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証するステップＳ０３と、
正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップＳ２におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うステップＳ０４と、を行うことを特徴とする請求項６、請求項７又は請求項８に記載のデータソースに基づく業務カスタマイズ方法。
データソースに基づく業務カスタマイズシステムであって、
所定の各データソースにおけるユーザ生成コンテンツを取得する取得モジュールと、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別する識別モジュールと、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行う決定モジュールと、を含むことを特徴とするデータソースに基づく業務カスタマイズシステム。
前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
であり、ただし、前記ｘはユーザ、前記ｙはユーザタグ、前記ｆ_ｊ（ｘ，ｙ）はユーザｘのｊ番目の特徴の属性、λ_ｊ,ｙ＝｛λ_１,ｙ，λ_２,ｙ，λ_３,ｙ，・・・，λ_F,ｙ｝はユーザの挙動属性の確率分布、前記Ｚ（ｘ）は正規化因子であることを特徴とする請求項１１に記載のデータソースに基づく業務カスタマイズシステム。
前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
であり、ただし、前記P(x_i,y_i)はユーザグループタグにおけるユーザｘ_ｉのタグｙ_ｉの出現確率、前記
はユーザの挙動属性の尤度関数、前記
は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項１２に記載のデータソースに基づく業務カスタマイズシステム。
前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項１２又は請求項１３に記載のデータソースに基づく業務カスタマイズシステム。
所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記し、さらに、前記グループデータサンプルを所定の第１比率を占めるトレーニングセットと所定の第２比率を占める検証セットに分け、ただし前記第１比率と第２比率の和は１以下であり、さらに、前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証し、さらに、正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルを前記ユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うトレーニングモジュールをさらに含むことを特徴とする請求項１１、請求項１２又は請求項１３に記載のデータソースに基づく業務カスタマイズシステム。
コンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ読み取り可能な記憶媒体に、データソースに基づく業務カスタマイズシステムが記憶されており、前記データソースに基づく業務カスタマイズシステムが処理手段により実行されるとき、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップＳ１と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップＳ２と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップＳ３と、を実現することを特徴とするコンピュータ読み取り可能な記憶媒体。
前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
であり、ただし、前記ｘはユーザ、前記ｙはユーザタグ、前記ｆ_ｊ（ｘ，ｙ）はユーザｘのｊ番目の特徴の属性、λ_ｊ,ｙ＝｛λ_１,ｙ，λ_２,ｙ，λ_３,ｙ，・・・，λ_F,ｙ｝はユーザの挙動属性の確率分布、前記Ｚ（ｘ）は正規化因子であることを特徴とする請求項１６に記載のコンピュータ読み取り可能な記憶媒体。
前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
であり、ただし、前記P(x_i,y_i)はユーザグループタグにおけるユーザｘ_ｉのタグｙ_ｉの出現確率、前記
はユーザの挙動属性の尤度関数、前記
は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項１７に記載のコンピュータ読み取り可能な記憶媒体。
前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項１７又は請求項１８に記載のコンピュータ読み取り可能な記憶媒体。
前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されてステップＳ１を行う前に、さらに、
所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記するステップＳ０１と、
前記グループデータサンプルを所定の第１比率を占めるトレーニングセットと所定の第２比率を占める検証セットに分ける（ただし前記第１比率と第２比率の和は１以下である）ステップＳ０２と、
前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証するステップＳ０３と、
正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップＳ２におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うステップＳ０４と、を行うことを特徴とする請求項１６、請求項１７又は請求項１８に記載のコンピュータ読み取り可能な記憶媒体。