JP2019519009A - データソースに基づく業務カスタマイズ装置、方法、システム及び記憶媒体 - Google Patents

データソースに基づく業務カスタマイズ装置、方法、システム及び記憶媒体 Download PDF

Info

Publication number
JP2019519009A
JP2019519009A JP2018537628A JP2018537628A JP2019519009A JP 2019519009 A JP2019519009 A JP 2019519009A JP 2018537628 A JP2018537628 A JP 2018537628A JP 2018537628 A JP2018537628 A JP 2018537628A JP 2019519009 A JP2019519009 A JP 2019519009A
Authority
JP
Japan
Prior art keywords
user
data source
group
identification model
user group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018537628A
Other languages
English (en)
Other versions
JP6573418B2 (ja
Inventor
健宗 王
健宗 王
章成 黄
章成 黄
天博 呉
天博 呉
京 肖
京 肖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Publication of JP2019519009A publication Critical patent/JP2019519009A/ja
Application granted granted Critical
Publication of JP6573418B2 publication Critical patent/JP6573418B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本発明は、データソースに基づく業務カスタマイズ装置、方法、システム及びコンピュータ読み取り可能な記憶媒体に関する。データソースに基づく業務カスタマイズ装置は、記憶手段と、処理手段と、記憶手段に記憶されており、且つ処理手段上で動作するデータソースに基づく業務カスタマイズシステムとを含み、データソースに基づく業務カスタマイズシステムが処理手段により実行されるとき、所定の各データソースにおけるユーザ生成コンテンツを取得するステップと、予めトレーニングして生成されるユーザグループタグ識別モデルを用いてユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップと、ユーザグループタグとグループ業務との所定のマッピング関係に基づき、各データソースに対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信して各データソースについてグループ業務のカスタマイズを行うステップとを実現する。本発明は広範囲で業務カスタマイズを行って、業務カスタマイズの効率を高めることができる。

Description

「関連出願の相互参照」
本願は、パリ条約に基づき、2017年5月5日に出願された中国特許出願第2017103139950号の「データソースに基づく業務カスタマイズ装置、方法及びコンピュータ読み取り可能な記憶媒体」と題する中国特許出願の優先権を主張し、当該出願の全体が参照によりここに組み込まれる。
本発明は、インターネット技術分野に関し、特にデータソースに基づく業務カスタマイズ装置、方法、システム及びコンピュータ読み取り可能な記憶媒体に関する。
ユーザ生成コンテンツ(User Generated Content、UGC)は、ユーザがウェブサイトやその他の公開媒体を活用して生成するコンテンツである。このようなコンテンツとして、ウェイボー(ミニブログサイト)や掲示板への投稿、ユーザが自ら製作するオーディオとビデオ、Q&A、各種のニュースが挙げられ、単独で伝達して表示したり再生させたりできる。現在、銀行や保険会社など、多くの金融会社は、このようなユーザ生成コンテンツに基づき分析して、ユーザごとに挙動特徴タグを決定し、当該タグに基づき、対応する業務をカスタマイズし、業務内容を説明するようにしている。
しかしながら、ユーザごとに挙動特徴タグを決定し、業務のカスタマイズを行うという従来の方法では、インターネットに膨大なユーザ生成コンテンツが流れるために効率が低く、業務をカスタマイズする際に大きな限界がある。
本発明は、グループ的なデータソースに基づき、広範囲で業務カスタマイズを行って、業務カスタマイズの効率を高めるために、データソースに基づく業務カスタマイズ装置、方法、システム及びコンピュータ読み取り可能な記憶媒体を提供することを目的とする。
上記の目的を達成すべく、本発明は、データソースに基づく業務カスタマイズ装置を提供し、前記データソースに基づく業務カスタマイズ装置は、記憶手段と、処理手段と、前記記憶手段に記憶されており、且つ前記処理手段上で動作するデータソースに基づく業務カスタマイズシステムと、を含み、前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されるとき、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップS1と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップS2と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップS3と、を実現する。
上記の目的を達成すべく、本発明は、データソースに基づく業務カスタマイズ方法をさらに提供し、前記データソースに基づく業務カスタマイズ方法は、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップS1と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップS2と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップS3と、を含む
上記の目的を達成すべく、本発明は、データソースに基づく業務カスタマイズシステムをさらに提供し、前記データソースに基づく業務カスタマイズシステムは、
所定の各データソースにおけるユーザ生成コンテンツを取得する取得モジュールと、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別する識別モジュールと、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行う決定モジュールと、を含む。
本発明は、コンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ読み取り可能な記憶媒体に、データソースに基づく業務カスタマイズシステムが記憶されており、前記データソースに基づく業務カスタマイズシステムが処理手段により実行されるとき、
所定の各データソースにおけるユーザ生成コンテンツを取得するステップS1と、
予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップS2と、
ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップS3と、を実現する。
本発明は、所定の各データソースにおけるユーザ生成コンテンツを取得し、ユーザグループタグ識別モデルを用いて各データソースに対応するユーザグループタグを識別し、そして各データソースに対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信するものであり、本発明は、ユーザグループタグ識別モデルを用いて、各データソースにおけるユーザを迅速に、かつ正確に識別することで、各データソースに対応するユーザグループタグを識別し、グループ的なデータソースに対応するユーザグループタグに基づき、グループ業務のカスタマイズを行うことにより、広範囲で業務カスタマイズを行い、業務カスタマイズの効率を高めることができる。
本発明の各実施例を実現する環境の非限定例の概略図である。 図1のデータソースに基づく業務カスタマイズ装置の一実施例のハードウェア構成の概略図である。 本発明のデータソースに基づく業務カスタマイズシステムの一実施例の概略構造図である。 本発明のデータソースに基づく業務カスタマイズ方法の実施例1のフローチャートである。 本発明のデータソースに基づく業務カスタマイズ方法の実施例2のフローチャートである。
本発明の目的、技術的解決手段及び利点をより明瞭にするために、以下に、実施例及び図面を踏まえて本発明を詳細に説明する。ただし、本明細書に記載される実施例は、本発明を限定せず、説明的なものに過ぎない。当業者は、本発明の実施例に基づき、創造的な労働をすることなく得られる他の全ての実施例は、本発明の保護範囲に含まれるものとする。
なお、本明細書における「第1」、「第2」などの用語は、記載上の便宜を図るためのものに過ぎず、重要性を示唆するものでも、技術的特徴の数を示すものでもない。これにより、「第1」又は「第2」で限定される特徴は、少なくとも1つの当該特徴を含み、又はそれらしき意味を成すものである。また、各実施例による技術的解決手段を互いに組み合わせることはできるが、ただし、このような組み合わせは当業者が実現可能な範囲に限定されており、技術的解決手段の組み合わせによって矛盾が生じたり、実現できなかったりする場合は、当該技術的解決手段の組み合わせを認めず、本発明が請求する保護範囲にないものとする。
図1は、本発明の各実施例を実現する環境の非限定例の概略図を示す。図1によると、本実施例において、本発明は、データソースに基づく業務カスタマイズ装置1、端末2、及びネットワーク3からなる環境を含むが、これらに限定されない環境に用いることができる。データソースに基づく業務カスタマイズ装置1は、例えば、携帯電話、スマートフォン、ノートPC、ブロードキャストレシーバ、パーソナルデジタルアシスタント(PDA)、タブレットPC、ポータブルメディアプレーヤ(PMP)、ナビゲーション装置などの携帯型機器、又はデジタルTV、デスクトップPC、ノートPC、サーバなどの固定端末である。端末機器2は、キーボード、マウス、リモートコントローラ、タッチパッド、又は音声制御機器などの手段によりユーザとマンマシンインタラクションを行うあらゆる電子製品、例えば、PC、タブレットPC、スマートフォン、パーソナルデジタルアシスタント、ゲーム機、インターネットプロトコル放送テレビ(Internet Protocol Television、IPTV)、ウェアラブル端末、ナビゲーション装置などの携帯型機器、又はデジタルTV、デスクトップPC、ノートPC、サーバなどの固定端末を含むが、これらに限定されない。ネットワーク3は、例えば、イントラネット(Intranet)、インターネット(Internet)、GSM(登録商標)(Global System of Mobile communication)、WCDMA(登録商標)(Wideband Code Division Multiple Access)、4Gネットワーク、5Gネットワーク、ブルートゥース(登録商標)(Bluetooth(登録商標))、Wi−Fiなどの無線又は有線ネットワークである。データソースに基づく業務カスタマイズ装置1はネットワーク3を介して1つ又は複数の端末2とそれぞれ通信接続を確立する。
データソースに基づく業務カスタマイズ装置1は、予め設定された又は記憶されているコマンドに従って、数値計算及び/又は情報処理を自動的に行う機器である。データソースに基づく業務カスタマイズ装置1として、コンピュータ、単一のネットワークサーバ、複数のネットワークサーバからなるサーバ群、もしくはクラウドコンピューティングに基づく大量のホストやネットワークサーバからなるクラウド型機器が挙げられ、クラウドコンピューティングとは、分散コンピューティングの1種であり、疎結合されている複数のコンピュータクラスターからなる大型仮想コンピュータを指すものである。
図2は、図1のデータソースに基づく業務カスタマイズ装置1に係るハードウェア構成の非限定例の概略図を示す。図2によると、本実施例では、データソースに基づく業務カスタマイズ装置1が、システムバスなどを介して互いに通信可能に接続される記憶手段11と、処理手段12と、ネットワークインタフェース13とを含むが、これらに限定されない。図2は要素11、要素12、及び要素13を備えるデータソースに基づく業務カスタマイズ装置1を示しているが、必ずしも示された全ての要素で実施するとは限らず、代替案として、より多い又はより少ない数の要素で実施してもよい。
このうち、記憶手段11は少なくとも1つのタイプの読み取り可能な記憶媒体を含む。前記読み取り可能な記憶媒体は、フラッシュメモリ、ハードディスク、マルチメディアカード、カード型記憶手段(例えば、SD又はDXメモリ)、ランダムアクセスメモリ(RAM)、スタティックランダムアクセスメモリ(SRAM)、読み取り専用メモリ(ROM)、電気的消去可能なプログラマブル読み取り専用メモリ(EEPROM)、プログラマブル読み取り専用メモリ(PROM)、磁気記憶手段、磁気ディスク、CDROMなどの不揮発性記憶媒体を含む。いくつかの実施例では、記憶手段11が、データソースに基づく業務カスタマイズ装置1の内部記憶手段、例えば、データソースに基づく業務カスタマイズ装置1のハードディスク又はメモリであり、別の実施例では、記憶手段11が、データソースに基づく業務カスタマイズ装置1の外部記憶手段、例えば、データソースに基づく業務カスタマイズ装置1に搭載される外付けハードディスク、スマートメディアカード(Smart Media(登録商標) Card、SMC)、セキュアデジタル(Secure Digital、SD)カード、フラッシュカード(Flash Card)などである。なお、記憶手段11は、データソースに基づく業務カスタマイズ装置1の内部記憶手段とその外部記憶手段の両方を含んでもよい。本実施例では、記憶手段11が一般的に、データソースに基づく業務カスタマイズ装置1にインストールされるオペレーティングシステム及び各種アプリケーションソフトウェア、例えば、前記データソースに基づく業務カスタマイズシステムのプログラムコードなどを記憶するために用いられる。また、記憶手段11は、すでに出力された又は出力する各種データを一時的に記憶するためにも用いられる。
いくつかの実施例では、処理手段12が、例えば、中央処理装置(Central Processing Unit、CPU)、コントローラ、マイクロコントローラ、マイクロプロセッサ、又はその他のデータ処理チップである。処理手段12は一般的に、データソースに基づく業務カスタマイズ装置1全体の動作、例えば、端末機器2とのデータ交換又は通信に関連する制御や処理などの実行を制御するために用いられる。本実施例では、処理手段12が、記憶手段11に記憶されているプログラムコードを実行し又はデータを処理し、例えば、前記データソースに基づく業務カスタマイズシステムなどを実行するために用いられる。
ネットワークインタフェース13は、無線ネットワークインタフェース、又は有線ネットワークインタフェースを含んでもよい。ネットワークインタフェース13は一般的に、データソースに基づく業務カスタマイズ装置1とその他の電子機器の間に通信接続を確立するために用いられる。本実施例では、ネットワークインタフェース13は主に、ネットワーク3を介してデータソースに基づく業務カスタマイズ装置1と1つ又は複数の端末2を接続させることで、データを伝送するチャンネルと通信接続を確立するために用いられる。
データソースに基づく業務カスタマイズシステムは、記憶手段11に記憶されており、記憶手段11に記憶されている少なくとも1つのコンピュータ読み取り可能なコマンドを含み、前記少なくとも1つのコンピュータ読み取り可能なコマンドが処理手段12により実行されることで、本発明の各実施例のブロックチェーンにおける取引方法を実現する。上記のとおり、当該少なくとも1つのコンピュータ読み取り可能なコマンドは、その各部分で実現する機能の違いにより、異なる論理モジュールに分けることができ、例えば、図3に示すように、取得モジュール、識別モジュール及び決定モジュールを含む。
前記データソースに基づく業務カスタマイズシステムが処理手段12により実行されるとき、次に示すステップS1、ステップS2、及びステップS3を実現する。
ステップS1において、所定の各データソースにおけるユーザ生成コンテンツを取得する。
本実施例では、所定のデータソースは、例えば、ミニブログサイト、掲示板又はニュースサイトなどである。データソースには大量のユーザが登録しており、ユーザは誰でも自らユーザ生成コンテンツを製作することができる。
本実施例では、業務カスタマイズシステムが各データソースにおけるユーザ生成コンテンツをリアルタイムに取得することで、各データソースから最新のユーザ生成コンテンツを取得してもよいが、システムの負荷を減らすため、各データソースにおけるユーザ生成コンテンツを定時的に(例えば1時間ごとに)取得してもよい。
具体的には、データソースにユーザ生成コンテンツが生成されると、そのユーザ生成コンテンツを自動的に前記業務カスタマイズシステムに送信し、又は所定のサーバの記憶エリアに記憶し、そして業務カスタマイズシステムにより当該サーバから当該ユーザ生成コンテンツを取得してもよい。
ステップS2において、予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別する。
ただし、予めトレーニングして生成されるユーザグループタグ識別モデルは機械学習モデル、例えば、サポートベクターマシンモデル、ランダムフォレストモデルなどであり、当然のことながら、これら以外のモデルでもよい。
好ましくは、ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立されるモデルであり、エントロピーを最大にする確率分布をユーザの挙動属性の確率分布とし、ユーザグループタグ識別モデルのモデル定義関数は、ユーザの挙動属性の分布関数を含み、ユーザの挙動属性の分布関数は各ユーザに対応する挙動属性の確率分布状况を記述する。ユーザの挙動属性の分布関数は、
である。当該ユーザの挙動属性の分布関数は指数分布関数であり、ただし、xはユーザ、yはユーザタグ(例えば、「資産運用」、「証券」、「保険」など)、f(x,y)はユーザxのj番目の挙動属性(ユーザの挙動属性とはデータソースにおけるその動作を指し、例えば、データソースでのコンテンツ発表や発言などである)、Fはユーザxの挙動属性の総数、λj,y={λ1,y,λ2,y,λ3,y,・・・,λF,y}はユーザの挙動属性の確率分布(すなわち)、Z(x)は正規化因子である。Z(x)は正規化によりユーザの挙動属性の分布関数
を[0,1]にリスケーリングするためのものであり、その値は
である。
本実施例では、最大エントロピー原理に基づき確立されるユーザグループタグ識別モデルは、各データソースのユーザグループタグを迅速に、かつ正確に識別するためのものである。
さらに、上記のユーザの挙動属性の分布関数によると、ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、最適化関数は最適解、又は最大の評価値を求めるアルゴリズムを構築するためのものであり、前記最適化関数は、
であり、ただし、λj,y
とし(すなわちユーザの挙動属性の確率分布)、P(xi,yi)はユーザグループタグにおけるユーザxのタグyの出現確率、
はユーザの挙動属性の尤度関数、
は正規化因子、βは最適化関数の正規化の度合いをコントロールするパラメータである。βの値の範囲は[0,1]、好ましくはβ=0.6である。
argmaxは最大点作用素を探索し、いずれのユーザにおいても最大値となるように解くことを意味し、そして各データソースのユーザグループタグはで表すことができる。
ステップS3において、ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行う。
本実施例では、予めマッピングによりユーザグループタグと対応するグループ業務を関連付け、例えば、ユーザグループタグが「資産運用」、又は「証券」である場合、マッピングにより当該ユーザグループタグと株式業務、基金業務、債券業務、先物業務又は保険業務等などのグループ業務を関連付け、また、ユーザグループタグが「保険」である場合、マッピングにより当該ユーザグループタグと財産保険業務、生命保険業務、自動車保険業務、海上保険業務などのグループ業務を関連付け、また、ユーザグループタグが「生命保険」である場合、マッピングにより当該ユーザグループタグと生命保険業務(投資型、貯蓄型、個人年金型又は通常型などを含む)、健康保険業務又は損害保険業務などのグループ業務を関連付け、そしてユーザグループタグとグループ業務のマッピング関係を、例えばリストなどの形で記憶する。
各データソースのユーザグループタグが識別された後、記憶されているユーザグループタグとグループ業務のマッピング関係に基づき対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信し、例えば、グループ業務の営業マンの端末に送信し、そして営業マンは当該データソースにおける全てのユーザに対してグループ業務のカスタマイズを行って業務内容を説明する。
従来技術と比べて、本実施例は、所定の各データソースにおけるユーザ生成コンテンツを取得し、ユーザグループタグ識別モデルを用いて各データソースに対応するユーザグループタグを識別し、そして各データソースに対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信するものであり、本実施例は、ユーザグループタグ識別モデルを用いて、各データソースにおけるユーザを迅速に、かつ正確に識別することで、各データソースに対応するユーザグループタグを識別し、グループ的なデータソースに対応するユーザグループタグに基づき、グループ業務のカスタマイズを行うことにより、広範囲で業務カスタマイズを行い、業務カスタマイズの効率を高めることができる。
好ましい実施例として、上記の図1の実施例をベースに、ユーザグループタグ識別モデルを速く解くために、その解くプロセスは反復法で解くステップを含み、当該ステップは、微分した結果を0とする式を求めることを目的とする。当該反復法で解くステップは、次のとおりである。
確定するデータソースの挙動属性の分布関数を仮定し、
と記し、ただし
である。
と仮定し、ユーザの挙動属性の確率分布を解くとき、上記の最適化関数により、
を得て、
不等式-logα≧αにより、

を得て、
また、イェンセンの不等式(Jensen’s inequality)
により、
を得て、微分すると、
(微分した結果を0とする式)を得る。
好ましくは、上記の反復法でユーザグループタグ識別モデルを解く各ステップにおいて、さらに微分的手法により反復法で解き、これによって上記の式
を0とするときの近似解を速く解くことを目的とする。


と仮定し、各反復法で解くステップでは、いずれも微分した結果を0とするが、この式はaebx+cx+d=0に類似する形式で、解くのは困難であるため、Newton−Raphson法で解く。つまり、xが極めて小さな値であるため、
となり、
であるため、
このように繰り返せば、
(上記の微分した結果を0とする式の近似解)を得て、
となると終了し(ただしは収束精度をコントロールする値)、解くプロセスが完了する。
好ましい実施例として、上記の図2の実施例をベースに、トレーニングにより、データソースのユーザグループタグを迅速に、かつ正確に識別するモデルを得るために、前記データソースに基づく業務カスタマイズシステムが処理手段12により実行されてステップS1を行う前に、さらに、次に示すステップS01、ステップS02、ステップS03及びステップS04を行う。
ステップS01において、所定の数(例えば1000個)のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記する。ただし、各グループデータサンプルに、1つ又は複数のユーザグループタグを注記し、ユーザグループタグは例えば、「資産運用」、「保険」などである。
ステップS02において、前記グループデータサンプルを所定の第1比率(例えば50%)を占めるトレーニングセットと所定の第2比率を占める検証セット(例えば25%)に分け、ただし前記第1比率と第2比率の和は1以下である。
ステップS03において、前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証する。
ステップS04において、正確度が所定の閾値(例えば98.5%)より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップS2におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、例えば、データソースを300個増加し、そして増加分のデータソースを含めて再度トレーニングを行う。
図4は、本発明のデータソースに基づく業務カスタマイズ方法の一実施例のフローチャートを示す。図4によると、当該データソースに基づく業務カスタマイズ方法は、次に示すステップS1、ステップS2、及びステップS3を含む。
ステップS1において、所定の各データソースにおけるユーザ生成コンテンツを取得する。
本実施例では、所定のデータソースは、例えば、ミニブログサイト、掲示板又はニュースサイトなどである。データソースには大量のユーザが登録しており、ユーザは誰でも自らユーザ生成コンテンツを製作することができる。
本実施例では、業務カスタマイズシステムが各データソースにおけるユーザ生成コンテンツをリアルタイムに取得することで、各データソースから最新のユーザ生成コンテンツを取得してもよいが、システムの負荷を減らすため、各データソースにおけるユーザ生成コンテンツを定時的に(例えば1時間ごとに)取得してもよい。
具体的には、データソースにユーザ生成コンテンツが生成されると、そのユーザ生成コンテンツを自動的に前記業務カスタマイズシステムに送信し、又は所定のサーバの記憶エリアに記憶し、そして業務カスタマイズシステムにより当該サーバから当該ユーザ生成コンテンツを取得してもよい。
ステップS2において、予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別する。
ただし、予めトレーニングして生成されるユーザグループタグ識別モデルは機械学習モデル、例えば、サポートベクターマシンモデル、ランダムフォレストモデルなどであり、当然のことながら、これら以外のモデルでもよい。
好ましくは、ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立されるモデルであり、エントロピーを最大にする確率分布をユーザの挙動属性の確率分布とし、ユーザグループタグ識別モデルのモデル定義関数は、ユーザの挙動属性の分布関数を含み、ユーザの挙動属性の分布関数は各ユーザに対応する挙動属性の確率分布状况を記述する。ユーザの挙動属性の分布関数は、
である。当該ユーザの挙動属性の分布関数は指数分布関数であり、ただし、xはユーザ、yはユーザタグ(例えば、「資産運用」、「証券」、「保険」など)、fj(x,y)はユーザxのj番目の挙動属性(ユーザの挙動属性とはデータソースにおけるその動作を指し、例えば、データソースでのコンテンツ発表や発言などである)、Fはユーザxの挙動属性の総数、λj,y={λ1,y,λ2,y,λ3,y,・・・,λF,y}はユーザの挙動属性の確率分布(すなわち)、Z(x)は正規化因子である。Z(x)は正規化によりユーザの挙動属性の分布関数
を[0,1]にリスケーリングするためのものであり、その値は
である。
本実施例では、最大エントロピー原理に基づき確立されるユーザグループタグ識別モデルは、各データソースのユーザグループタグを迅速に、かつ正確に識別するためのものである。
さらに、上記のユーザの挙動属性の分布関数によると、ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、最適化関数は最適解、又は最大の評価値を求めるアルゴリズムを構築するためのものであり、前記最適化関数は、
であり、ただし、λj,y
とし(すなわちユーザの挙動属性の確率分布)、P(xi,yi)はユーザグループタグにおけるユーザxのタグyの出現確率、
はユーザの挙動属性の尤度関数、
は正規化因子、βは最適化関数の正規化の度合いをコントロールするパラメータである。βの値の範囲は[0,1]、好ましくはβ=0.6である。
argmaxは最大点作用素を探索し、いずれのユーザにおいても最大値となるように解くことを意味し、そして各データソースのユーザグループタグはで表すことができる。
ステップS3において、ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行う。
本実施例では、予めマッピングによりユーザグループタグと対応するグループ業務を関連付け、例えば、ユーザグループタグが「資産運用」、又は「証券」である場合、マッピングにより当該ユーザグループタグと株式業務、基金業務、債券業務、先物業務又は保険業務等などのグループ業務を関連付け、また、ユーザグループタグが「保険」である場合、マッピングにより当該ユーザグループタグと財産保険業務、生命保険業務、自動車保険業務、海上保険業務などのグループ業務を関連付け、また、ユーザグループタグが「生命保険」である場合、マッピングにより当該ユーザグループタグと生命保険業務(投資型、貯蓄型、個人年金型又は通常型などを含む)、健康保険業務、損害保険業務などのグループ業務を関連付け、そしてユーザグループタグとグループ業務のマッピング関係を、例えばリストなどの形で記憶する。
各データソースのユーザグループタグが識別された後、記憶されているユーザグループタグとグループ業務のマッピング関係に基づき対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信し、例えば、グループ業務の営業マンの端末に送信し、そして営業マンは当該データソースにおける全てのユーザに対してグループ業務のカスタマイズを行って業務内容を説明する。
従来技術と比べて、本実施例は、所定の各データソースにおけるユーザ生成コンテンツを取得し、ユーザグループタグ識別モデルを用いて各データソースに対応するユーザグループタグを識別し、そして各データソースに対応するグループ業務を決定し、各データソースと対応するグループ業務を所定の端末に送信するものであり、本実施例は、ユーザグループタグ識別モデルを用いて、各データソースにおけるユーザを迅速に、かつ正確に識別することで、各データソースに対応するユーザグループタグを識別し、グループ的なデータソースに対応するユーザグループタグに基づき、グループ業務のカスタマイズを行うことにより、広範囲で業務カスタマイズを行い、業務カスタマイズの効率を高めることができる。
好ましい実施例として、上記の図4の実施例をベースに、ユーザグループタグ識別モデルを速く解くために、その解くプロセスは反復法で解くステップを含み、当該ステップは、微分した結果を0とする式を求めることを目的とする。当該反復法で解くステップは、次のとおりである。
確定するデータソースの挙動属性の分布関数を仮定し、
と記し、ただし
である。
と仮定し、ユーザの挙動属性の確率分布を解くとき、上記の最適化関数により、
を得て、
不等式-logα≧αにより、

を得て、
また、イェンセンの不等式(Jensen’s inequality)
により、
を得て、微分すると、
(微分した結果を0とする式)を得る。
好ましくは、上記の反復法でユーザグループタグ識別モデルを解く各ステップにおいて、さらに微分的手法により反復法で解き、これによって上記の式
を0とするときの近似解を速く解くことを目的とする。


と仮定し、各反復法で解くステップでは、いずれも微分した結果を0とするが、この式はaebx+cx+d=0に類似する形式で、解くのは困難であるため、Newton−Raphson法で解く。つまり、xが極めて小さな値であるため、
となり、
であるため、
このように繰り返せば、
(上記の微分した結果を0とする式の近似解)を得て、
となると終了し(ただしは収束精度をコントロールする値)、解くプロセスが完了する。
好ましい実施例として、図5に示すように、上記の図4の実施例をベースに、トレーニングにより、データソースのユーザグループタグを迅速に、かつ正確に識別するモデルを得るために、ステップS1前に、さらに、次に示すステップS01、ステップS02、ステップS03及びステップS04を含む。
ステップS01において、所定の数(例えば1000個)のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記する。ただし、各グループデータサンプルに、1つ又は複数のユーザグループタグを注記し、ユーザグループタグは例えば、「資産運用」、「保険」などである。
ステップS02において、前記グループデータサンプルを所定の第1比率(例えば50%)を占めるトレーニングセットと所定の第2比率を占める検証セット(例えば25%)に分け、ただし前記第1比率と第2比率の和は1以下である。
ステップS03において、前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証する。
ステップS04において、正確度が所定の閾値(例えば98.5%)より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップS2におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、例えば、データソースを300個増加し、そして増加分のデータソースを含めて再度トレーニングを行う。
本発明は、コンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ読み取り可能な記憶媒体に、データソースに基づく業務カスタマイズシステムが記憶されており、前記データソースに基づく業務カスタマイズシステムが処理手段により実行するとき、上記のデータソースに基づく業務カスタマイズ方法のステップを実現する。
本発明の実施例に付与した番号は、記載上の便宜を図るためのものに過ぎず、実施例に優劣をつけるものではない。
当業者は、実施形態に関する上記の記載により、上記の実施例の方法は、ソフトウェアと必要な汎用ハードウェアプラットフォームを組み合わせる方式でも、ハードウェアでも実現できるが、多くの場合には、前者がより好ましい実施形態であることを理解できるであろう。これにより、本発明の技術的解決手段の趣旨又は従来技術について改良した部分を、ソフトウェア製品の形で表現でき、当該コンピュータソフトウェア製品は、1つの記憶媒体(例えば、ROM/RAM、磁気ディスク、CDROM)に記憶されており、且つ、端末機器(例えば、携帯電話、コンピュータ、サーバ、空調装置、又はネットワーク機器)により本発明の各実施例に記載の方法を実行するための複数のコマンドを含む。
上記の内容は、本発明の好ましい実施例を記載したに過ぎず、これをもって本発明の特許請求の範囲を限定するものではなく、本発明の明細書及び図面の内容に基づいてなされた均等な構造やプロセスにおける均等な変更、又はその他の関連する技術分野への直接的もしくは間接的な適用は、いずれも本発明の特許保護の範囲に含まれるものとする。

Claims (20)

  1. データソースに基づく業務カスタマイズ装置であって、
    記憶手段と、処理手段と、前記記憶手段に記憶されており、且つ前記処理手段上で動作するデータソースに基づく業務カスタマイズシステムとを含み、前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されるとき、
    所定の各データソースにおけるユーザ生成コンテンツを取得するステップS1と、
    予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップS2と、
    ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップS3と、を実現することを特徴とするデータソースに基づく業務カスタマイズ装置。
  2. 前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
    であり、ただし、前記xはユーザ、前記yはユーザタグ、前記f(x,y)はユーザxのj番目の特徴の属性、λj,y={λ1,y,λ2,y,λ3,y,・・・,λF,y}はユーザの挙動属性の確率分布、前記Z(x)は正規化因子であることを特徴とする請求項1に記載のデータソースに基づく業務カスタマイズ装置。
  3. 前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
    であり、ただし、前記P(xi,y)はユーザグループタグにおけるユーザxのタグyの出現確率、前記
    はユーザの挙動属性の尤度関数、前記
    は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項2に記載のデータソースに基づく業務カスタマイズ装置。
  4. 前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項2又は請求項3に記載のデータソースに基づく業務カスタマイズ装置。
  5. 前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されてステップS1を行う前に、さらに、
    所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記するステップS01と、
    前記グループデータサンプルを所定の第1比率を占めるトレーニングセットと所定の第2比率を占める検証セットに分ける(ただし前記第1比率と第2比率の和は1以下である)ステップS02と、
    前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証するステップS03と、
    正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップS2におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うステップS04と、を行うことを特徴とする請求項1、請求項2又は請求項3に記載のデータソースに基づく業務カスタマイズ装置。
  6. データソースに基づく業務カスタマイズ方法であって、
    所定の各データソースにおけるユーザ生成コンテンツを取得するステップS1と、
    予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップS2と、
    ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップS3と、を含むことを特徴とするデータソースに基づく業務カスタマイズ方法。
  7. 前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
    であり、ただし、前記xはユーザ、前記yはユーザタグ、前記f(x,y)はユーザxのj番目の特徴の属性、λj,y={λ1,y,λ2,y,λ3,y,・・・,λF,y}はユーザの挙動属性の確率分布、前記Z(x)は正規化因子であることを特徴とする請求項6に記載のデータソースに基づく業務カスタマイズ方法。
  8. 前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
    であり、前記P(xi,yi)はユーザグループタグにおけるユーザxのタグyの出現確率、前記
    はユーザの挙動属性の尤度関数、前記
    は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項7に記載のデータソースに基づく業務カスタマイズ方法。
  9. 前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項7又は請求項8に記載のデータソースに基づく業務カスタマイズ方法。
  10. 前記ステップS1を行う前に、
    所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記するステップS01と、
    前記グループデータサンプルを所定の第1比率を占めるトレーニングセットと所定の第2比率を占める検証セットに分ける(ただし前記第1比率と第2比率の和は1以下である)ステップS02と、
    前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証するステップS03と、
    正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップS2におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うステップS04と、を行うことを特徴とする請求項6、請求項7又は請求項8に記載のデータソースに基づく業務カスタマイズ方法。
  11. データソースに基づく業務カスタマイズシステムであって、
    所定の各データソースにおけるユーザ生成コンテンツを取得する取得モジュールと、
    予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別する識別モジュールと、
    ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行う決定モジュールと、を含むことを特徴とするデータソースに基づく業務カスタマイズシステム。
  12. 前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
    であり、ただし、前記xはユーザ、前記yはユーザタグ、前記f(x,y)はユーザxのj番目の特徴の属性、λj,y={λ1,y,λ2,y,λ3,y,・・・,λF,y}はユーザの挙動属性の確率分布、前記Z(x)は正規化因子であることを特徴とする請求項11に記載のデータソースに基づく業務カスタマイズシステム。
  13. 前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
    であり、ただし、前記P(xi,yi)はユーザグループタグにおけるユーザxのタグyの出現確率、前記
    はユーザの挙動属性の尤度関数、前記
    は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項12に記載のデータソースに基づく業務カスタマイズシステム。
  14. 前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項12又は請求項13に記載のデータソースに基づく業務カスタマイズシステム。
  15. 所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記し、さらに、前記グループデータサンプルを所定の第1比率を占めるトレーニングセットと所定の第2比率を占める検証セットに分け、ただし前記第1比率と第2比率の和は1以下であり、さらに、前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証し、さらに、正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルを前記ユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うトレーニングモジュールをさらに含むことを特徴とする請求項11、請求項12又は請求項13に記載のデータソースに基づく業務カスタマイズシステム。
  16. コンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ読み取り可能な記憶媒体に、データソースに基づく業務カスタマイズシステムが記憶されており、前記データソースに基づく業務カスタマイズシステムが処理手段により実行されるとき、
    所定の各データソースにおけるユーザ生成コンテンツを取得するステップS1と、
    予めトレーニングして生成されるユーザグループタグ識別モデルを用いて前記ユーザ生成コンテンツを識別することで、各データソースに対応するユーザグループタグを識別するステップS2と、
    ユーザグループタグとグループ業務との所定のマッピング関係に基づき、前記各データソースに対応するグループ業務を決定し、前記各データソースと対応するグループ業務を所定の端末に送信して前記各データソースについてグループ業務のカスタマイズを行うステップS3と、を実現することを特徴とするコンピュータ読み取り可能な記憶媒体。
  17. 前記ユーザグループタグ識別モデルは最大エントロピー原理に基づき確立され、前記ユーザグループタグ識別モデルのモデル定義関数はユーザの挙動属性の分布関数を含み、前記ユーザの挙動属性の分布関数は
    であり、ただし、前記xはユーザ、前記yはユーザタグ、前記f(x,y)はユーザxのj番目の特徴の属性、λj,y={λ1,y,λ2,y,λ3,y,・・・,λF,y}はユーザの挙動属性の確率分布、前記Z(x)は正規化因子であることを特徴とする請求項16に記載のコンピュータ読み取り可能な記憶媒体。
  18. 前記ユーザグループタグ識別モデルのモデル定義関数はさらに最適化関数を含み、前記最適化関数は
    であり、ただし、前記P(xi,yi)はユーザグループタグにおけるユーザxのタグyの出現確率、前記
    はユーザの挙動属性の尤度関数、前記
    は正規化因子、前記βは前記最適化関数の正規化の度合いをコントロールするパラメータであることを特徴とする請求項17に記載のコンピュータ読み取り可能な記憶媒体。
  19. 前記ユーザグループタグ識別モデルを識別するプロセスは前記ユーザの挙動属性の確率分布を反復法で解くステップを含み、各反復法で解くステップにおいて、さらに微分的手法により反復法で解くことを特徴とする請求項17又は請求項18に記載のコンピュータ読み取り可能な記憶媒体。
  20. 前記データソースに基づく業務カスタマイズシステムが前記処理手段により実行されてステップS1を行う前に、さらに、
    所定の数のデータソースにおけるユーザ生成コンテンツを取得し、データソースから取得したユーザ生成コンテンツごとにグループデータサンプルとし、グループデータサンプルごとに、対応するユーザグループタグを注記するステップS01と、
    前記グループデータサンプルを所定の第1比率を占めるトレーニングセットと所定の第2比率を占める検証セットに分ける(ただし前記第1比率と第2比率の和は1以下である)ステップS02と、
    前記トレーニングセットにおけるグループデータサンプルを用いて所定のユーザグループタグ識別モデルをトレーニングし、トレーニングが完了した後、前記検証セットを用いて、トレーニングを経たユーザグループタグ識別モデルの正確度について検証するステップS03と、
    正確度が所定の閾値より大きい場合、モデルのトレーニングを終了し、トレーニングを経たユーザグループタグ識別モデルをステップS2におけるユーザグループタグ識別モデルとし、正確度が所定の閾値以下である場合、データソースの数を増加し、増加分のデータソースを含めて再度トレーニングを行うステップS04と、を行うことを特徴とする請求項16、請求項17又は請求項18に記載のコンピュータ読み取り可能な記憶媒体。
JP2018537628A 2017-05-05 2017-06-30 データソースに基づく業務カスタマイズ装置、方法、システム及び記憶媒体 Active JP6573418B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201710313995.0 2017-05-05
CN201710313995.0A CN107038256B (zh) 2017-05-05 2017-05-05 基于数据源的业务定制装置、方法及计算机可读存储介质
PCT/CN2017/091367 WO2018201601A1 (zh) 2017-05-05 2017-06-30 基于数据源的业务定制装置、方法、系统及存储介质

Publications (2)

Publication Number Publication Date
JP2019519009A true JP2019519009A (ja) 2019-07-04
JP6573418B2 JP6573418B2 (ja) 2019-09-11

Family

ID=59537283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018537628A Active JP6573418B2 (ja) 2017-05-05 2017-06-30 データソースに基づく業務カスタマイズ装置、方法、システム及び記憶媒体

Country Status (9)

Country Link
US (1) US11544639B2 (ja)
EP (1) EP3441891A4 (ja)
JP (1) JP6573418B2 (ja)
KR (1) KR102171974B1 (ja)
CN (1) CN107038256B (ja)
AU (1) AU2017408797B2 (ja)
SG (1) SG11201900260VA (ja)
TW (1) TWI677828B (ja)
WO (1) WO2018201601A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110930117A (zh) * 2019-11-21 2020-03-27 中国银行股份有限公司 一种人工智能微服务系统

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767259A (zh) * 2017-09-30 2018-03-06 平安科技(深圳)有限公司 贷款风险控制方法、电子装置及可读存储介质
WO2020149073A1 (ja) * 2019-01-18 2020-07-23 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム
CN111680108B (zh) * 2019-03-11 2023-11-03 杭州海康威视数字技术股份有限公司 一种数据存储方法、装置及一种数据获取方法、装置
CN110111814B (zh) * 2019-05-20 2021-09-21 国家计算机网络与信息安全管理中心 网络类型识别方法及装置
CN110415094A (zh) * 2019-06-18 2019-11-05 重庆金融资产交易所有限责任公司 资产负债智能管理方法、装置及计算机可读存储介质
CN110598769B (zh) * 2019-08-30 2022-06-07 京东科技控股股份有限公司 用户群体发现方法、装置、设备及计算机可读存储介质
CN111126019B (zh) * 2019-11-28 2024-01-05 泰康保险集团股份有限公司 基于模式定制的报表生成方法、装置和电子设备
CN111061566A (zh) * 2019-12-16 2020-04-24 武汉达梦数据技术有限公司 一种动态数据源查询方法及装置
CN112529628B (zh) * 2020-12-16 2024-04-09 平安科技(深圳)有限公司 客户标签的生成方法、装置、计算机设备及存储介质
CN114004456B (zh) * 2021-10-09 2024-04-09 金蝶征信有限公司 数据标签的计算方法、装置、计算机设备和存储介质
CN116028107B (zh) * 2023-02-28 2023-08-11 广州市高科通信技术股份有限公司 基于定制的设备参数管理方法、装置及存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7904369B1 (en) 2000-02-11 2011-03-08 Kapow Aps User interface, system and method for performing a web-based transaction
KR100368129B1 (ko) 2000-04-29 2003-01-15 (주)동명기술공단종합건축사사무소 전자 상거래를 위한 상품 추천 장치 및 방법
US6889222B1 (en) * 2000-12-26 2005-05-03 Aspect Communications Corporation Method and an apparatus for providing personalized service
JP2002342360A (ja) 2001-05-18 2002-11-29 Sharp Corp 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体
US8140531B2 (en) 2008-05-02 2012-03-20 International Business Machines Corporation Process and method for classifying structured data
JP5403340B2 (ja) 2009-06-09 2014-01-29 ソニー株式会社 情報処理装置および方法、並びにプログラム
CN101616356A (zh) * 2009-07-31 2009-12-30 卓望数码技术(深圳)有限公司 一种无线数据业务产品信息推送方法及系统
CN101908191A (zh) 2010-08-03 2010-12-08 深圳市她秀时尚电子商务有限公司 应用于电子商务的数据分析方法及系统
TWI534732B (zh) * 2010-11-15 2016-05-21 Alibaba Group Holding Ltd Recommended information output method, system and server
US8706716B2 (en) 2011-11-23 2014-04-22 Rawllin International Inc. Iterative and dynamic search of publicly available data based on augmentation of search terms and validation of data relevance
CN102647716B (zh) * 2012-04-01 2017-02-08 华为技术有限公司 无线应用的方法、设备和系统
WO2014053192A1 (en) * 2012-10-05 2014-04-10 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for ranking users within a network
CN103810192A (zh) 2012-11-09 2014-05-21 腾讯科技(深圳)有限公司 一种用户的兴趣推荐方法和装置
GB201307702D0 (en) * 2013-04-29 2013-06-12 Maxymiser Ltd Customer community analytics
CN104090888B (zh) 2013-12-10 2016-05-11 深圳市腾讯计算机系统有限公司 一种用户行为数据的分析方法和装置
CN103995858B (zh) * 2014-05-15 2017-06-30 北京航空航天大学 基于任务分解的个性化知识主动推送方法
CN104184824B (zh) * 2014-09-05 2018-11-06 北方工业大学 手机报定制和推送的装置及方法
CN106156127B (zh) * 2015-04-08 2020-06-16 深圳市腾讯计算机系统有限公司 选择数据内容向终端推送的方法及装置
CN106547798B (zh) * 2015-09-23 2020-07-28 阿里巴巴集团控股有限公司 信息推送方法及装置
CN108604222B (zh) * 2015-12-28 2022-03-18 云脑科技有限公司 用于部署定制机器学习服务的系统和方法
US10621497B2 (en) * 2016-08-19 2020-04-14 International Business Machines Corporation Iterative and targeted feature selection
CN106372113B (zh) * 2016-08-22 2018-03-20 上海壹账通金融科技有限公司 新闻内容的推送方法及系统
US10984666B1 (en) * 2016-11-03 2021-04-20 Massachusetts Mutual Life Insurance Company Learning engine application
CN106572173B (zh) * 2016-11-07 2020-06-09 阿里巴巴(中国)有限公司 一种配置信息更新方法、装置和系统
US11074599B2 (en) * 2016-12-08 2021-07-27 App Annie Inc. Determining usage data of mobile applications for a population

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110930117A (zh) * 2019-11-21 2020-03-27 中国银行股份有限公司 一种人工智能微服务系统

Also Published As

Publication number Publication date
US11544639B2 (en) 2023-01-03
KR102171974B1 (ko) 2020-11-02
JP6573418B2 (ja) 2019-09-11
AU2017408797B2 (en) 2020-02-27
AU2017408797A1 (en) 2018-11-22
TWI677828B (zh) 2019-11-21
US20200302346A1 (en) 2020-09-24
KR20190022440A (ko) 2019-03-06
SG11201900260VA (en) 2019-02-27
EP3441891A1 (en) 2019-02-13
WO2018201601A1 (zh) 2018-11-08
CN107038256B (zh) 2018-06-29
EP3441891A4 (en) 2019-05-08
TW201843622A (zh) 2018-12-16
CN107038256A (zh) 2017-08-11

Similar Documents

Publication Publication Date Title
JP6573418B2 (ja) データソースに基づく業務カスタマイズ装置、方法、システム及び記憶媒体
WO2022126971A1 (zh) 基于密度的文本聚类方法、装置、设备及存储介质
US9015657B2 (en) Systems and methods for developing and delivering platform adaptive web and native application content
WO2022007434A1 (zh) 可视化方法及相关设备
WO2021027595A1 (zh) 用户画像生成方法、装置、计算机设备和计算机可读存储介质
WO2019024496A1 (zh) 企业推荐方法及应用服务器
WO2019062021A1 (zh) 在应用程序中推送贷款广告的方法、电子装置及介质
CN104077723B (zh) 一种社交网络推荐系统及方法
CN112434811A (zh) 知识图谱构建方法及装置、计算设备、存储介质
US9754015B2 (en) Feature rich view of an entity subgraph
WO2022105119A1 (zh) 意图识别模型的训练语料生成方法及其相关设备
CN112102445B (zh) 楼盘海报制作方法、装置、设备及计算机可读存储介质
CN113722438A (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN112417121A (zh) 客户意图识别方法、装置、计算机设备及存储介质
CN117312535B (zh) 基于人工智能的问题数据处理方法、装置、设备及介质
CN116661936A (zh) 页面数据的处理方法、装置、计算机设备及存储介质
CN117234505A (zh) 一种交互页面生成方法、装置、设备及其存储介质
WO2021000411A1 (zh) 基于神经网络的文档分类方法、装置、设备及存储介质
US20170161322A1 (en) Method and electronic device for searching resource
CN111143568A (zh) 一种论文分类时的缓冲方法、装置、设备及存储介质
US10529002B2 (en) Classification of visitor intent and modification of website features based upon classified intent
CN109542986B (zh) 网络数据的要素归一化方法、装置、设备及存储介质
CN104933055B (zh) 网页识别方法及网页识别装置
CN113726785B (zh) 网络入侵检测方法、装置、计算机设备以及存储介质
CN116756539A (zh) 项目推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180919

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190809

R150 Certificate of patent or registration of utility model

Ref document number: 6573418

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250