JP2018537768A - ソーシャルビジネス特性を持つユーザの識別 - Google Patents

ソーシャルビジネス特性を持つユーザの識別 Download PDF

Info

Publication number
JP2018537768A
JP2018537768A JP2018524318A JP2018524318A JP2018537768A JP 2018537768 A JP2018537768 A JP 2018537768A JP 2018524318 A JP2018524318 A JP 2018524318A JP 2018524318 A JP2018524318 A JP 2018524318A JP 2018537768 A JP2018537768 A JP 2018537768A
Authority
JP
Japan
Prior art keywords
social
business
user
data
attribute data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018524318A
Other languages
English (en)
Inventor
イエ ジョウ
イエ ジョウ
ワン ユー
ワン ユー
ファン チェン
チェン ファン
ヤン ヤン
ヤン ヤン
マオ チンカイ
マオ チンカイ
ドゥー ナンナン
ドゥー ナンナン
ワン フイ
ワン フイ
ドゥー ファンシュエ
ドゥー ファンシュエ
ユエン フェイ
ユエン フェイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2018537768A publication Critical patent/JP2018537768A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

方法は、候補ユーザのユーザデータを獲得することと、第1の社会的属性データに従って、候補ユーザの一部のソーシャルビジネス特性を持つユーザをマイニングすることと、ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを用いて分類器を訓練することと、隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力することと、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力することとを含み、隣のユーザは、ソーシャルビジネス特性を持つユーザ以外の候補ユーザである。本開示は、関連データの量を増やし、分類器の精度を向上させることによって、識別の精度を向上させ、その結果、第1の期間の潜在的なソーシャルビジネス特性を持つユーザを識別できる。

Description

関連出願の相互参照
本開示は、2015年11月16日出願の中国特許出願番号201510784634.5「Method and Apparatus for Identifying Social Business Characteristic User」の利益を主張し、参照により、その全体を本明細書に組み込む。
本開示は、コンピュータの技術分野に関し、より詳細には、ソーシャルビジネス特性を持つユーザを識別する方法と、ソーシャルビジネス特性を持つユーザを識別する装置に関する。
ネットワークの急速な発展は、人々を、情報社会とネットワーク経済の時代に入らせ、企業及び個人の生活の発展に大きな影響を与えている。
サービス精度を向上させるために、多くのウェブサイトが、ユーザを識別し、グループの特性に従って、グループのユーザにサービスを提供している。
例えば、スポーツ愛好家のグループのユーザは、最新のスポーツニュースを提供され、アニメ愛好家のグループのユーザは、最新のアニメ情報を提供される等である。
現在、ユーザ識別は、一般的に、ユーザの振る舞い間の類似度に従って、類似の振る舞いを有するユーザを同じグループにクラスタリングすることによって行われる。
一方では、これらのユーザ識別方法は、クラスタリングのために一種類の振る舞いデータのみを使用する。少量のデータしかなく、振る舞いは偏る。
他方では、これらのユーザ識別方法は、現在の期間のみに焦点を当てているが、ユーザの振る舞いは経時的に変化している。
これらのユーザ識別方法は、識別精度が低く、一部の潜在的なユーザを識別できない場合がある。
本概要は、発明を実施するための形態で以下にさらに記載する概念の一部を簡単に紹介するためのものである。本概要は、特許を請求する主題の重要な特徴や必須の特徴を全て特定することを意図してはおらず、また、特許を請求する主題の範囲を決定する助けに単独で使用されることも意図していない。例えば、「技術(複数可)または技術的解決法(複数可)」という語は、上記文脈によって認められた、また、本開示を通して、装置(複数可)、システム(複数可)、方法(複数可)、及び/または、コンピュータ可読命令を指してよい。
上記問題を考慮して、本開示の実施形態例は、ソーシャルビジネス特性を持つユーザを識別する方法と、ソーシャルビジネス特性を持つユーザを識別する対応する装置を提供して、上記問題を解決、または、少なくとも部分的に解決する。
上記問題を解決するために、本開示の実施形態例は、ソーシャルビジネス特性を持つユーザを識別する方法を開示する。方法は、
候補ユーザのユーザデータを獲得することであって、ユーザデータは、第1の期間に関連付けられた第1の社会的属性データ及び第1のビジネスオブジェクト属性データと、第2の期間に関連付けられた第2の社会的属性データ及び第2のビジネスオブジェクト属性データとを含み、第2の期間は、第1の期間の前の期間である、候補ユーザのユーザデータを獲得することと、
第1の社会的属性データに従って、候補ユーザの少なくとも一部のソーシャルビジネス特性を持つユーザをマイニングすることと、
ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して分類器を訓練することと、
隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力することと、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力することと、を含み、ここで、隣のユーザは、ソーシャルビジネス特性を持つユーザ以外の候補ユーザである。
オプションで、第1の社会的属性データに従って、候補ユーザの一部のソーシャルビジネス特性を持つユーザをマイニングするステップは、
候補ユーザの第1の社会的属性データから、サービス処理に関連するソーシャルビジネスメッセージを抽出することと、
ソーシャルビジネスメッセージを使用して、ソーシャルビジネス特性を持つユーザを識別することと、
を含む。
オプションで、ソーシャルビジネスメッセージを使用して、ソーシャルビジネス特性を持つユーザを識別するステップは、
グラフ計算に従って、ソーシャルビジネスメッセージを使用して、ソーシャルビジネス特性を持つユーザを識別することを含む。
オプションで、ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して、分類器を訓練するステップは、
候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択することと、
ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データから、第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データと同じタイプの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを抽出することと、
第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを使用して、分類器を訓練することと、
を含む。
オプションで、ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して分類器を訓練するステップは、
ソーシャルビジネス特性を持つユーザの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データに対する特徴変換を行うことをさらに含み、
特徴変換は、
平均変換、分散変換、勾配変換、及び、山と谷の数の変換の1つまたは複数を含む。
オプションで、ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して、分類器を訓練するステップは、
隣のユーザの第1のビジネスオブジェクト特徴データと、ソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データとの類似度を計算することと、
類似度がプリセット類似度閾値より大きい時、隣のユーザの第1のビジネスオブジェクト特徴データをソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データにマージすることと、
をさらに含む。
オプションで、候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択するステップは、
候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス処理に関連する第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを抽出することと、
第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを重要度に従ってソートすることと、
候補ユーザが属する業界の選択規則を検索することと、
ソートされた第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データにおいて、選択規則を満足させる第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択することと、
を含む。
オプションで、隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力し、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力するステップは、
隣のユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを分類器に入力することと、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力することを含む。
オプションで、隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力し、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力するステップは、
隣の候補ユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データに対して特徴変換を行うことをさらに含み、
特徴変換は、
平均変換、分散変換、勾配変換、及び、山と谷の数の変換の1つまたは複数を含む。
本開示の実施形態例は、ソーシャルビジネス特性を持つユーザを識別する装置をさらに開示する。装置は、
候補ユーザのユーザデータを獲得するユーザデータ獲得モジュールであって、ユーザデータは、第1の期間に関連付けられた第1の社会的属性データ及び第1のビジネスオブジェクト属性データと、第2の期間に関連付けられた第2の社会的属性データ及び第2のビジネスオブジェクト属性データとを含み、第2の期間は、第1の期間の前の期間である、ユーザデータ獲得モジュールと、
第1の社会的属性データに従って、候補ユーザの一部のソーシャルビジネス特性を持つユーザをマイニングするソーシャルビジネス特性ユーザマイニングモジュールと、
ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して分類器を訓練する分類器訓練モジュールと、
隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力し、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力するソーシャルビジネス特性ユーザ識別モジュールと、を含み、ここで、隣のユーザは、ソーシャルビジネス特性を持つユーザ以外の候補ユーザである。
オプションで、ソーシャルビジネス特性ユーザマイニングモジュールは、
候補ユーザの第1の社会的属性データから、サービス処理に関連するソーシャルビジネスメッセージを抽出するソーシャルビジネスメッセージ抽出サブモジュールと、
ソーシャルビジネスメッセージを使用して、ソーシャルビジネス特性を持つユーザを識別するユーザ識別サブモジュールと、
を含む。
オプションで、ユーザ識別サブモジュールは、
グラフ計算に従って、ソーシャルビジネスメッセージを使用してソーシャルビジネス特性を持つユーザを識別するグラフ計算ユニットを含む。
オプションで、分類器訓練モジュールは、
候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択する特徴データ選択サブモジュールと、
ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データから、第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データと同じタイプの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを抽出する特徴データ抽出サブモジュールと、
第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを使用して、分類器を訓練するデータ訓練サブモジュールと、
を含む。
オプションで、分類器訓練モジュールは、
ソーシャルビジネス特性を持つユーザの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データに対して特徴変換を行う第1の特徴変換サブモジュールをさらに含み、
特徴変換は、
平均変換、分散変換、勾配変換、及び、山と谷の数の変換のうちの1つまたは複数を含む。
オプションで、分類器訓練モジュールは、
隣のユーザの第1のビジネスオブジェクト特徴データとソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データの類似度を計算する類似度計算サブモジュールと、
類似度がプリセット類似度閾値より大きい時、隣のユーザの第1のビジネスオブジェクト特徴データをソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データとマージするデータマージサブモジュールと、
をさらに含む。
オプションで、特徴データ選択サブモジュールは、
候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス処理に関連する第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを抽出する候補データ抽出ユニットと、
第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを重要度に従ってソートするソートユニットと、
候補ユーザが属する業界の選択規則を検索する選択規則検索ユニットと、
ソートされた第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データにおいて、選択規則を満足させる第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択するデータ選択ユニットと、
を含む。
オプションで、ソーシャルビジネス特性ユーザ識別モジュールは、
隣のユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを分類器に入力し、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力するデータ入力サブモジュールを含む。
オプションで、ソーシャルビジネス特性ユーザ識別モジュールは、
隣の候補ユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データに対して特徴変換を行う第2の特徴変換サブモジュールをさらに含み、
特徴変換は、
平均変換、分散変換、勾配変換、及び、山と谷の数の変換のうちの1つまたは複数を含む。
本開示の実施形態例は、少なくとも以下の長所を含む。
本開示の実施形態例は、第2の期間のソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して分類器を訓練し、第1の期間の隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力し、隣のユーザが、ある期間の後、ソーシャルビジネス特性を持つユーザとなるか否かの結果を予測する。識別は、関連する社会的属性データとビジネスオブジェクト属性データを使用して行われ、それによって、関連データの量を増やし、分類器の精度を向上させ、従って、識別の精度を向上させる。さらに、第2の期間のデータを用いて分類器を訓練することによって、分類器は、第1の期間の潜在的なソーシャルビジネス特性を持つユーザを識別する。
本開示による、ソーシャルビジネス特性を持つユーザを識別する例示の方法を示すフローチャートである。 本開示による、ソーシャルビジネス特性を持つユーザを識別する例示の装置を示す構造ブロック図である。
本開示の上記目的、特徴、及び、長所をより理解しやすくするために、本開示を添付図面と実施形態例を参照して、以下にさらに詳細に記載する。
図1を参照する。図1は、本開示による、ソーシャルビジネス特性を持つユーザを識別する例示の方法のフローチャートを示す。方法は、以下のステップを含んでよい。
ステップ101:候補ユーザのユーザデータを獲得する。
ある実施態様においては、本開示の実施形態例は、クラウドコンピューティングプラットフォームに、すなわち、膨大な数のユーザのビジネスオブジェクトを記憶する分散システム等のサーバクラスタに適用されてよい。さらに、クラウドコンピューティングプラットフォームは、ソーシャルネットワーク(Weibo(商標)、フォーラム、及び、ブログ等)と相互接続してよい、すなわち、同じユーザが、ビジネスオブジェクトとソーシャルネットワークを有する。
本開示の実施形態例において、候補ユーザは、ソーシャルビジネス特性を持つユーザの識別に関連する。候補ユーザは、本質的にユーザでもあり、ユーザ識別子を使用することによって、すなわち、ユーザID(アイデンティティ)、クッキー、Mac(媒体アクセス制御)アドレス等を含む、一意に決定された候補ユーザを表し得る情報を使用することによって、クラウドコンピューティングプラットフォーム上で表される。
本開示の実施形態例において、クラウドコンピューティングプラットフォームは、ウェブサイトログを介してユーザデータを記録してよく、ユーザデータをデータベースに記憶してよい。
ユーザデータは、社会的属性データ、すなわち、ソーシャルネットワークで生成されたデータを含んでよい。Weibo(商標)の例に関しては、社会的属性データは、個人データ、ファンデータ、ステータスデータ、転送データ、いいねデータ(like data)等を含む。
さらに、ユーザデータは、ビジネスオブジェクト属性データ、すなわち、ビジネスオブジェクトがサービス処理を行う時に生成されるデータをさらに含んでよい。
異なる分野においては、異なるビジネスオブジェクト、すなわち、分野の特性を反映するデータがあってよいことに注意されたい。
例えば、通信分野においては、ビジネスオブジェクトは、通信データであってよく、ニュースメディア分野では、ビジネスオブジェクトは、ニュースデータであってよく、検索分野では、ビジネスオブジェクトは、ウェブページであってよく、電子商取引(EC)分野では、ビジネスオブジェクトは、店舗データであってよい等である。
異なる分野において、ビジネスオブジェクトは、ビジネスオブジェクトが有する異なる分野特性によって異なるが、本質的に、それらは全て、例えば、テキストデータ、画像データ、音声データ、ビデオデータ等のデータであり、従って、ビジネスオブジェクトの処理は、本質的にデータ処理である。
当業者が本開示の実施形態例をより良く理解するのを助けるために、本開示の実施形態例においては、記載のために、店舗データをビジネスオブジェクトの例として使用する。
この例においては、サービス処理は、マーケティングである。すなわち、ビジネスオブジェクト属性データは、店の基本データ(店の星評価、その店は開業してどれくらい経つか、店の取引等)、購入者の特徴データ(購入者の年齢及び性別等)、商品の特徴データ(商品の写真の品質、商品価格、及び、商品のコメント等)、振る舞いデータ(ブックマーク、閲覧、購入、注文等)等を含む。
ウェブサイトは、一般に、ユーザデータを連続的に記録し、それは比較的長い期間を有するので、ユーザデータは、一般に、データベースシャーディングの形態で記憶される。
本開示の実施形態例において、それぞれ、第1の期間と第2の期間の2つの期間のユーザデータが、選択され、第2の期間は、第1の期間の前の期間である。
例えば、第1の期間が、2015年9月の場合、第2の期間は、2014年9月から2015年8月であってよく、第2の期間の開始時間から第1の期間の開始時間まで1年の間隔がある。
ユーザデータに関して、ユーザデータは、第1の期間に関連付けられた第1の社会的属性データ及び第1のビジネスオブジェクト属性データと、第2の期間に関連付けられた第2の社会的属性データ及び第2のビジネスオブジェクト属性データとを含んでよい。
第1のビジネスオブジェクト属性データ及び第2のビジネスオブジェクト属性データは、ビジネスオブジェクトがサービス処理を行う時、生成されたデータである。
ステップ102:ソーシャルビジネス特性を持つユーザが、第1の社会的属性データに従って、候補ユーザの少なくとも一部からマイニングされる。
本開示の実施形態例において、一部の候補ユーザが、全ての候補ユーザから前もって選択されてよく、一部の候補ユーザは、手動で選択されてもよく、または、プリセット条件に従って、フィルタリングされてもよい。これについて、本開示の実施形態例において、制限はない。
サービス処理を表すソーシャルビジネス特性を持つユーザ、すなわち、社交(social intercourse)を用いてサービス処理を促進するのに優れたユーザが、選択された候補ユーザから、分類器の訓練サンプルとしてマイニングされてよい。
電子商取引分野においては、サービス処理は、マーケティングであり、その場合、ソーシャルビジネス特性を持つユーザは、ソーシャルマーケティングタレント、すなわち、社交を用いてマーケティングを促進することに優れたユーザと呼ばれてよい。
本開示のある実施形態例においては、ステップ102は、以下のサブステップを含んでよい。
第1のサブステップ:サービス処理に関連するソーシャルビジネスメッセージが、候補ユーザの第1の社会的属性データから抽出される。
特定の実施態様においては、候補ユーザのデータは、ソーシャルネットワークの記載を参照してフィルタリングされてよく、一般に、ソーシャルビジネス特性を持つユーザ(ソーシャルマーケティングタレント等)は、大抵、セレブ、デザイナー、または、フォーラムモデレータ等、有名な公認ユーザであり、比較的明らかな社会的特性を有し得る。
例えば、新しい製品投入メッセージまたは新しい製品のトライアルメッセージ等、サービス処理に関するメッセージが、Weibo(商標)メッセージ、フレンド(fiend)サークルメッセージ、フォームの投稿、ブログの投稿、及び、他のメッセージ等、サービス処理(マーケティング等)に関連するソーシャルビジネスメッセージからテキストマイニングによって選択される。
第2のサブステップ:ソーシャルビジネス特性を持つユーザが、ソーシャルビジネスメッセージを使用して識別される。
特定の実施態様においては、ソーシャルビジネス特性を持つユーザは、グラフ計算に従って、ソーシャルビジネスメッセージを使用して識別されてよい。PageRank等のグラフ計算によって、「オピニオンリーダー」、すなわち、ソーシャルネットワークにおいて、通常のユーザと多くのサービスの相互作用を有するユーザが見いだされ、これらのユーザはソートされて、トップN個の候補ユーザが選択される、それによって、N個の候補ユーザがソーシャルビジネス特性を持つユーザであるか否かを識別する。
グラフ計算に加えて、ソーシャルビジネス特性を持つユーザを識別する他の方法を採用してよく、方法は、本開示の実施形態例においては、制限されない。
ソーシャルビジネス特性を持つユーザをより正確に識別するために、手動で監査するための専門技術者を採用して、分類器の精度を向上させてよいことは当然である。
ステップ103:分類器が、ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して訓練される。
ある実施態様においては、第2の期間の開始時間から期間t後、第1の期間において、ユーザが、ソーシャルビジネス特性を持つユーザ(ソーシャルマーケティングタレント等)になることが規定されてよい。
ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを正のサンプルとして、ソーシャルビジネス特性を持たないユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを負のサンプルとして使用して、分類器は、機械学習を介して訓練される。
本開示のある実施形態例においては、ステップ103は、以下のサブステップを含んでよい。
第1のサブステップにおいて、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データが、候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから選択される。
本開示の実施形態例においては、タレントを最もよく表し得る第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データが、膨大な量の第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、スクリーニングされる。
特定の実施態様においては、サービス処理に関連する第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データが、候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス論理を使用して抽出され、データプールを形成する。
電子商取引の例に関しては、販売者は、購入者と相互作用する必要があり、従って、新しい製品を絶えず投入する必要があり、一方、購入者は、新しい製品を見逃さないようにこれらの店にブックマークする。さらに、これらの店は、常に、在庫している商品をできるだけ多く売るので、販売率が高い。よって、タレントは、販売率が高い、新製品の数が多い、及び、ブックマーク数が多い等の特徴を有する。販売率、新製品の数、及び、購入者のブックマーク数等、タレントに関連する特徴は、大量のデータからスクリーニングされてよい。
第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データは、機械学習のROCまたは関係係数等の特徴選択方法を使用して重要度に従ってソートされてよい。
異なる業界は、異なる特性を有するので、例えば、婦人服業界サークルの婦人服タレントと、紳士服業界サークルの紳士服タレントは、異なる特性を有するので、重要度も異なる。よって、候補ユーザが属する業界の選択規則を見いだしてよい。
選択規則に見合う第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データが、ソートされた第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データから選択される。
特徴の重要度は、定量的データである。従って、閾値を規定してよく、特徴は、重要度が0.7より大きく0.9より小さい等、選択規則を使用してスクリーニングされる。
第2のサブステップ:第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データと同じタイプの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データが、ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データから抽出される。
第2の期間の第2の社会的属性データ及び第2のビジネスオブジェクト属性データが、訓練サンプルとして使用されるので、スクリーニングされた特徴と同じタイプの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データが抽出されてよい。
第3のサブステップ:隣のユーザの第1のビジネスオブジェクト特徴データとソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データとの類似度が、計算される。
第4のサブステップ:類似度がプリセット類似度閾値より大きい時、隣のユーザの第1のビジネスオブジェクト特徴データは、ソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データとマージされる。
専門の技術者が、候補ユーザがソーシャルビジネス特性を持つユーザとなるか否かを手動で監査するシナリオにおいては、比較的少数のソーシャルビジネス特性を持つユーザ、例えば、100のユーザがあってよい。よって、ソーシャルビジネス特性を持つユーザのサンプル数は、識別に備えて拡張されてよい。
ソーシャルビジネス特性を持つユーザの拡張において、第1のビジネスオブジェクト特徴データを類似度のフィルタリングを使用して正規化した後、隣のユーザとソーシャルビジネス特性を持つユーザとの第1のビジネスオブジェクト特徴データの類似度を、対毎に計算し、類似度閾値を設定して、似ていない第1のビジネスオブジェクト特徴データを取り除く。第1のビジネスオブジェクト特徴データのマージ後の結果が、拡張された第1のビジネスオブジェクト特徴データである。
電子商取引店舗の取引とブックマークを例として使用することによって:
Figure 2018537768
取引数とブックマーク数は、0から1の間隔に正規化される。すなわち、
Figure 2018537768
余弦公式(狭角余弦)を使用すると、2つの販売者1001と1002の類似度は、
(0.33*0.66+0.25*0.75)/(SQRT(0.33^2+0.25^2)*SQRT(0.66^2+0.75^2))である。
第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データは、獲得されると、候補ユーザがソーシャルビジネス特性を持つユーザであるか否かと、特徴名及び値と、対応する時間とを含む、リストの形で出力されてよい。
サンプル番号:1、特徴1:XXX、特徴2:XXX、…、特徴n:XXX、タレントか否か:1、時間:YYYY−MM−DD
サンプル番号:2、特徴1:XXX、特徴2:XXX、…、特徴n:XXX、タレントか否か:0、時間:YYYY−MM−DD
サンプル番号:3、特徴1:XXX、特徴2:XXX、…、特徴n:XXX、タレントか否か:1、時間:YYYY−MM−DD
第5のサブステップ:特徴変換が、ソーシャルビジネス特性を持つユーザとソーシャルビジネス特性を持たないユーザの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データに対して行われる。
スクリーニングされた特徴は、第1の期間までの時系列の特徴なので、特徴変換が行われて、特徴ワイドテーブルが作成されてよく、特徴変換は、平均変換、分散変換、勾配変換、及び、山と谷の数の変換の1つまたは複数を含んでよい。
例えば、上記例において変換された特徴は、以下であってよい。
サンプル番号:1、特徴の平均1:10、特徴の分散1:2、特徴の勾配1:0.5、特徴の山の数1:3、特徴の谷の数1:5、特徴の平均2:8、特徴の分散1:1、特徴の勾配2:0.9、特徴の山の数1:2、特徴の谷の数1:7、…、ユーザが、時間t後、タレントになるか否か:1
サンプル番号:1、特徴の平均1:5、特徴の分散1:5、特徴の勾配1:1.2、特徴の山の数1:10、特徴の谷の数1:8、特徴の平均2:2、特徴の分散1:4、特徴の勾配2:0.2、特徴の山の数1:5、特徴の谷の数1:3、…、ユーザが、時間t後、タレントになるか否か:1
特徴は全て、均一に、変換されてよいが、平均、分散、勾配、山の数、及び、谷の数は、7日、30日、及び、90日等の異なる期間から選択されてよい。
第6のサブステップ:分類器は、第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを使用して訓練される。
本開示の実施形態例を使用することによって、例えば、サポートベクターマシン(SVM)、決定木、ランダムフォレスト等を含むが、本開示の実施形態例においては制限されないトレーナが、異なる次元のデータ(すなわち、第2の社会的属性データと第2のビジネスオブジェクト属性データ)間の論理的関係を学ぶように予め設定されてよい。
サポートベクターマシンは、非線形マッピングpを使用して、サンプル空間を高次元または無次元特徴空間(ヒルベルト空間)にさえマッピングし、その結果、元のサンプル空間における非線形に分離可能という問題は、特徴空間においては、線形に分離可能という問題に変換される。
ランダムフォレストは、ランダムに構築されたフォレストである。フォレストは、多くの決定木で構成されており、フォレストの決定木は、互いに関連していない。フォレスト取得後、新しい入力サンプルが入力されると、フォレストの各決定木は、有効にされて(分類アルゴリズムに対応する)どのカテゴリにサンプルが属するのかを別個に判定し、次に、最大回数、選択されたカテゴリが決定され、サンプルがこのカテゴリに属すると予測される。
様々な状況の発生確率が既知であるということに基づいて決定木を構築することによって、正味の現在の値の期待値が0以上であるという確率を解いて、プロジェクトのリスクを評価する。プロジェクトの実現可能性を判断する決定分析方法は、確率分析を直感的に使用するグラフィカルな方法である。
分類器の精度をさらに向上させるために、複数のトレーナを同時に使用して、分類器を訓練することができ、オフライン環境で最適な性能を有する分類器が選択される。
ステップ104:隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データが、分類器に入力され、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果が出力される。
隣のユーザは、ソーシャルビジネス特性を持つユーザ以外の候補ユーザである。
特定の実施態様においては、特徴変換が、隣の候補ユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データに対して行われてよい。
特徴変換は、平均変換、分散変換、勾配変換、及び、山と谷の数の変換のうちの1つまたは複数を含んでよい。
隣のユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データが、分類器に入力され、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果が出力される。すなわち、隣のユーザが第1の期間の後の期間にわたって、ソーシャルビジネス特性を持つユーザになるか否かが予測される。
電子商取引の例に関しては、2015年9月の前の年(第1の期間)のソーシャルマーケティングタレントのデータを使用して、分類器を訓練する場合、分類器を使用して、隣のユーザが2016年9月にソーシャルマーケティングタレントになるか否かを識別してよい。なる場合、隣のユーザは、潜在的なソーシャルマーケティングタレントと呼ばれてよい。
ソーシャルマーケティングは、その強力な売上の急増とファンの影響で、電子商取引プラットフォームにおいて、急速に成長している革新的なビジネスモードにすぐになり、または、インターネットのファストファッション特徴及び社会的依存特徴を有する。
従来の低価格のマーケティングモードとは異なり、ソーシャルマーケティングは、高品質のトラフィックと非常に高いコンバージョン率とをもたらし、たとえ製品が高価格で販売されても、依然として新しく入荷されるとすぐに売り切れる。
現在、多くの潜在的なソーシャルマーケティングタレントが、社会的権力が弱いために、自分自身でソーシャル業務(social operations)を行うことができない。よって、潜在的なソーシャルマーケティングタレントを識別後、これらの潜在的なソーシャルマーケティングタレントが、ソーシャルネットワークにおける定期的な活動を組織するのを助けてよい。プロの代理運営機構を構築して運営費用を減らすことによって、販売量の向上を加速させる。
本開示の実施形態例は、第2の期間のソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して、分類器を訓練し、第1の期間の隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力し、隣のユーザが、ある期間の後、ソーシャルビジネス特性を持つユーザとなるか否かの結果を予測する。識別は、関連する社会的属性データ及びビジネスオブジェクト属性データを使用することによって行われ、これによって、関連データの量を増やし、分類器の精度を向上させ、従って、識別の精度を向上させる。さらに、第2の期間のデータを使用して分類器を訓練することによって、分類器は、第1の期間の潜在的なソーシャルビジネス特性を持つユーザを識別する。
記載を簡単にするために、方法の実施形態例は、一連のアクションの組み合わせとして示したことに注意されたい。しかしながら、本開示の実施形態例によると、一部のステップは、他の順でまたは同時に行われてよいので、本開示の実施形態例は、記載のアクション順に制限されないことを、当業者は理解されよう。さらに、本明細書に記載の実施形態例は、全て例であり、関連するアクションは、本開示の実施形態例に必ずしも必須ではないことも当業者は理解されよう。
図2を参照する。図2は、本開示による、ソーシャルビジネス特性を持つユーザを識別する例示の装置200の構造ブロック図を示す。
装置200は、1つまたは複数のプロセッサ(複数可)202またはデータ処理ユニット(複数可)と、メモリ204とを含む。装置200は、1つまたは複数の入力/出力インタフェース(複数可)206及びネットワークインタフェース(複数可)208をさらに含んでよい。メモリ204は、コンピュータ可読媒体の例である。
メモリ204は、複数のモジュールまたはユニットを記憶してよく、複数のモジュールまたはユニットは、
候補ユーザのユーザデータを獲得するユーザデータ獲得モジュール210であって、ユーザデータは、第1の期間に関連付けられた第1の社会的属性データ及び第1のビジネスオブジェクト属性データと、第2の期間に関連付けられた第2の社会的属性データ及び第2のビジネスオブジェクト属性データとを含み、第2の期間は、第1の期間の前の期間である、ユーザデータ獲得モジュール210と、
第1の社会的属性データに従って、候補ユーザの一部のソーシャルビジネス特性を持つユーザをマイニングするソーシャルビジネス特性ユーザマイニングモジュール212と、
ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データを使用して、分類器を訓練する分類器訓練モジュール214と、
隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを分類器に入力し、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力するソーシャルビジネス特性ユーザ識別モジュール216とを含み、ここで、隣のユーザは、ソーシャルビジネス特性を持つユーザ以外の候補ユーザである。
本開示のある実施形態例においては、ソーシャルビジネス特性ユーザマイニングモジュール212は、
候補ユーザの第1の社会的属性データから、サービス処理に関連するソーシャルビジネスメッセージを抽出するソーシャルビジネスメッセージ抽出サブモジュールと、
ソーシャルビジネスメッセージを使用して、ソーシャルビジネス特性を持つユーザを識別するユーザ識別サブモジュールと
を含んでよい。
本開示のある実施形態例においては、ユーザ識別サブモジュールは、
グラフ計算に従って、ソーシャルビジネスメッセージを使用して、ソーシャルビジネス特性を持つユーザを識別するグラフ計算ユニットを含んでよい。
本開示のある実施形態例においては、分類器訓練モジュール214は、
候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択する特徴データ選択サブモジュールと、
ソーシャルビジネス特性を持つユーザの第2の社会的属性データ及び第2のビジネスオブジェクト属性データから、第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データと同じタイプの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを抽出する特徴データ抽出サブモジュールと、
第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを使用して、分類器を訓練するデータ訓練サブモジュールと、
を含んでよい。
本開示のある実施形態例においては、分類器訓練モジュール214は、
ソーシャルビジネス特性を持つユーザの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データに対して特徴変換を行う第1の特徴変換サブモジュールをさらに含んでよく、特徴変換は、平均変換、分散変換、勾配変換、及び、山と谷の数の変換のうちの1つまたは複数を含む。
本開示のある実施形態例においては、分類器訓練モジュール214は、
隣のユーザの第1のビジネスオブジェクト特徴データとソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データとの類似度を計算する類似度計算サブモジュールと、
類似度がプリセット類似度閾値より大きい時、隣のユーザの第1のビジネスオブジェクト特徴データを、ソーシャルビジネス特性を持つユーザの第1のビジネスオブジェクト特徴データにマージするデータマージサブモジュールと、
をさらに含んでよい。
本開示のある実施形態例においては、特徴データ選択サブモジュールは、
候補ユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データから、サービス処理に関連する第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを抽出する候補データ抽出ユニットと、
第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを重要度に従ってソートするソートユニットと、
候補ユーザが属する業界の選択規則を検索する選択規則検索ユニットと、
ソートされた第1のソーシャルビジネス候補データと第1のビジネスオブジェクト候補データにおいて、選択規則を満足させる第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択するデータ選択ユニットと、
を含んでよい。
本開示のある実施形態例においては、ソーシャルビジネス特性ユーザ識別モジュール216は、
隣のユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを分類器に入力し、隣のユーザが、第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力するデータ入力サブモジュールをさらに含む。
本開示のある実施形態例においては、ソーシャルビジネス特性ユーザ識別モジュール216は、
隣の候補ユーザの第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データに対して特徴変換を行う第2の特徴変換サブモジュールをさらに含んでよく、特徴変換は、平均変換、分散変換、勾配変換、及び、山と谷の数の変換のうちの1つまたは複数を含む。
装置の実施形態例は、基本的に方法の実施形態例と類似しているので比較的簡単に記載している。関連する内容に関しては、方法の実施形態例の関連する記載を参照してよい。
明細書の実施形態例は、漸進的に記載している。各実施形態例は、他の実施形態例との相違に焦点をあてている。実施形態例間の同一または類似の部分に関しては、互いに参照してよい。
本開示の実施形態例は、方法、装置、または、コンピュータプログラム製品として提供されてよいことを当業者は理解されよう。よって、本開示は、全てハードウェアの実施形態例、全てソフトウェアの実施形態例、または、ソフトウェアとハードウェアを組み合わせた実施形態例の形を採用してよい。さらに、本開示の実施形態例は、コンピュータ可読命令を含む1つまたは複数のコンピュータ可読媒体(磁気ディスクストレージ、CD−ROM、光学ストレージ等を含むが、これらに限定されない)で実施されるコンピュータプログラム製品の形を採用してよい。
典型的な構成においては、コンピュータ装置は、1つまたは複数のプロセッサ(CPU)、入力/出力インタフェース、ネットワークインタフェース、及び、メモリを含む。メモリは、揮発性メモリ、ランダムアクセスメモリ(RAM)、及び/または、リードオンリメモリ(ROM)もしくはフラッシュメモリ(フラッシュRAM)等のコンピュータ可読媒体の不揮発性メモリの形態を含んでよい。メモリは、コンピュータ可読媒体の例である。コンピュータ可読媒体は、永続的及び一時的、取り外し可能及び取り外し不能の媒体を含み、情報は、任意の方法または技術で記憶されてよい。情報は、コンピュータ可読命令、データ構造、プログラムモジュール、または、他のデータであってよい。コンピュータ記憶媒体の例は、位相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、電気的消去可能プログラム可能リードオンリメモリ(EEPROM)、フラッシュメモリもしくは他のメモリ技術、コンパクトディスクリードオンリメモリ(CD−ROM)、デジタル多用途ディスク(DVD)もしくは他の光学ストレージ、カセットタイプのテープ、磁気テープ、ディスクストレージもしくは他の磁気記憶装置、または、任意の他の非伝送媒体を含むが、これらに限定されず、これらを用いて、コンピューティング装置によってアクセス可能な情報を記憶できる。本明細書の定義では、コンピュータ可読媒体は、変調データ信号及び搬送波等の一時的媒体を含まない。
本開示は、本開示の実施形態例による、方法、端末装置(システム)、及び、コンピュータプログラム製品のフローチャート及び/またはブロック図を参照して記載される。コンピュータ可読命令を使用して、フローチャート及び/またはブロック図の各プロセス及び/またはブロックと、フローチャート及び/またはブロック図のプロセス及び/またはブロックの組み合わせを実施してよいことは理解されよう。コンピュータ可読命令は、ユニバーサルコンピュータ、専用コンピュータ、組み込みプロセッサ、または、他のプログラム可能データ処理端末装置のプロセッサに提供されて、マシンを生成してよく、それによって、コンピュータ、または、他のプログラム可能データ処理端末装置のプロセッサは、命令を実行して、フローチャートの1つまたは複数のプロセス、及び/または、ブロック図の1つまたは複数のブロックで指定された機能を実施する装置を生成する。
コンピュータ可読命令は、コンピュータ可読媒体に記憶されてもよく、コンピュータ、または、他のプログラム可能データ処理端末装置が特定の方法で動作するようにガイドすることによって、コンピュータ可読ストレージに記憶された命令は、命令装置を含む製品を生成し、命令装置は、フローチャートの1つまたは複数のプロセス、及び/または、ブロック図の1つまたは複数のブロックで指定された機能を実施する。
コンピュータ可読命令は、コンピュータまたは他のプログラム可能データ処理端末装置にロードされてもよく、それによって、コンピュータまたは他のプログラム可能データ処理端末装置は、一連の動作ステップを実行して、コンピュータによって実施される処理を生成し、従って、コンピュータまたは他のプログラム可能データ処理端末装置で実行される命令は、フローチャートの1つまたは複数のプロセス、及び/または、ブロック図の1つまたは複数のブロックで規定された機能を実施するステップを提供する。
本開示の実施形態例を記載したが、当業者は、基本的な発明の概念を理解すると、実施形態例に他の変形及び修正が行われ得る。よって、添付の請求項は、本開示の実施形態例の範囲に該当する実施形態例と全ての変形及び修正を含むと解釈されることを意図している。
最後に、本出願書における「第1の」及び「第2の」等の関係語は、ある実体または動作を他の実体または動作と区別するためにのみ使用され、実体と実体の間、または、動作と動作の間に実際の関係または順序が存在することを必ずしも必要とせず、示唆してもいないことに注意されたい。さらに、「include(含む)」「comprise(含む)」等の語、または、任意の他の変形は、排他的でなく含むことを意図しており、一連の要素を含むプロセス、方法、品目、または、端末装置は、これらの要素だけでなく、明示的に列挙されていない他の要素、または、プロセス、方法、品目、もしくは、端末装置に本来備わる他の要素も含む。別段の規定のない限り、「include a...(を含む)」という句によって規定される要素は、この要素を含むプロセス、方法、品目、または、端末装置に存在する追加の同一の要素を除外しない。
本開示によって提供されるソーシャルビジネス特性を持つユーザを識別する方法と、ソーシャルビジネス特性を持つユーザを識別する装置を、上記に詳細に記載した。本明細書では、特定の例を使用して、本開示の原理及び実施態様を記載している。実施形態例の上記記載は、本開示の方法と本開示の中心的な考えの理解を助けるために使用したに過ぎない。一方、当業者は、本開示の考えに従って、特定の実施態様及び用途の範囲を変更してよい。結論として、明細書の内容は、本開示への制限と解釈すべきではない。

Claims (20)

  1. ソーシャルビジネス特性を持つユーザを識別する方法であって、
    候補ユーザのユーザデータを獲得することであって、前記ユーザデータは、第1の期間に関連付けられた第1の社会的属性データ及び第1のビジネスオブジェクト属性データと、第2の期間に関連付けられた第2の社会的属性データ及び第2のビジネスオブジェクト属性データとを含み、前記第2の期間は、前記第1の期間の前の期間である、ことと、
    前記第1の社会的属性データに従って前記候補ユーザの少なくとも一部のソーシャルビジネス特性を持つユーザをマイニングすることと、
    前記ソーシャルビジネス特性を持つユーザの前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して分類器を訓練することと、
    隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを前記分類器に入力することと、
    前記隣のユーザが、前記第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力することであって、前記隣のユーザは、前記ソーシャルビジネス特性を持つユーザ以外の候補ユーザである、ことと、
    を含む方法。
  2. 前記第1の社会的属性データに従って前記候補ユーザの少なくとも一部の前記ソーシャルビジネス特性を持つユーザを前記マイニングすることは、
    前記候補ユーザの前記第1の社会的属性データから、サービス処理に関連するソーシャルビジネスメッセージを抽出することと、
    前記ソーシャルビジネスメッセージを使用して前記ソーシャルビジネス特性を持つユーザを識別することと、
    を含む、請求項1に記載の方法。
  3. 前記ソーシャルビジネスメッセージを使用して前記ソーシャルビジネス特性を持つユーザを前記識別することは、グラフ計算に従って、前記ソーシャルビジネスメッセージを使用して前記ソーシャルビジネス特性を持つユーザを識別することを含む、請求項2に記載の方法。
  4. 前記ソーシャルビジネス特性を持つユーザの前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して分類器を前記訓練することは、
    前記候補ユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択することと、
    前記ソーシャルビジネス特性を持つユーザの前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データから、前記第1のソーシャルビジネス特徴データ及び前記第1のビジネスオブジェクト特徴データと同じタイプの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを抽出することと、
    前記第2のソーシャルビジネス特徴データ及び前記第2のビジネスオブジェクト特徴データを使用して前記分類器を訓練することと、
    を含む、請求項1に記載の方法。
  5. 前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して前記分類器を前記訓練することは、前記ソーシャルビジネス特性を持つユーザの前記第2のソーシャルビジネス特徴データ及び前記第2のビジネスオブジェクト特徴データに対して特徴変換を行うことを含む、請求項4に記載の方法。
  6. 前記特徴変換は、
    平均変換、
    分散変換、
    勾配変換、及び、
    山と谷の数の変換
    のうちの1つまたは複数を含む、請求項5に記載の方法。
  7. 前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して前記分類器を前記訓練することは、
    前記隣のユーザの前記第1のビジネスオブジェクト特徴データと前記ソーシャルビジネス特性を持つユーザの前記第1のビジネスオブジェクト特徴データとの類似度を計算することと、
    前記類似度がプリセット類似度閾値より大きいとき、前記隣のユーザの前記第1のビジネスオブジェクト特徴データを前記ソーシャルビジネス特性を持つユーザの前記第1のビジネスオブジェクト特徴データにマージすることと、
    を含む、請求項4に記載の方法。
  8. 前記候補ユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを前記選択することは、
    前記候補ユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データから、前記サービス処理に関連する第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを抽出することと、
    前記第1のソーシャルビジネス候補データ及び前記第1のビジネスオブジェクト候補データを重要度に従ってソートすることと、
    前記候補ユーザが属する業界の選択規則を検索することと、
    前記ソートされた第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データにおいて、前記選択規則を満足させる第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択することと、
    を含む、請求項4に記載の方法。
  9. 前記隣のユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データを前記分類器に前記入力することと、前記隣のユーザが、前記第1の期間の後の前記期間に、前記ソーシャルビジネス特性を持つユーザとなるか否かの前記結果を出力することは、
    前記隣のユーザの前記第1のソーシャルビジネス特徴データ及び前記第1のビジネスオブジェクト特徴データを前記分類器に入力することと、前記隣のユーザが、前記第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの前記結果を出力することを含む、請求項4に記載の方法。
  10. 前記隣のユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データを前記分類器に前記入力することと、前記隣のユーザが、前記第1の期間の後の前記期間に、前記ソーシャルビジネス特性を持つユーザとなるか否かの前記結果を前記出力することは、
    隣の候補ユーザの前記第1のソーシャルビジネス特徴データ及び前記第1のビジネスオブジェクト特徴データに対して特徴変換を行うことを含む、請求項8に記載の方法。
  11. 前記特徴変換は、
    平均変換、
    分散変換、
    勾配変換、及び、
    山と谷の数の変換
    のうちの1つまたは複数を含む、請求項10に記載の方法。
  12. コンピュータ可読命令を記憶する1つまたは複数のメモリであって、前記コンピュータ可読命令は、1つまたは複数のプロセッサによって実行可能で、前記1つまたは複数のプロセッサに、
    候補ユーザのユーザデータを獲得することであって、前記ユーザデータは、第1の期間に関連付けられた第1の社会的属性データ及び第1のビジネスオブジェクト属性データと、第2の期間に関連付けられた第2の社会的属性データ及び第2のビジネスオブジェクト属性データとを含み、前記第2の期間は、前記第1の期間の前の期間である、ことと、
    前記第1の社会的属性データに従って、前記候補ユーザの少なくとも一部のソーシャルビジネス特性を持つユーザをマイニングすることと、
    前記ソーシャルビジネス特性を持つユーザの前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して分類器を訓練することと、
    隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを前記分類器に入力することと、
    前記隣のユーザが、前記第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力することであって、前記隣のユーザは、前記ソーシャルビジネス特性を持つユーザ以外の候補ユーザである、ことと
    を含むアクトを行わせる、1つまたは複数のメモリ。
  13. 前記第1の社会的属性データに従って、前記候補ユーザの少なくとも一部において前記ソーシャルビジネス特性を持つユーザを前記マイニングすることは、
    前記候補ユーザの前記第1の社会的属性データから、サービス処理に関連するソーシャルビジネスメッセージを抽出することと、
    前記ソーシャルビジネスメッセージを使用して、前記ソーシャルビジネス特性を持つユーザを識別することと、
    を含む、請求項12に記載の1つまたは複数のメモリ。
  14. 前記ソーシャルビジネスメッセージを使用して前記ソーシャルビジネス特性を持つユーザを前記識別することは、グラフ計算に従って前記ソーシャルビジネスメッセージを使用して前記ソーシャルビジネス特性を持つユーザを識別することを含む、請求項13に記載の1つまたは複数のメモリ。
  15. 前記ソーシャルビジネス特性を持つユーザの前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して前記分類器を前記訓練することは、
    前記候補ユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択することと、
    前記ソーシャルビジネス特性を持つユーザの前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データから、前記第1のソーシャルビジネス特徴データ及び前記第1のビジネスオブジェクト特徴データと同じタイプの第2のソーシャルビジネス特徴データ及び第2のビジネスオブジェクト特徴データを抽出することと、
    前記第2のソーシャルビジネス特徴データ及び前記第2のビジネスオブジェクト特徴データを使用して前記分類器を訓練することと、
    を含む、請求項12に記載の1つまたは複数のメモリ。
  16. 前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して前記分類器を前記訓練することは、前記ソーシャルビジネス特性を持つユーザの前記第2のソーシャルビジネス特徴データ及び前記第2のビジネスオブジェクト特徴データに対して特徴変換を行うことを含み、
    前記特徴変換は、
    平均変換、
    分散変換、
    勾配変換、及び、
    山と谷の数の変換
    のうちの1つまたは複数を含む、請求項15に記載の1つまたは複数のメモリ。
  17. 前記第2の社会的属性データ及び前記第2のビジネスオブジェクト属性データを使用して前記分類器を前記訓練することは、
    前記隣のユーザの前記第1のビジネスオブジェクト特徴データと、前記ソーシャルビジネス特性を持つユーザの前記第1のビジネスオブジェクト特徴データとの類似度を計算することと、
    前記類似度がプリセット類似度閾値より大きいとき、前記隣のユーザの前記第1のビジネスオブジェクト特徴データを前記ソーシャルビジネス特性を持つユーザの前記第1のビジネスオブジェクト特徴データとマージすることと、
    を含む、請求項15に記載の1つまたは複数のメモリ。
  18. 前記候補ユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データから、サービス処理を表す第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを前記選択することは、
    前記候補ユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データから、前記サービス処理に関連する第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データを抽出することと、
    前記第1のソーシャルビジネス候補データ及び前記第1のビジネスオブジェクト候補データを重要度に従ってソートすることと、
    前記候補ユーザが属する業界の選択規則を検索することと、
    前記ソートされた第1のソーシャルビジネス候補データ及び第1のビジネスオブジェクト候補データにおいて、前記選択規則を満足させる第1のソーシャルビジネス特徴データ及び第1のビジネスオブジェクト特徴データを選択することと、
    を含む、請求項15に記載の1つまたは複数のメモリ。
  19. 前記隣のユーザの前記第1の社会的属性データ及び前記第1のビジネスオブジェクト属性データを前記分類器に前記入力することと、前記隣のユーザが、前記第1の期間の後の前記期間に、前記ソーシャルビジネス特性を持つユーザとなるか否かの前記結果を出力することは、
    前記隣のユーザの前記第1のソーシャルビジネス特徴データ及び前記第1のビジネスオブジェクト特徴データを前記分類器に入力することと、前記隣のユーザが、前記第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの前記結果を出力することを含む、請求項15に記載の1つまたは複数のメモリ。
  20. ソーシャルビジネス特性を持つユーザを識別する装置であって、
    候補ユーザのユーザデータを獲得するユーザデータ獲得モジュールであって、前記ユーザデータは、第1の期間に関連付けられた第1の社会的属性データ及び第1のビジネスオブジェクト属性データと、第2の期間に関連付けられた第2の社会的属性データ及び第2のビジネスオブジェクト属性データとを含み、前記第2の期間は前記第1の期間の前の期間である、ユーザデータ獲得モジュールと、
    前記第1の社会的属性データに従って、前記候補ユーザの少なくとも一部のソーシャルビジネス特性を持つユーザをマイニングするソーシャルビジネス特性ユーザマイニングモジュールと、
    前記ソーシャルビジネス特性を持つユーザの前記第2の社会的属性データおよび前記第2のビジネスオブジェクト属性データを使用して、分類器を訓練する分類器訓練モジュールと、
    隣のユーザの第1の社会的属性データ及び第1のビジネスオブジェクト属性データを前記分類器に入力し、且つ、前記隣のユーザが、前記第1の期間の後の期間に、ソーシャルビジネス特性を持つユーザとなるか否かの結果を出力するソーシャルビジネス特性ユーザ識別モジュールと、を含み、前記隣のユーザは、前記ソーシャルビジネス特性を持つユーザ以外の候補ユーザである、装置。
JP2018524318A 2015-11-16 2016-11-16 ソーシャルビジネス特性を持つユーザの識別 Pending JP2018537768A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510784634.5A CN106708871B (zh) 2015-11-16 2015-11-16 一种社交业务特征用户的识别方法和装置
CN201510784634.5 2015-11-16
PCT/US2016/062321 WO2017087548A1 (en) 2015-11-16 2016-11-16 Identifying social business characteristic user

Publications (1)

Publication Number Publication Date
JP2018537768A true JP2018537768A (ja) 2018-12-20

Family

ID=58690175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018524318A Pending JP2018537768A (ja) 2015-11-16 2016-11-16 ソーシャルビジネス特性を持つユーザの識別

Country Status (5)

Country Link
US (1) US20170140301A1 (ja)
JP (1) JP2018537768A (ja)
CN (1) CN106708871B (ja)
TW (1) TWI705411B (ja)
WO (1) WO2017087548A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729469A (zh) * 2017-10-12 2018-02-23 北京小度信息科技有限公司 用户挖掘方法、装置、电子设备及计算机可读存储介质
CN107909516A (zh) * 2017-12-06 2018-04-13 链家网(北京)科技有限公司 一种问题房源识别方法和系统
CN110232393B (zh) * 2018-03-05 2022-11-04 腾讯科技(深圳)有限公司 数据的处理方法、装置、存储介质和电子装置
CN108932658B (zh) * 2018-07-13 2021-07-06 京东数字科技控股有限公司 数据处理方法、装置和计算机可读存储介质
CN110598993B (zh) * 2019-08-19 2023-04-18 深圳市鹏海运电子数据交换有限公司 数据加工方法及装置
CN111008872B (zh) * 2019-12-16 2022-06-14 华中科技大学 一种适用于以太坊的用户画像构建方法及系统

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6853998B2 (en) * 2001-02-07 2005-02-08 International Business Machines Corporation Customer self service subsystem for classifying user contexts
US20090049127A1 (en) * 2007-08-16 2009-02-19 Yun-Fang Juan System and method for invitation targeting in a web-based social network
US7873584B2 (en) * 2005-12-22 2011-01-18 Oren Asher Method and system for classifying users of a computer network
US20090012841A1 (en) * 2007-01-05 2009-01-08 Yahoo! Inc. Event communication platform for mobile device users
US8566256B2 (en) * 2008-04-01 2013-10-22 Certona Corporation Universal system and method for representing and predicting human behavior
US20110231296A1 (en) * 2010-03-16 2011-09-22 UberMedia, Inc. Systems and methods for interacting with messages, authors, and followers
CN102117325A (zh) * 2011-02-24 2011-07-06 清华大学 动态社会网络用户行为的预测方法
US20150142689A1 (en) * 2011-09-16 2015-05-21 Movband, Llc Dba Movable Activity monitor
US20130097246A1 (en) * 2011-10-12 2013-04-18 Cult, Inc. Multilocal implicit social networking
US9135211B2 (en) * 2011-12-20 2015-09-15 Bitly, Inc. Systems and methods for trending and relevance of phrases for a user
US9619811B2 (en) * 2011-12-20 2017-04-11 Bitly, Inc. Systems and methods for influence of a user on content shared via 7 encoded uniform resource locator (URL) link
CN102629904B (zh) * 2012-02-24 2015-02-18 安徽博约信息科技有限责任公司 一种网络水军的探测与判定方法
US10032180B1 (en) * 2012-10-04 2018-07-24 Groupon, Inc. Method, apparatus, and computer program product for forecasting demand using real time demand
US9183282B2 (en) * 2013-03-15 2015-11-10 Facebook, Inc. Methods and systems for inferring user attributes in a social networking system
US20140358630A1 (en) * 2013-05-31 2014-12-04 Thomson Licensing Apparatus and process for conducting social media analytics
US9152694B1 (en) * 2013-06-17 2015-10-06 Appthority, Inc. Automated classification of applications for mobile devices
US20150006241A1 (en) * 2013-06-27 2015-01-01 Hewlett-Packard Development Company, L.P. Analyzing participants of a social network
US10210458B2 (en) * 2013-11-19 2019-02-19 Facebook, Inc. Selecting users to receive a recommendation to establish connection to an object in a social networking system
CN104102819B (zh) * 2014-06-27 2017-12-19 北京奇艺世纪科技有限公司 一种用户自然属性的确定方法和装置
US10102480B2 (en) * 2014-06-30 2018-10-16 Amazon Technologies, Inc. Machine learning service
US10528999B2 (en) * 2014-08-18 2020-01-07 Yp Llc Systems and methods for facilitating discovery and management of business information
US9747556B2 (en) * 2014-08-20 2017-08-29 Vertafore, Inc. Automated customized web portal template generation systems and methods
US20160092793A1 (en) * 2014-09-26 2016-03-31 Thomson Reuters Global Resources Pharmacovigilance systems and methods utilizing cascading filters and machine learning models to classify and discern pharmaceutical trends from social media posts
US9971972B2 (en) * 2014-12-30 2018-05-15 Oath Inc. Predicting the next application that you are going to use on aviate
US9805427B2 (en) * 2015-01-29 2017-10-31 Salesforce.Com, Inc. Systems and methods of data mining to customize software trial demonstrations
US20170034108A1 (en) * 2015-07-30 2017-02-02 Facebook, Inc. Determining event recommendability in online social networks
US10554611B2 (en) * 2015-08-10 2020-02-04 Google Llc Privacy aligned and personalized social media content sharing recommendations

Also Published As

Publication number Publication date
CN106708871B (zh) 2020-08-11
US20170140301A1 (en) 2017-05-18
TW201719569A (zh) 2017-06-01
CN106708871A (zh) 2017-05-24
TWI705411B (zh) 2020-09-21
WO2017087548A1 (en) 2017-05-26

Similar Documents

Publication Publication Date Title
JP2018537768A (ja) ソーシャルビジネス特性を持つユーザの識別
KR101419504B1 (ko) 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법
Suresh An unsupervised fuzzy clustering method for twitter sentiment analysis
US11275748B2 (en) Influence score of a social media domain
CN107391545B (zh) 一种对用户进行分类的方法、输入方法及装置
US10055741B2 (en) Method and apparatus of matching an object to be displayed
CN107633416B (zh) 一种业务对象的推荐方法、装置和系统
JP2019502995A (ja) 類似用語集約方法及び装置
KR102146546B1 (ko) 상황인지 기반의 기업주가예측 알고리즘 제공 방법
JP2015525418A (ja) 検索方法および装置
CN108241867B (zh) 一种分类方法及装置
US20190087859A1 (en) Systems and methods for facilitating deals
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
Puri et al. Survey big data analytics, applications and privacy concerns
Woo et al. Predicting the ratings of Amazon products using Big Data
CN116739626A (zh) 商品数据挖掘处理方法、装置、电子设备及可读介质
US10339559B2 (en) Associating social comments with individual assets used in a campaign
Al-Dhelaan et al. Graph summarization for hashtag recommendation
CN113821727A (zh) 物品推荐方法、计算机设备及计算机可读存储介质
JP6509590B2 (ja) 商品に対するユーザの感情分析装置及びプログラム
TWI621952B (zh) 比較表格自動產生方法、裝置及其電腦程式產品
CN110168534B (zh) 用于测试驱动双层图模型的方法和系统
Bhatt et al. Web Scraping: Huge Data collection from Web
Kim et al. TrendsSummary: a platform for retrieving and summarizing trendy multimedia contents
Aytaç et al. Analysis of digital marketing strategies of deposit banks in Turkey via text mining twitter posts