JP2019029003A - 特徴分析方法、特徴分析装置、電子機器、プログラム及び記憶媒体 - Google Patents
特徴分析方法、特徴分析装置、電子機器、プログラム及び記憶媒体 Download PDFInfo
- Publication number
- JP2019029003A JP2019029003A JP2018112480A JP2018112480A JP2019029003A JP 2019029003 A JP2019029003 A JP 2019029003A JP 2018112480 A JP2018112480 A JP 2018112480A JP 2018112480 A JP2018112480 A JP 2018112480A JP 2019029003 A JP2019029003 A JP 2019029003A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- group
- data
- value
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明の実施例は、図1に示すように、特徴テンプレートファイルから特徴抽出情報を抽出するステップ101と、前記特徴抽出情報により処理すべきデータを複数の特徴グループにアグリゲーションし、且つ各特徴グループの特徴値を計算するステップ102と、前記特徴抽出情報と各特徴グループの特徴値により特徴グループに跨るサンプルレベルの特徴値を計算して取得し、且つ各特徴グループの特徴値と前記サンプルレベルの特徴値をスティッチングして特徴ベクトルを取得するステップ103と、を含む特徴分析方法を提供する。
本発明の実施例は、図6に示すように、特徴テンプレートファイルから特徴抽出情報を抽出する特徴テンプレート解析モジュール21と、前記特徴抽出情報により処理すべきデータを複数の特徴グループにアグリゲーションし、且つ各特徴グループの特徴値を計算する特徴値計算モジュール22と、前記特徴抽出情報と各特徴グループの特徴値により特徴グループに跨るサンプルレベルの特徴値を計算して取得し、且つ各特徴グループの特徴値と前記サンプルレベルの特徴値をスティッチングして特徴ベクトルを取得する特徴ベクトル生成モジュール23と、を含む特徴分析装置を提供する。
本発明の実施例は、図11に示すように、プロセッサ32と、コンピュータプログラムのコマンドを格納するメモリ34と、を含む特徴分析のための電子機器30を提供する。
プログラマブル ゲート アレイ(FPGA)、汎用プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、本願の前記機能を実現するためのほかの電子モジュールまたは組み合わせに実現可能である。
本発明の実施例はまた、特徴分析方法をコンピュータに実行させるためのコンピュータプログラムを提供する。該特徴分析方法は、特徴テンプレートファイルから特徴抽出情報を抽出するステップと、前記特徴抽出情報に基づいて処理すべきデータを複数の特徴グループにアグリゲーションし、各特徴グループの特徴値を計算するステップと、前記特徴抽出情報及び各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算し、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして特徴ベクトルを取得するステップと、を含む。
次に、データがユーザー行動データである場合を例に、添付図に合わせて本発明の特徴分析方法についてさらに説明する。図12に示すように、本発明実施例の特徴分析方法は具体的に次のステップを含む。
(T=M, U=A, P=N)のユーザー行動データのみを必要とする。Reducing段階を実行する必要はない。
(T=M, U=A, P=N1、)、Group (T=M,
U=A, P=N2)、…、Group (T=M, U=A, P=Nk)の特徴値をそれぞれ計算した後、Reducing段階を実行して当該K個の特徴グループの特徴値を合成して、初めて特徴グループGroup (T=M, U=A)の特徴値を取得することができ、その中で、Kはすべての製品の個数である。
Claims (11)
- 特徴テンプレートファイルから特徴抽出情報を抽出するステップと、
前記特徴抽出情報に基づいて処理すべきデータを複数の特徴グループにアグリゲーションし、各特徴グループの特徴値を計算するステップと、
前記特徴抽出情報及び各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算し、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして特徴ベクトルを取得するステップと、を含むことを特徴とする特徴分析方法。 - 前記特徴テンプレートファイルから特徴抽出情報を抽出するステップは、
特徴テンプレートファイルをロードし、前記特徴テンプレートファイルのファイルフォーマットを検証することと、
前記特徴テンプレートファイルのフォーマットが正確である場合、前記特徴テンプレートファイルから、次元情報、演算子情報及びサンプル構造情報を含む特徴抽出情報を抽出することと、を含むことを特徴とする請求項1に記載の特徴分析方法。 - 前記特徴抽出情報に基づいて処理すべきデータを複数の特徴グループにアグリゲーションし、各特徴グループの特徴値を計算するステップは、
前記次元情報に基づいて処理すべきデータから、前記次元情報に対応する次元を有する複数のデータを抽出することと、
前記サンプル構造情報に基づいて抽出されたデータを複数の特徴グループにアグリゲーションし、前記演算子情報に基づいて各特徴グループのデータに対して対応する操作を行って各特徴グループの特徴値を生成することと、を含むことを特徴とする請求項2に記載の特徴分析方法。 - 前記サンプル構造情報は、前記特徴ベクトルに必要な次元値、サンプルレベル特徴値の計算方法、及び特徴グループの特徴値とサンプルレベル特徴値をスティッチングする方法を含み、
前記演算子情報は、演算子名称、各演算子のパラメータリスト、及び異なる演算子の間の関係を含むことを特徴とする請求項3に記載の特徴分析方法。 - 前記次元情報は、時間、ユーザーID、及び製品IDを含み、
前記処理すべきデータは、ユーザー行動データであり、
前記次元情報に基づいて処理すべきデータから、前記次元情報に対応する次元を有する複数のデータを抽出することは、処理すべきデータから複数のユーザー行動データを抽出することを含み、抽出された各ユーザー行動データは、時間とユーザーIDと製品IDの三つの次元を有ることを特徴とする請求項4に記載の特徴分析方法。 - 前記サンプル構造情報に基づいて抽出されたデータを複数の特徴グループにアグリゲーションする前に、前記特徴ベクトルに必要な次元値に基づいて、抽出された複数のデータをフィルタリングし、前記次元値を含まないデータを除去すること、をさらに含み、
前記サンプル構造情報に基づいて抽出されたデータを複数の特徴グループにアグリゲーションすることは、フィルタリングされたデータを複数の特徴グループにアグリゲーションすることを含み、各特徴グループのデータの次元値は同じであることを含むことを特徴とする請求項4に記載の特徴分析方法。 - 前記特徴抽出情報及び各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算し、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして特徴ベクトルを取得するステップは、
前記サンプルレベル特徴値の計算方法により、各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算することと、
前記特徴グループの特徴値とサンプルレベル特徴値をスティッチングする方法により、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして前記特徴ベクトルを取得することと、を含むことを特徴とする請求項4に記載の特徴分析方法。 - 特徴テンプレートファイルから特徴抽出情報を抽出する特徴テンプレート解析モジュールと、
前記特徴抽出情報に基づいて処理すべきデータを複数の特徴グループにアグリゲーションし、各特徴グループの特徴値を計算する特徴値計算モジュールと、
前記特徴抽出情報及び各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算し、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして特徴ベクトルを取得する特徴ベクトル生成モジュールと、を含むことを特徴とする特徴分析装置。 - 特徴分析のための電子機器であって、
プロセッサと、
コンピュータプログラムコマンドを格納するメモリと、を含み、
前記コンピュータプログラムコマンドが前記プロセッサにより実行される時、前記プロセッサに、
特徴テンプレートファイルから特徴抽出情報を抽出するステップと、
前記特徴抽出情報に基づいて処理すべきデータを複数の特徴グループにアグリゲーションし、各特徴グループの特徴値を計算するステップと、
前記特徴抽出情報及び各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算し、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして特徴ベクトルを取得するステップと、を実行させることを特徴とする電子機器。 - 特徴分析方法をコンピュータに実行させるためのコンピュータプログラムであって、前記特徴分析方法は、
特徴テンプレートファイルから特徴抽出情報を抽出するステップと、
前記特徴抽出情報に基づいて処理すべきデータを複数の特徴グループにアグリゲーションし、各特徴グループの特徴値を計算するステップと、
前記特徴抽出情報及び各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算し、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして特徴ベクトルを取得するステップと、を含むことを特徴とするプログラム。 - コンピュータ読み取り可能な記憶媒体であって、前記コンピュータ読み取り可能な記憶媒体はコンピュータプログラムコマンドを格納し、
特徴分析方法をコンピュータに実行させるためのコンピュータプログラムがプロセッサにより実行される場合、前記プロセッサに、
特徴テンプレートファイルから特徴抽出情報を抽出するステップと、
前記特徴抽出情報に基づいて処理すべきデータを複数の特徴グループにアグリゲーションし、各特徴グループの特徴値を計算するステップと、
前記特徴抽出情報及び各特徴グループの特徴値に基づいて特徴グループに跨るサンプルレベル特徴値を計算し、各特徴グループの特徴値と前記サンプルレベル特徴値をスティッチングして特徴ベクトルを取得するステップと、を実行させることを特徴とするコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710640826.8A CN109325167B (zh) | 2017-07-31 | 2017-07-31 | 特征分析方法、装置、设备、计算机可读存储介质 |
CN201710640826.8 | 2017-07-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019029003A true JP2019029003A (ja) | 2019-02-21 |
JP6587012B2 JP6587012B2 (ja) | 2019-10-09 |
Family
ID=65245030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018112480A Active JP6587012B2 (ja) | 2017-07-31 | 2018-06-13 | 特徴分析方法、特徴分析装置、電子機器、プログラム及び記憶媒体 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6587012B2 (ja) |
CN (1) | CN109325167B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291230A (zh) * | 2020-02-06 | 2020-06-16 | 北京奇艺世纪科技有限公司 | 特征处理方法、装置、电子设备及计算机可读存储介质 |
WO2021036589A1 (zh) * | 2019-08-29 | 2021-03-04 | 腾讯科技(深圳)有限公司 | 人工智能推荐模型的特征处理方法、装置、电子设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114491040B (zh) * | 2022-01-28 | 2022-12-02 | 北京百度网讯科技有限公司 | 信息挖掘方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013239029A (ja) * | 2012-05-15 | 2013-11-28 | Nippon Telegr & Teleph Corp <Ntt> | 要約可視化装置、方法、及びプログラム |
JP2014232504A (ja) * | 2013-05-30 | 2014-12-11 | 日本電気株式会社 | 希少度算出装置、希少度算出方法および希少度算出プログラム |
WO2016080413A1 (ja) * | 2014-11-19 | 2016-05-26 | 株式会社インフォメックス | データ検索装置、プログラム、及び記録媒体 |
JP2017097717A (ja) * | 2015-11-26 | 2017-06-01 | 株式会社博報堂 | 情報処理システム及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL195956A0 (en) * | 2008-12-15 | 2009-09-01 | Hyperroll Israel Ltd | Automatic data store architecture detection |
CN101645271B (zh) * | 2008-12-23 | 2011-12-07 | 中国科学院声学研究所 | 发音质量评估系统中的置信度快速求取方法 |
CN102760138B (zh) * | 2011-04-26 | 2015-03-11 | 北京百度网讯科技有限公司 | 用户网络行为的分类方法和装置及对应的搜索方法和装置 |
JP2013068985A (ja) * | 2011-09-20 | 2013-04-18 | Canon Inc | ベクトル描画装置、ベクトル描画方法及びプログラム |
CN102982077B (zh) * | 2012-10-30 | 2015-09-16 | 中国联合网络通信集团有限公司 | 用户数据处理方法及装置 |
CN104699717B (zh) * | 2013-12-10 | 2019-01-18 | 中国银联股份有限公司 | 数据挖掘方法 |
CN106294338B (zh) * | 2015-05-12 | 2019-08-30 | 株式会社理光 | 信息处理方法和信息处理装置 |
CN106407215B (zh) * | 2015-07-31 | 2019-08-13 | 阿里巴巴集团控股有限公司 | 一种数据处理方法及装置 |
CN106910512A (zh) * | 2015-12-18 | 2017-06-30 | 株式会社理光 | 语音文件的分析方法、装置及系统 |
-
2017
- 2017-07-31 CN CN201710640826.8A patent/CN109325167B/zh active Active
-
2018
- 2018-06-13 JP JP2018112480A patent/JP6587012B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013239029A (ja) * | 2012-05-15 | 2013-11-28 | Nippon Telegr & Teleph Corp <Ntt> | 要約可視化装置、方法、及びプログラム |
JP2014232504A (ja) * | 2013-05-30 | 2014-12-11 | 日本電気株式会社 | 希少度算出装置、希少度算出方法および希少度算出プログラム |
WO2016080413A1 (ja) * | 2014-11-19 | 2016-05-26 | 株式会社インフォメックス | データ検索装置、プログラム、及び記録媒体 |
JP2017097717A (ja) * | 2015-11-26 | 2017-06-01 | 株式会社博報堂 | 情報処理システム及びプログラム |
Non-Patent Citations (1)
Title |
---|
市川 裕介: "Webアクセスログに基づくユーザの革新性推定手法の提案", 情報処理学会 論文誌(トランザクション) コンシューマ・デバイス&システム(CDS) [ONLIN, vol. 第3巻,第3号, JPN6019020175, 31 July 2013 (2013-07-31), pages 85 - 93, ISSN: 0004046554 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021036589A1 (zh) * | 2019-08-29 | 2021-03-04 | 腾讯科技(深圳)有限公司 | 人工智能推荐模型的特征处理方法、装置、电子设备及存储介质 |
CN111291230A (zh) * | 2020-02-06 | 2020-06-16 | 北京奇艺世纪科技有限公司 | 特征处理方法、装置、电子设备及计算机可读存储介质 |
CN111291230B (zh) * | 2020-02-06 | 2023-09-15 | 北京奇艺世纪科技有限公司 | 特征处理方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109325167A (zh) | 2019-02-12 |
JP6587012B2 (ja) | 2019-10-09 |
CN109325167B (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109542399B (zh) | 软件开发方法、装置、终端设备及计算机可读存储介质 | |
US10963292B2 (en) | Techniques to manage virtual classes for statistical tests | |
JP6587012B2 (ja) | 特徴分析方法、特徴分析装置、電子機器、プログラム及び記憶媒体 | |
Hwang et al. | Cloud performance modeling with benchmark evaluation of elastic scaling strategies | |
WO2020253059A1 (zh) | 多级联动下拉框的实现方法、装置和计算机设备 | |
US10042732B2 (en) | Dynamic data collection pattern for target device | |
US11016477B2 (en) | Devices, methods, and systems for a distributed rule based automated fault detection | |
CN109189572B (zh) | 一种资源预估方法及系统、电子设备和存储介质 | |
JP2019508774A (ja) | データベースシステム最適化の方法、システム、電子装置及び記憶媒体 | |
Li et al. | Siphon extraction for deadlock control in flexible manufacturing systems by using Petri nets | |
CN109542962B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
US9164746B2 (en) | Automatic topology extraction and plotting with correlation to real time analytic data | |
Roberts et al. | Metrics for energy-aware software optimisation | |
CN111338626B (zh) | 一种界面渲染方法、装置、电子设备及介质 | |
CN109344050B (zh) | 一种基于结构树的接口参数分析方法及装置 | |
CN104572427A (zh) | 一种页面测试的方法、服务器及系统 | |
CN108470242B (zh) | 风险管控方法、装置、及服务器 | |
US9978070B1 (en) | Dynamic customer relationship management while maintaining customer privacy | |
CN115113862A (zh) | 一种派生指标创建方法、装置、电子设备及存储介质 | |
CN107506299B (zh) | 一种代码分析方法及终端设备 | |
US8495033B2 (en) | Data processing | |
CN111813789A (zh) | 数据配置方法、装置、计算机可读存储介质及电子设备 | |
CN112668887B (zh) | 业务数据获取方法、装置、可读存储介质及电子设备 | |
CN103544017A (zh) | Lammps的计算任务的实现方法和装置 | |
KR102185980B1 (ko) | 테이블 처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190604 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190813 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190826 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6587012 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |