JP2010210245A - データ類似度計算方法、システム、およびプログラム - Google Patents
データ類似度計算方法、システム、およびプログラム Download PDFInfo
- Publication number
- JP2010210245A JP2010210245A JP2009053364A JP2009053364A JP2010210245A JP 2010210245 A JP2010210245 A JP 2010210245A JP 2009053364 A JP2009053364 A JP 2009053364A JP 2009053364 A JP2009053364 A JP 2009053364A JP 2010210245 A JP2010210245 A JP 2010210245A
- Authority
- JP
- Japan
- Prior art keywords
- data
- value
- similarity calculation
- discretization
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Complex Calculations (AREA)
Abstract
【解決手段】離散化ルール記憶装置30は、実数値離散化ルールおよびシンボル値離散化ルールを記憶している。離散化装置20は、ECU10、11から得られた車両状態データの各属性を、該属性が実数値であれば実数値離散化ルールに従い離散値に変換し、シンボル値であればシンボル値離散化ルールに従い離散値に変換する。類似度計算方法記憶装置は類似度計算方法を記憶している。類似度計算装置は、前記両車両状態データ類似度を、類似度計算方法に従い各属性の離散値に基づいて計算する。
【選択図】図1
Description
図1に示すように、本発明の第1の実施の形態の類似度計算システム12Aは、離散化装置20と離散化ルール記憶装置30と類似度計算装置40と類似度計算方法記憶装置50と類似度計算結果表示装置60からなり、ECU10、11と接続されている。
図8に示すように、本発明の第2の実施の形態の類似度計算システム12Bは、離散化装置20と離散化ルール記憶装置30と類似度計算装置40と類似度計算方法記憶装置50と類似度計算結果表示装置60と離散化ルール学習装置70からなる。本実施の形態は、第1の実施の形態とは、離散化処理を行うための離散化ルールを常に最新の状態にするものとして離散化ルール学習装置70が追加されている点が異なる。
データの分布のみを利用する場合には、図10に示されるようにXjの分布P(Xj)をヒストグラムによって表現し、ヒストグラムの各領域に離散値を割り当てることで離散化ルールを算出する。データからヒストグラムを算出する際に、ヒストグラムの各領域の区切り位置を、データに合わせて算出する方法は、任意の技術を利用することが可能である。
ラベルの分布を利用する場合には、図11に示されるように離散化の各領域に対するラベルの予測分布を最適化することで、離散化ルールを学習する。各領域に対するラベルの予測分布を最適化する方法は、任意の技術を利用することが可能である。以下では、最小記述長原理を用いた方法を説明する。
データの分布とラベルの分布を同時に考慮して離散化ルールを算出する場合には、Lx+Ly+Ljを最小化する領域数および区切り位置を算出することによって離散化ルールを算出する。
図12に示すように、本発明の第3の実施の形態の類似度計算システム12Cは、離散化装置20と離散化ルール記憶装置30と類似度計算装置40と類似度計算方法記憶装置部50と類似度計算結果表示装置60と離散化ルール学習装置70と故障ポイントデータ記憶装置80からなる。本実施の形態は、第2の実施の形態とは、故障ポイントデータ記憶装置80が追加されている点が異なる。
図13に示す本発明の第4の実施の形態の類似度計算システム12Dは、離散化処理を車両外システムで行うのではなく、車両内システムで行うという点で、第2の実施の形態と異なるものである。
第1から第4の実施の形態において、類似度計算装置40をASP(Application Service Provider)として構成する。その他の構成は、第1〜4の実施の形態と同じである。
データ類似度計算システムの機能は、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータ内の揮発性メモリのように、一定時間プログラムを保持しているものを含む。
12A、12B、12C、12D 類似度計算システム
20 離散化装置
21 制御部
22 通信部
23 記憶部
24 離散化結果情報
24a 属性名
24b 属性値
30 離散化ルール記憶装置
40 類似度計算装置
41 制御部
42 通信部
43 記憶部
44 類似度計算結果情報
50 類似度計算方法記憶装置
60 類似度計算結果表示装置
70 離散化ルール学習装置
80 故障ポイントデータ記憶装置
90 離散化ルール配信装置
101〜104、201、202、301、302 ステップ
401、402、501〜506 ステップ
Claims (27)
- 実数値またはシンボル値を有する複数の属性を持つデータである第1のデータと第2のデータの類似度を計算するデータ類似度計算方法であって、
前記第1および第2のデータの各属性を、該属性が実数値であれば予め決められた実数値離散化ルールに従い離散値に変換し、該属性がシンボル値であれば予め決められたシンボル値離散化ルールに従い離散値に変換することと、
前記第1と第2のデータの類似度を、予め決められた類似度計算ルールに従い、各属性の離散値に基づいて計算することと、
を有するデータ類似度計算方法。 - 前記第1と第2のデータの類似度の計算が、離散化されたデータ同士の間に定義される任意の関数の値をデータの類似度とすることを含む、請求項1に記載のデータ類似度計算方法。
- 前記第1と第2のデータの類似度の計算が、特定の属性に重み付けすることを含む、請求項2に記載のデータ類似度計算方法。
- 既存のデータを用いて前記実数値離散化ルールおよび前記シンボル値離散化ルールを新たに作成し、または更新することをさらに有する、請求項1から3のいずれか1項に記載のデータ類似度計算方法。
- 前記実数値離散化ルールおよび前記シンボル値離散化ルールを新たに作成または更新することは、
各属性が実数値かシンボル値かを判定することと、
実数値の場合、離散値の数と、各離散値に変換されるデータの範囲である閾値を算出し、前記実数値離散化ルールを作成または更新することと、
シンボル値の場合、該シンボル値に対応する離散値がシンボル値離散化ルールに含まれるかどうか判定し、含まれていなければ前記シンボル値離散化ルールを更新することと、
を含む、請求項4に記載のデータ類似度計算方法。 - 前記離散化ルールの作成、更新に関して、さらに各データに対するラベルを用いる、請求項4に記載のデータ類似度計算方法。
- 実数値を取るデータの各属性に関し、データあるいはラベルの分布に対する離散分布を学習することで、前記離散化ルールを予め計算する、請求項4から6のいずれか1項に記載のデータ類似度計算方法。
- 前記離散化ルールの学習の基準として、情報量基準を利用することで、離散分布の領域数と区切り位置を最適化して前記離散化ルールを計算する、請求項7に記載のデータ類似度計算方法。
- 前記離散化ルールの学習に関し、前記情報量基準として最小記述長を用いて前記離散化ルールを計算する、請求項8に記載のデータ類似度計算方法。
- 前記離散分布としてデータに対する離散密度分布を利用する、請求項7から9のいずれか1項に記載のデータ類似度計算方法。
- 前記離散分布としてラベルに対する予測分布を利用する、請求項7から9のいずれか1項に記載のデータ類似度計算方法。
- 前記離散分布としてデータとラベルに対する同時分布を利用する、請求項7から9のいずれか1項に記載のデータ類似度計算方法。
- 実数値またはシンボル値を有する複数の属性を持つデータである第1のデータと第2のデータの類似度を計算するデータセット類似度計算システムであって、
実数値離散化ルールおよびシンボル値離散化ルールを記憶している離散化ルール記憶手段と、
前記第1および第2のデータの各属性を、該属性が実数値であれば前記実数値離散化ルールに従い離散値に変換し、該属性がシンボル値であれば前記シンボル値離散化ルールに従い離散値に変換する離散化手段と、
類似度計算方法を記憶している類似度計算方法記憶手段と、
前記第1と第2のデータの類似度を、前記類似度計算方法に従い各属性の離散値に基づいて計算する類似度計算手段と、
を有するデータ類似度計算システム。 - 前記類似度計算手段は、離散化されたデータ同士の間に定義される任意の関数の値をデータの類似度とする、請求項13に記載のデータ類似度計算システム。
- 前記類似度計算手段は、特定の属性に重み付けする、請求項14に記載のデータ類似度計算システム。
- 既存のデータを用いて前記実数値離散化ルールおよび前記シンボル値離散化ルールを新たに作成し、または更新する離散化ルール学習手段をさらに有する、請求項13から15のいずれか1項に記載のデータ類似度計算システム。
- 前記離散化ルール学習手段は、各属性が実数値かシンボル値かを判定し、実数値の場合、離散値の数と、各離散値に変換されるデータの範囲である閾値を算出して、前記実数値離散化ルールを作成または更新し、シンボル値の場合、該シンボル値に対応する離散値がシンボル値離散化ルールに含まれるかどうか判定し、含まれていなければ前記シンボル値離散化ルールを更新する、請求項16に記載のデータ類似度計算システム。
- 前記離散化ルール学習手段は、前記離散化ルールの作成、更新に関して、さらに各データに対するラベルを用いる、請求項16記載のデータ類似度計算システム。
- 前記離散化ルール学習手段は、実数値を取るデータの各属性に関し、データあるいはラベルの分布に対する離散分布を学習することで、前記離散化ルールを予め計算する、請求項16から18のいずれか1項に記載のデータ類似度計算システム。
- 前記離散化ルール学習手段は、前記離散化ルールの学習の基準として、情報量基準を利用することで、離散分布の領域数と区切り位置を最適化して前記離散化ルールを計算する、請求項19に記載のデータ類似度計算システム。
- 前記離散化ルール学習手段は、前記情報量基準として最小記述長を用いて前記離散化ルールを計算する、請求項20に記載のデータ類似度計算システム。
- 前記離散化ルール学習手段は、前記離散分布としてデータに対する離散密度分布を利用する、請求項19から21のいずれか1項に記載のデータ類似度システム。
- 前記離散化ルール学習手段は、前記離散分布としてラベルに対する予測分布を利用する、請求項19から21のいずれか1項に記載のデータ類似度計算システム。
- 前記離散化ルール学習手段は、前記離散分布としてデータとラベルに対する同時分布を利用する、請求項19から21のいずれか1項に記載のデータ類似度計算システム。
- 前記離散化装置を用いて離散化された故障ポイントデータ群が、各データに対するラベル情報とセットで格納されている故障ポイントデータ記憶装置をさらに有する、請求項13から24のいずれか1項に記載のデータ類似度計算システム。
- 前記類似度計算装置がASP(Application Service Provider)である、請求項13から25のいずれか1項に記載のデータ類似度計算システム。
- 複数の属性からなる第1のデータと第2のデータの類似度を計算することをコンピュータに実行させるためのデータ類似度計算プログラムであって、
前記第1および第2のデータの各属性を、該属性が実数値であれば離散化ルール記憶手段に記憶されている実数値離散化ルールに従い離散値に変換し、シンボル値であれば離散化ルール記憶手段に記憶されているシンボル値離散化ルールに従い離散値に変換する手順と、
前記第1と第2のデータの類似度を、類似度計算方法記憶手段に記憶されている類似度計算方法に従い各属性のデータの離散値に基づいて計算する手順と、
をコンピュータに実行させるためのデータ類似度計算プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009053364A JP5572966B2 (ja) | 2009-03-06 | 2009-03-06 | データ類似度計算方法、システム、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009053364A JP5572966B2 (ja) | 2009-03-06 | 2009-03-06 | データ類似度計算方法、システム、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010210245A true JP2010210245A (ja) | 2010-09-24 |
JP5572966B2 JP5572966B2 (ja) | 2014-08-20 |
Family
ID=42970594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009053364A Active JP5572966B2 (ja) | 2009-03-06 | 2009-03-06 | データ類似度計算方法、システム、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5572966B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103018058A (zh) * | 2012-12-17 | 2013-04-03 | 北京交通大学 | 基于相似度的列车悬挂系统故障分离方法 |
JP2015176285A (ja) * | 2014-03-14 | 2015-10-05 | 株式会社デンソー | 故障情報提示システム |
CN115858637A (zh) * | 2023-03-02 | 2023-03-28 | 四川三思德科技有限公司 | 一种城市地下水监测与分析方法及系统 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05180730A (ja) * | 1991-10-25 | 1993-07-23 | Mazda Motor Corp | 故障診断方法 |
JPH07168810A (ja) * | 1993-12-16 | 1995-07-04 | Nec Corp | データ駆動型確率分布推定装置 |
JPH11338855A (ja) * | 1998-05-21 | 1999-12-10 | Fujitsu Ltd | データ分解装置、その方法、及び記録媒体 |
JP2002149697A (ja) * | 2000-11-07 | 2002-05-24 | Mitsubishi Electric Corp | 類似事例検索装置 |
WO2002054758A1 (fr) * | 2000-12-28 | 2002-07-11 | Evolvable Systems Research Institute, Inc. | Procede, dispositif et programme de codage et decodage de prediction adaptative |
JP2002204358A (ja) * | 2000-12-28 | 2002-07-19 | National Institute Of Advanced Industrial & Technology | 適応型予測符号化、復号化方法およびそれらの装置ならびに適応型予測符号化、復号化プログラムを記録した記録媒体 |
JP2003271640A (ja) * | 2002-03-15 | 2003-09-26 | Fujitsu Ltd | プロファイル情報の推薦方法、プログラム及び装置 |
JP2005202762A (ja) * | 2004-01-16 | 2005-07-28 | Denso Corp | 車両用通信システム |
JP2005257416A (ja) * | 2004-03-10 | 2005-09-22 | Internatl Business Mach Corp <Ibm> | 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体 |
JP2007164406A (ja) * | 2005-12-13 | 2007-06-28 | Oita Univ | 学習機構付意思決定システム |
JP2007286899A (ja) * | 2006-04-17 | 2007-11-01 | First Server Kk | アプリケーション実行システムおよびサーバ |
JP2010170424A (ja) * | 2009-01-23 | 2010-08-05 | Nec Corp | 分布推定装置、クラスタリング装置、分布推定装置の推定方法及びプログラム |
JP2010212744A (ja) * | 2009-03-06 | 2010-09-24 | Nec Corp | データ圧縮方法、装置、およびプログラム |
-
2009
- 2009-03-06 JP JP2009053364A patent/JP5572966B2/ja active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05180730A (ja) * | 1991-10-25 | 1993-07-23 | Mazda Motor Corp | 故障診断方法 |
JPH07168810A (ja) * | 1993-12-16 | 1995-07-04 | Nec Corp | データ駆動型確率分布推定装置 |
JPH11338855A (ja) * | 1998-05-21 | 1999-12-10 | Fujitsu Ltd | データ分解装置、その方法、及び記録媒体 |
JP2002149697A (ja) * | 2000-11-07 | 2002-05-24 | Mitsubishi Electric Corp | 類似事例検索装置 |
WO2002054758A1 (fr) * | 2000-12-28 | 2002-07-11 | Evolvable Systems Research Institute, Inc. | Procede, dispositif et programme de codage et decodage de prediction adaptative |
JP2002204358A (ja) * | 2000-12-28 | 2002-07-19 | National Institute Of Advanced Industrial & Technology | 適応型予測符号化、復号化方法およびそれらの装置ならびに適応型予測符号化、復号化プログラムを記録した記録媒体 |
JP2003271640A (ja) * | 2002-03-15 | 2003-09-26 | Fujitsu Ltd | プロファイル情報の推薦方法、プログラム及び装置 |
JP2005202762A (ja) * | 2004-01-16 | 2005-07-28 | Denso Corp | 車両用通信システム |
JP2005257416A (ja) * | 2004-03-10 | 2005-09-22 | Internatl Business Mach Corp <Ibm> | 診断装置、検出装置、制御方法、検出方法、プログラム、及び記録媒体 |
JP2007164406A (ja) * | 2005-12-13 | 2007-06-28 | Oita Univ | 学習機構付意思決定システム |
JP2007286899A (ja) * | 2006-04-17 | 2007-11-01 | First Server Kk | アプリケーション実行システムおよびサーバ |
JP2010170424A (ja) * | 2009-01-23 | 2010-08-05 | Nec Corp | 分布推定装置、クラスタリング装置、分布推定装置の推定方法及びプログラム |
JP2010212744A (ja) * | 2009-03-06 | 2010-09-24 | Nec Corp | データ圧縮方法、装置、およびプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103018058A (zh) * | 2012-12-17 | 2013-04-03 | 北京交通大学 | 基于相似度的列车悬挂系统故障分离方法 |
JP2015176285A (ja) * | 2014-03-14 | 2015-10-05 | 株式会社デンソー | 故障情報提示システム |
CN115858637A (zh) * | 2023-03-02 | 2023-03-28 | 四川三思德科技有限公司 | 一种城市地下水监测与分析方法及系统 |
CN115858637B (zh) * | 2023-03-02 | 2023-05-19 | 四川三思德科技有限公司 | 一种城市地下水监测与分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP5572966B2 (ja) | 2014-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107945507B (zh) | 行程时间预测方法及装置 | |
US20190075426A1 (en) | Information processing apparatus, information processing system, information processing method, and recording medium | |
US7693982B2 (en) | Automated diagnosis and forecasting of service level objective states | |
US8887008B2 (en) | Maintenance planning and failure prediction from data observed within a time window | |
US20210117451A1 (en) | Programmatically identifying a personality of an autonomous vehicle | |
WO2010107394A1 (en) | Determining a traffic route using predicted traffic congestion | |
CN101681531A (zh) | 远程诊断建模 | |
US20150294223A1 (en) | Systems and Methods for Providing Information for Predicting Desired Information and Taking Actions Related to User Needs in a Mobile Device | |
CN113168172B (zh) | 模型生成装置、模型生成方法及程序 | |
JP2020052714A5 (ja) | ||
US20210304153A1 (en) | Utilizing a transportation matching system in conjunction with a multi-track vehicle service center to service transportation vehicles | |
US20210302276A1 (en) | Data processing device and data processing method | |
JP5572966B2 (ja) | データ類似度計算方法、システム、およびプログラム | |
Wepulanon et al. | A real-time bus arrival time information system using crowdsourced smartphone data: a novel framework and simulation experiments | |
Sun et al. | On the tradeoff between sensitivity and specificity in bus bunching prediction | |
JP2012256239A (ja) | 目的地予測装置及びプログラム | |
JP7013993B2 (ja) | 診断装置及び診断方法 | |
JP2015184818A (ja) | サーバ、モデル適用可否判定方法およびコンピュータプログラム | |
JP5439871B2 (ja) | データ圧縮方法、装置、およびプログラム | |
US11881064B2 (en) | Technologies for determining driver efficiency | |
CN111949840A (zh) | 一种基于物联网数据的拓扑图结构的构建方法、装置 | |
US20220374737A1 (en) | Multi-dimensional modeling of driver and environment characteristics | |
Pereira et al. | Decision Support Dashboard for Traffic and Environment Analysis of a Smart City. | |
JP2018025903A (ja) | 混雑情報推定装置及び混雑情報推定方法 | |
US20230177952A1 (en) | A system and method for generating utilization data of a vehicle |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131001 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131129 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140318 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140326 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140603 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5572966 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |