JP2007157164A - 情報抽出群集化システム及びその方法 - Google Patents
情報抽出群集化システム及びその方法 Download PDFInfo
- Publication number
- JP2007157164A JP2007157164A JP2006331889A JP2006331889A JP2007157164A JP 2007157164 A JP2007157164 A JP 2007157164A JP 2006331889 A JP2006331889 A JP 2006331889A JP 2006331889 A JP2006331889 A JP 2006331889A JP 2007157164 A JP2007157164 A JP 2007157164A
- Authority
- JP
- Japan
- Prior art keywords
- crowding
- criteria
- crowd
- information extraction
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99947—Object-oriented database structure reference
Abstract
【課題】情報抽出群集化システム及びその方法を提供する。
【解決手段】本発明に係る情報抽出群集化システムは、複数の群集化基準を階層別に再構成するか、または群集化基準に加重値を付与して新たな群集化基準を設計する群集化基準設計部と、新たな群集化基準によって入力データから該当特徴を抽出する入力データ処理部と、抽出された特徴を群集化する群集化演算部とを備えることを特徴とする。これにより、ユーザが所望する基準によって多様な群集化を行うことができる。
【選択図】図1
【解決手段】本発明に係る情報抽出群集化システムは、複数の群集化基準を階層別に再構成するか、または群集化基準に加重値を付与して新たな群集化基準を設計する群集化基準設計部と、新たな群集化基準によって入力データから該当特徴を抽出する入力データ処理部と、抽出された特徴を群集化する群集化演算部とを備えることを特徴とする。これにより、ユーザが所望する基準によって多様な群集化を行うことができる。
【選択図】図1
Description
本発明は一般に、入力データから有用な情報を抽出して群集化するシステム及びその方法に関し、より詳細には、ユーザが所望する基準によって有用な情報の群集化を可能にするシステム及びその方法に関する。
多数のデータから情報を抽出する最も一般的な方法のうちの1つに、群集化がある。この方法は、監督者なしに入力されたデータから群集、すなわち、類似特性を有する集団を、「自然的に」形成せしめることである。自然的に群集を形成せしめる基準は、一般的に特定の群集化システム内であらかじめ定義されている。
しかしながら、従来の群集化は、一般的に群集化システムに定義された基準に依存し、ユーザが所望する基準によって群集化を実施することが制限されるという問題がある。
本発明は、このような問題を鑑みてなされたものであり、その目的とするところは、従来の多様な群集化基準をユーザが所望する基準によって再構成し、その再構成された基準によって入力データから有用な情報を抽出して群集化を行うシステム及びその方法を提供することである。
このような目的を達成するために、本発明による情報抽出群集化システムの一実施形態は、複数の群集化基準を階層別に再構成するか、または前記群集化基準に加重値を付与して新たな群集化基準を設計する群集化基準設計部と、前記新たな群集化基準によって入力データから該当特徴を抽出する入力データ処理部と、前記抽出された特徴を群集化する群集化演算部とを備えることを特徴とする。
また、本発明による情報抽出群集化方法の一実施形態は、複数の群集化基準を階層別に再構成するか、または前記群集化基準に加重値を付与して新たな群集化基準を設計するステップと、前記新たな群集化基準によって入力データから該当特徴を抽出するステップと、前記抽出された特徴を群集化するステップとを含むことを特徴とする。
本発明によれば、ユーザが所望する基準によって多様な群集化を行うことができ、一般的に群集化システム内にあらかじめ定義される一つまたはそれ以上の基準を再構成して、ユーザが群集化システムを効率的に使用することが可能となる。
以下、添付の図面を参照して、本発明をさらに詳細に説明する。
図1は、本発明による情報抽出群集化システムの一実施形態の構成を示す図面である。
図1は、本発明による情報抽出群集化システムの一実施形態の構成を示す図面である。
図1を参照すれば、情報抽出群集化システムは、群集化基準記録/削除部100、群集化基準データベース110、群集化基準設計部120、入力データ処理部130、群集化用の特徴データベース140及び群集化演算部150を備える。
群集化基準記録/削除部100は、ユーザから群集化基準を入力されて群集化基準データベース110に記録するか、またはユーザの要請によって群集化基準データベース110に記録された群集化基準を削除する。
群集化基準データベース110は、群集化基準記録/削除部100を通じて記録される群集化基準を記録する。
群集化基準データベース110は、群集化基準記録/削除部100を通じて記録される群集化基準を記録する。
群集化基準設計部120は、群集化基準データベース110に記録された群集化基準を要請して伝送された後、群集化基準を階層別に再構成するか、または前記群集化基準に加重値を付与して新たな群集化基準を設計する。群集化基準設計部120が群集化基準データベース110から伝送された群集化基準を再構成する方法としては、階層構造形態(図4の400、410)及び加重値適用形態(図4の420、430)の基準再構成方法がある。
加重値適用の基準再構成方法では、群集化基準をC1,C2,…,Cnとし、各群集化基準に付与される加重値をw1,w2,…,wnとすれば、w1*C1+w2*C2+…+wn*Cnのように群集化基準を設定する。
入力データ処理部130は、群集化基準設計部120によって設計された階層または加重値適用の基準式に定義された特徴抽出方法によって必要な特徴を抽出して、群集化用の特徴データベース140に伝送する。
入力データ処理部130は、群集化基準設計部120によって設計された階層または加重値適用の基準式に定義された特徴抽出方法によって必要な特徴を抽出して、群集化用の特徴データベース140に伝送する。
群集化用の特徴データベース140は、群集化に使われる特徴を入力データ処理部130から伝送されて記録する。群集化演算部150が同じ特徴に対して他の群集化方法を利用して群集化を行う場合、群集化用の特徴データベース140に記録された特徴をそのまま利用することによって、入力データ処理部130の特徴抽出時間を短縮させうる。
群集化演算部150は、群集化用の特徴データベース140から特徴を伝送されて群集化を行う。群集化を行った結果は、出力装置を通じて出力される。
群集化演算部150は、群集化用の特徴データベース140から特徴を伝送されて群集化を行う。群集化を行った結果は、出力装置を通じて出力される。
図2は、本発明による情報抽出群集化方法の一実施形態を示すフローチャートである。特に、図2は、図1の情報抽出群集化システムを蛋白質構造基盤の群集化システムとして使用する場合の一実施形態である。
図1及び図2を参照すれば、入力データ処理部130は、蛋白質3次元構造のデータベース(PDB:Protein Database)の資料を入力データとして入力される(S200)。図3は、蛋白質3次元構造のデータベース資料の一例を示す図である。図3を参照すれば、蛋白質3次元構造のデータベース資料には、蛋白質を構成する原子の位置情報(3次元のx、y、z座標値)が含まれている。
図1及び図2を参照すれば、入力データ処理部130は、蛋白質3次元構造のデータベース(PDB:Protein Database)の資料を入力データとして入力される(S200)。図3は、蛋白質3次元構造のデータベース資料の一例を示す図である。図3を参照すれば、蛋白質3次元構造のデータベース資料には、蛋白質を構成する原子の位置情報(3次元のx、y、z座標値)が含まれている。
群集化基準設計部120は、群集化基準データベース110に記録された群集化基準を再構成して群集化基準を設計する(S210)。群集化基準データベース110に記録された群集化基準は、クラス形態で存在するので、子基準クラスは、親基準クラスを継承する。
図2で説明する蛋白質構造基盤の群集化の例で使われる群集化基準の種類としては、「2次構造の数」、「2次構造の分布」、「2次構造の順序」、「蛋白質の序列」、「3Dエッジヒストグラム」、「回帰分析」、「ラマチャンドランマップ基準」などがある。
例えば、新薬を開発しようとする研究者が、類似した活性部位別に群集化しようとする場合、ユーザは、「活性部位」群集化基準を、群集化基準記録/削除部100を通じて群集化基準データベース110に記録する。それにより、群集化基準設計部120は、群集化基準データベース110に記録された既存の様々な群集化基準と「活性部位」群集化基準とを再構成して、群集化基準を新たに設計する。
また、他の例として、2次構造という特徴的な蛋白質構造に対して群集化を行った後、全体的に3次元構造が類似した蛋白質で群集化しようとする場合、「2次構造の数」または「2次構造分布」群集化基準でまず群集化を行った後、その結果を「3Dエッジヒストグラム」または「回帰分析」群集化基準で群集化を行えば、所望の構造的な群集化結果が得られる。
群集化基準設計を通じた階層的な設計の場合には、蛋白質の全体的な3次元構造でまず群集化を行った後、2次構造の数に対する群集化を行える。
また、加重値適用設計方法を利用する場合には、「2次構造の数」群集化基準には、0.3の加重値を付与し、「3Dエッジヒストグラム」群集化基準には、0.7の加重値を付与して群集化演算を利用しうる(図4参照)。ここで、「活性部位」群集化基準について検索したい場合には、活性部位群集化基準を追加して群集化を行える。
入力データ処理部130は、群集化基準設計部120によって設計された群集化基準によって、入力データから特徴を抽出して群集化用の特徴データベース140に記録する(S220)。すなわち、群集化に使われる様々な情報を抽出する。
例えば、蛋白質構造基盤の群集化のために抽出される特徴を参照すれば、「2次構造の数」群集化基準の場合には、まず各蛋白質の構成原子の座標が入力データとして入力され、その構成原子の座標間の距離と構成結合力とを参照して、2次構造がα−Helixであるか、またはβ−Helixであるかを区分して、その数を求める。すなわち、表1の通りである。
2次構造順序を群集化基準とする場合に抽出される特徴は、2次構造のNターミナルでCターミナル方向に形成された2次構造の順序である。この特徴を比較する場合には、一般的に序列分析に使われるストリングマッチング類似度が適用される。
3Dエッジヒストグラムを群集化基準とする場合に抽出される特徴は、蛋白質のバックボーンを構成する原子間の結合線の地域的な分布パターンである。
回帰分析を群集化基準とする場合、蛋白質構造の全体領域を64個の副領域に分けて、各領域に含まれた回帰グラフを特徴とする。
ラマチャンドランマップを群集化基準とする場合に抽出される特徴は、ラマチャンドランマップの各領域に存在するφ及びχの数である。
群集化演算部150は、入力データ処理部によって抽出された特徴を利用して群集化を行う。群集化演算部150は、群集化を行うために、まず群集化方法を選択する(S230)。群集化方法は、従来の様々な方法を活用でき、距離基盤の群集化方法を例とすれば、K−menas、ISODATA(Iterative Self Organizing Data Techinique)、SOM(Self Organizing Map)、階層的な群集化方法などが適用されうる。群集化に使われる様々な初期値及び群集化因子は、初期化設定過程で設定されうる。
群集化演算部150は、選択された群集化方法によって群集化を行い(S240)、群集化結果を受諾できる場合には(S250)、その結果を出力装置を通じて出力する(S260)。
例えば、蛋白質構造基盤の群集化システムで、群集化過程後に群集化された結果は、階層的な基準設計の場合に、全体的な群集化のツリー形状の階層であり、加重値基盤の基準設計の場合には、群集化階層ツリーにおけるルートからの第一の子ノードでのみ形成される階層ツリーである。群集化の結果、階層ツリーの各ノードを選択すると、ノードに含まれた群集の各資料を見ることができる。
本発明の情報抽出群集化方法はまた、コンピュータで読み取り可能な記録媒体に、コンピュータで読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが記録される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ記録装置などがあり、また搬送波(例えば、インターネットを通じた伝送)の形態で具現されるものも含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散され、分散方式でコンピュータで読み取り可能なコードが記録され、かつ実行されうる。
以上、本発明についてその望ましい実施形態を中心に説明した。当業者は、本発明が、本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されうるということが理解できるであろう。したがって、開示された実施形態は、限定的な観点ではなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明ではなく、特許請求の範囲に現れており、それと同等な範囲内にある全ての差異点は、本発明に含まれると解釈される。
本発明は、例えば、蛋白質についてのデータを群集化するシステムに適用可能である。
100 群集化基準記録/削除部
110 群集化基準データベース
120 群集化基準設計部
130 入力データ処理部
140 群集化用の特徴データベース
150 群集化演算部
110 群集化基準データベース
120 群集化基準設計部
130 入力データ処理部
140 群集化用の特徴データベース
150 群集化演算部
Claims (9)
- 複数の群集化基準を階層別に再構成するか、または前記群集化基準に加重値を付与して新たな群集化基準を設計する群集化基準設計部と、
前記新たな群集化基準によって入力データから該当特徴を抽出する入力データ処理部と、
前記抽出された特徴を群集化する群集化演算部と
を備えることを特徴とする情報抽出群集化システム。 - 前記複数の群集化基準を記録する群集化基準データベースをさらに備えることを特徴とする請求項1に記載の情報抽出群集化システム。
- ユーザの要請によって新たな群集化基準を前記群集化基準データベースに追加するか、または前記群集化基準データベースに記録された群集化基準を削除する群集化基準記録/削除部をさらに備えることを特徴とする請求項2に記載の情報抽出群集化システム。
- 前記入力データ処理部によって抽出された特徴を記録する群集化用の特徴データベースをさらに備え、
前記群集化演算部は、前記群集化用の特徴データベースに記録された特徴に対して群集化を行うことを特徴とする請求項1に記載の情報抽出群集化システム。 - 前記複数の群集化基準は、2次構造の数、2次構造の分布、2次構造の順序、蛋白質序列、3Dエッジヒストグラム、回帰分析、ラマチャンドランマップを含む蛋白質構造に関する群集化基準を含み、
前記入力データは、蛋白質3次元構造データベースの資料であることを特徴とする請求項1に記載の情報抽出群集化システム。 - 前記群集化演算部は、K−means、ISODATA、SOM、階層的群集化を含む群集化方法のうち何れか一つの群集化方法に基づいて前記特徴を群集化することを特徴とする請求項1に記載の情報抽出群集化システム。
- 複数の群集化基準を階層別に再構成するか、または前記群集化基準に加重値を付与して新たな群集化基準を設計するステップと、
前記新たな群集化基準によって入力データから該当特徴を抽出するステップと、
前記抽出された特徴を群集化するステップと
を含むことを特徴とする情報抽出群集化方法。 - 前記複数の群集化基準は、2次構造の数、2次構造の分布、2次構造の順序、蛋白質序列、3Dエッジヒストグラム、回帰分析、ラマチャンドランマップを含む蛋白質構造に関する群集化基準を含み、
前記入力データは、蛋白質3次元構造データベースの資料であることを特徴とする請求項7に記載の情報抽出群集化方法。 - 前記群集化ステップは、K−means、ISODATA、SOM、階層的群集化を含む群集化方法のうち何れか一つの群集化方法に基づいて前記特徴を群集化するステップを含むことを特徴とする請求項7に記載の情報抽出群集化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20050119469 | 2005-12-08 | ||
KR1020060113050A KR100875915B1 (ko) | 2005-12-08 | 2006-11-15 | 정보추출 군집화 시스템 및 그 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007157164A true JP2007157164A (ja) | 2007-06-21 |
Family
ID=37890330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006331889A Pending JP2007157164A (ja) | 2005-12-08 | 2006-12-08 | 情報抽出群集化システム及びその方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7716169B2 (ja) |
EP (1) | EP1796009A3 (ja) |
JP (1) | JP2007157164A (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101179497B1 (ko) * | 2008-12-22 | 2012-09-07 | 한국전자통신연구원 | 얼굴 검출 방법 및 장치 |
US9020944B2 (en) * | 2009-10-29 | 2015-04-28 | International Business Machines Corporation | Systems and methods for organizing documented processes |
CN103605734B (zh) * | 2013-11-19 | 2017-02-15 | 广东电网公司电力科学研究院 | 基于特征向量的数据传输压缩方法及其系统 |
US10884891B2 (en) | 2014-12-11 | 2021-01-05 | Micro Focus Llc | Interactive detection of system anomalies |
WO2017027003A1 (en) | 2015-08-10 | 2017-02-16 | Hewlett Packard Enterprise Development Lp | Evaluating system behaviour |
KR102575974B1 (ko) | 2017-01-25 | 2023-09-08 | 한국전자통신연구원 | 데이터 시각화 장치 및 방법 |
US10419269B2 (en) | 2017-02-21 | 2019-09-17 | Entit Software Llc | Anomaly detection |
US11023494B2 (en) * | 2017-12-12 | 2021-06-01 | International Business Machines Corporation | Computer-implemented method and computer system for clustering data |
US10949470B2 (en) * | 2019-02-13 | 2021-03-16 | International Business Machines Corporation | Topic clustering to generate formulations |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3884160B2 (ja) * | 1997-11-17 | 2007-02-21 | 富士通株式会社 | 用語付きデータを扱うデータ処理方法,データ処理装置およびプログラム記憶媒体 |
US6374251B1 (en) * | 1998-03-17 | 2002-04-16 | Microsoft Corporation | Scalable system for clustering of large databases |
US6226408B1 (en) * | 1999-01-29 | 2001-05-01 | Hnc Software, Inc. | Unsupervised identification of nonlinear data cluster in multidimensional data |
JP3563315B2 (ja) | 1999-12-14 | 2004-09-08 | 日立ソフトウエアエンジニアリング株式会社 | 樹状図表示方法及び樹状図表示システム |
KR100341396B1 (ko) | 1999-12-27 | 2002-06-22 | 오길록 | 계층 단어를 이용한 3차원 클러스터링 생성 시스템 및 그방법 |
SG93868A1 (en) * | 2000-06-07 | 2003-01-21 | Kent Ridge Digital Labs | Method and system for user-configurable clustering of information |
US20020087275A1 (en) * | 2000-07-31 | 2002-07-04 | Junhyong Kim | Visualization and manipulation of biomolecular relationships using graph operators |
US7213023B2 (en) * | 2000-10-16 | 2007-05-01 | University Of North Carolina At Charlotte | Incremental clustering classifier and predictor |
KR20030019682A (ko) | 2001-08-29 | 2003-03-07 | 바이오인포메틱스 주식회사 | 데이터베이스의 단백질 정량정보를 이용한 단백질 발현프로파일 분석 장치 및 방법 |
US20050048569A1 (en) * | 2001-12-21 | 2005-03-03 | Van Der Spek Petrus Johannes | Method of clustering transmembrane proteins |
JP4084040B2 (ja) * | 2001-12-27 | 2008-04-30 | セレスター・レキシコ・サイエンシズ株式会社 | 蛋白質構造予測装置、蛋白質構造予測方法、プログラム、および、記録媒体 |
US7092941B1 (en) * | 2002-05-23 | 2006-08-15 | Oracle International Corporation | Clustering module for data mining |
JP3648728B2 (ja) | 2002-05-27 | 2005-05-18 | 日本電炉株式会社 | 自己組織化特徴マップを用いた鋼材表面の劣化度評価システム |
US7283998B2 (en) * | 2002-09-03 | 2007-10-16 | Infoglide Software Corporation | System and method for classification of documents |
US20040098412A1 (en) * | 2002-11-19 | 2004-05-20 | International Business Machines Corporation | System and method for clustering a set of records |
WO2004068300A2 (en) * | 2003-01-25 | 2004-08-12 | Purdue Research Foundation | Methods, systems, and data structures for performing searches on three dimensional objects |
JP4305836B2 (ja) | 2003-08-29 | 2009-07-29 | 日本ビクター株式会社 | コンテンツ検索表示装置およびコンテンツ検索表示方法 |
JP4690199B2 (ja) | 2003-10-07 | 2011-06-01 | 株式会社リバース・プロテオミクス研究所 | 生体関連事象間相関データの可視化方法及びコンピューター読み取り可能な記録媒体 |
JP2005158010A (ja) * | 2003-10-31 | 2005-06-16 | Hewlett-Packard Development Co Lp | 分類評価装置・方法及びプログラム |
EP1686494A4 (en) | 2003-11-21 | 2011-07-27 | Univ Kochi Nat Univ Corp | DEVICE, METHOD AND PROGRAM FOR SEARCHING FOR SIMILAR PATTERNS AND FRACTION DEVICE |
JP2005326975A (ja) * | 2004-05-12 | 2005-11-24 | Fujitsu Ltd | 情報検索装置、情報検索プログラム及び情報検索方法 |
JP4186876B2 (ja) * | 2004-06-02 | 2008-11-26 | 船井電機株式会社 | チェンジャー型情報記録装置 |
US7650321B2 (en) * | 2005-02-16 | 2010-01-19 | Siemens Medical Solutions Usa, Inc. | Two classifier based system for classifying anomalous medical patient records |
US8429167B2 (en) * | 2005-08-08 | 2013-04-23 | Google Inc. | User-context-based search engine |
US7340060B2 (en) * | 2005-10-26 | 2008-03-04 | Black Box Intelligence Limited | System and method for behavioural modelling |
-
2006
- 2006-12-07 US US11/635,447 patent/US7716169B2/en not_active Expired - Fee Related
- 2006-12-07 EP EP06125615A patent/EP1796009A3/en not_active Withdrawn
- 2006-12-08 JP JP2006331889A patent/JP2007157164A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP1796009A2 (en) | 2007-06-13 |
US7716169B2 (en) | 2010-05-11 |
EP1796009A3 (en) | 2007-08-22 |
US20070136277A1 (en) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007157164A (ja) | 情報抽出群集化システム及びその方法 | |
Terzo et al. | Data as a service (DaaS) for sharing and processing of large data collections in the cloud | |
US7752192B2 (en) | Method and system for indexing and serializing data | |
Mao et al. | Overcoming the challenge of variety: big data abstraction, the next evolution of data management for AAL communication systems | |
CN108804576B (zh) | 一种基于链接分析的域名层级结构探测方法 | |
CN105550375B (zh) | 一种异构数据的整合方法及系统 | |
TW201905733A (zh) | 多源資料融合方法和裝置 | |
CN104899281B (zh) | 学术文章处理方法和学术文章的搜索处理方法及装置 | |
JP7103496B2 (ja) | 関連スコア算出システム、方法およびプログラム | |
US20150007120A1 (en) | Clustering using n-dimensional placement | |
CN107633060A (zh) | 一种信息处理方法及电子设备 | |
TW200821869A (en) | Tag organization methods and systems | |
WO2018113370A1 (zh) | 扩展用户的方法、装置及系统 | |
KR100875915B1 (ko) | 정보추출 군집화 시스템 및 그 방법 | |
WO2020215438A1 (zh) | 电子地图空间关键字查询分布式索引系统和方法 | |
JP2018151800A (ja) | 付与装置、付与方法および付与プログラム | |
CN112068812B (zh) | 一种微服务生成方法、装置、计算机设备和存储介质 | |
JP5890340B2 (ja) | 画像分類装置及び画像分類プログラム | |
JP5761029B2 (ja) | 辞書作成装置、単語収集方法、及び、プログラム | |
CN106503198A (zh) | 一种基于hadoop元数据的冷数据识别方法及系统 | |
JP2014102625A (ja) | 情報検索システム、プログラム、および方法 | |
CN105512161A (zh) | 一种唐卡图像感兴趣区域语义标注和检索系统 | |
CN104537047A (zh) | 一种基于Lucene的服装基样板检索系统 | |
JP4295510B2 (ja) | マルチメディア情報分類配置装置および分類配置方法 | |
CN105956417A (zh) | 云环境下基于编辑距离的相似碱基序列查询方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090703 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091204 |