JP6223530B1 - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP6223530B1 JP6223530B1 JP2016219735A JP2016219735A JP6223530B1 JP 6223530 B1 JP6223530 B1 JP 6223530B1 JP 2016219735 A JP2016219735 A JP 2016219735A JP 2016219735 A JP2016219735 A JP 2016219735A JP 6223530 B1 JP6223530 B1 JP 6223530B1
- Authority
- JP
- Japan
- Prior art keywords
- vector
- label
- classification
- unit
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 23
- 238000003672 processing method Methods 0.000 title claims abstract description 6
- 239000013598 vector Substances 0.000 claims abstract description 280
- 238000006243 chemical reaction Methods 0.000 claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims description 52
- 238000000034 method Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 11
- 238000002372 labelling Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、実施形態に係るラベル付与装置100の使用環境を示す図である。実施形態のラベル付与装置100は、ネットワークNWを介してデータサーバ200と通信する。ネットワークNWは、例えば、WAN(Wide Area Network)、LAN(Local Area Network)、インターネット、プロバイダ装置、無線基地局、専用回線などのうちの一部または全部を含む。
図2は、実施形態に係るラベル付与装置100の詳細構成を示すブロック図である。ラベル付与装置100は、データサーバ200から対象データTDを受信し、受信した対象データTDにラベルを付与する。ラベルは、対象データTDを分類するためのデータであり、例えば、「政治」、「経済」、「スポーツ」などの対象データTDが属するジャンルを示すデータである。詳細は後述するが、ラベルは対象データTDに付与される。以下、ラベル付与装置100のラベル付与動作について詳細に説明する。
図8は、実施形態に係るラベル付与処理を示すフローチャートである。本フローチャートによる処理は、ラベル付与装置100によって実行される。
図9は、実施形態に係るラベルベクトルyの取得処理を示すフローチャートである。本フローチャートによる処理は、ラベル取得部130によって実行される。なお、本フローチャートは、図8のS110の処理を具体的に示したものである。
次に、第1学習部140による、第1記憶部150に記憶された分類ベクトルw1からwn(図3参照)の学習処理の詳細を説明する。第1学習部140が分類ベクトルw1からwnの学習処理を行うことで、分類部115による特徴ベクトルxの分類処理を高精度に行うことができる。
次に、第2学習部145による、第2記憶部155に記憶された埋め込み行列V1からVn(図4参照)の学習処理の詳細を説明する。第2学習部145が埋め込み行列V1からVnの学習処理を行うことで、埋め込みベクトル算出部125による埋め込みベクトルzの算出処理を高精度に行うことができる。
図12は、実施形態に係るラベル付与装置100のハードウェア構成の一例を示す図である。ラベル付与装置100は、例えば、CPU170、RAM171、ROM172、フラッシュメモリやHDDなどの二次記憶装置173、NIC174、ドライブ装置175、キーボード176、およびマウス177が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置175には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置173、またはドライブ装置175に装着された可搬型記憶媒体に記憶されたプログラムがDMA(Direct Memory Access)コントローラ(不図示)などによってRAM171に展開され、CPU170によって実行されることで、ラベル付与装置100の機能部が実現される。
110…特徴ベクトル変換部
115…分類部
120…行列取得部
125…ベクトル算出部
130…ラベル取得部
135…通信部
140…第1学習部
145…第2学習部
150…第1記憶部
152…分類ベクトルデータ
155…第2記憶部
157…埋め込み行列データ
160…第3記憶部
Claims (11)
- 対象データから変換された特徴ベクトルを、分類ベクトルを用いて分類する分類部と、
前記分類部による分類に応じた変換規則で、前記特徴ベクトルを埋め込みベクトルに変換する変換部と、
前記変換部によって変換された前記埋め込みベクトルに基づいて得られるラベルを、前記対象データに付与するラベルとして取得するラベル取得部と、
を備える情報処理装置。 - 前記変換部は、
前記分類部による分類に応じて、埋め込み行列を取得する埋め込み行列取得部と、
前記埋め込み行列取得部によって取得された前記埋め込み行列を前記特徴ベクトルに乗算することで、埋め込みベクトルを算出する埋め込みベクトル算出部と、を備える
請求項1記載の情報処理装置。 - ラベルベクトルと埋め込みベクトルとが関連付けられた複数のラベルデータを記憶する記憶部を更に備え、
前記ラベル取得部は、近似最近傍検索により、前記記憶部に記憶された前記複数のラベルデータの中から、前記埋め込みベクトル算出部によって算出された前記埋め込みベクトルに類似する埋め込みベクトルを検索し、検索によって得られた前記埋め込みベクトルに関連付けられたラベルベクトルを取得し、取得した前記ラベルベクトルに対応するラベルを、前記対象データに付与するラベルとして取得する
請求項2記載の情報処理装置。 - 第1ラベルベクトルに対応する第1特徴ベクトルと、前記第1ラベルベクトルとの内積の値が大きい上位所定数の第2ラベルベクトルに対応する第2特徴ベクトルとを取得し、前記第1特徴ベクトルと前記第2特徴ベクトルとを学習データとして用いて、前記分類ベクトルを学習する第1学習部を更に備える
請求項1記載の情報処理装置。 - 前記第1学習部は、前記第1特徴ベクトルの分類に用いられる前記分類ベクトルと、前記第2特徴ベクトルとのコサイン類似度が大きくなるように、前記分類ベクトルを調整する
請求項4記載の情報処理装置。 - 前記第1学習部は、前記第1特徴ベクトルの分類に用いられる前記分類ベクトルと、ランダムに取得された第3特徴ベクトルとのコサイン類似度が小さくなるように、前記分類ベクトルを調整する
請求項5記載の情報処理装置。 - 第1ラベルベクトルに対応する第1埋め込みベクトルと、前記第1ラベルベクトルとの内積の値が大きい上位所定数の第2ラベルベクトルに対応する第2埋め込みベクトルとを取得し、前記第1埋め込みベクトルと前記第2埋め込みベクトルとを学習データとして用いて、前記埋め込み行列を学習する第2学習部を更に備える
請求項1記載の情報処理装置。 - 前記第2学習部は、前記第1埋め込みベクトルと前記第2埋め込みベクトルとのコサイン類似度が大きくなるように、前記埋め込み行列を調整する
請求項7記載の情報処理装置。 - 前記第2学習部は、前記第1埋め込みベクトルと、ランダムに取得された第3埋め込みベクトルとのコサイン類似度が小さくなるように、前記埋め込み行列を調整する
請求項8記載の情報処理装置。 - 情報処理装置が、対象データから変換された特徴ベクトルを、分類ベクトルを用いて分類する分類工程と、
前記情報処理装置が、前記分類工程における分類に応じた変換規則で、前記特徴ベクトルを埋め込みベクトルに変換する変換工程と、
前記情報処理装置が、前記変換工程において変換された前記埋め込みベクトルに基づいて得られるラベルを、前記対象データに付与するラベルとして取得するラベル取得工程と、
を備える情報処理方法。 - コンピュータを、
対象データから変換された特徴ベクトルを、分類ベクトルを用いて分類する分類部、
前記分類部による分類に応じた変換規則で、前記特徴ベクトルを埋め込みベクトルに変換する変換部、
前記変換部によって変換された前記埋め込みベクトルに基づいて得られるラベルを、前記対象データに付与するラベルとして取得するラベル取得部
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016219735A JP6223530B1 (ja) | 2016-11-10 | 2016-11-10 | 情報処理装置、情報処理方法、およびプログラム |
US15/694,295 US10896183B2 (en) | 2016-11-10 | 2017-09-01 | Information processing apparatus, information processing method, and non-transitory computer readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016219735A JP6223530B1 (ja) | 2016-11-10 | 2016-11-10 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6223530B1 true JP6223530B1 (ja) | 2017-11-01 |
JP2018077715A JP2018077715A (ja) | 2018-05-17 |
Family
ID=60213969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016219735A Active JP6223530B1 (ja) | 2016-11-10 | 2016-11-10 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10896183B2 (ja) |
JP (1) | JP6223530B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114880473A (zh) * | 2022-04-29 | 2022-08-09 | 支付宝(杭州)信息技术有限公司 | 一种标签分类方法、装置、存储介质及电子设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102289401B1 (ko) * | 2019-10-14 | 2021-08-12 | 국민대학교산학협력단 | 라벨 정보가 포함된 특징 벡터 생성 장치 및 방법 |
CN111984898A (zh) * | 2020-06-29 | 2020-11-24 | 平安国际智慧城市科技股份有限公司 | 基于大数据的标签推送方法、装置、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178569A (ja) * | 2002-11-12 | 2004-06-24 | Matsushita Electric Ind Co Ltd | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 |
JP2010079871A (ja) * | 2008-06-09 | 2010-04-08 | Yahoo Japan Corp | ベクトルデータ検索装置 |
JP2013073256A (ja) * | 2011-09-26 | 2013-04-22 | Osaka Prefecture Univ | 近似最近傍探索方法、最近傍探索プログラムおよび装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706668B2 (en) * | 2010-06-02 | 2014-04-22 | Nec Laboratories America, Inc. | Feature set embedding for incomplete data |
JP2013246586A (ja) | 2012-05-24 | 2013-12-09 | Nippon Telegr & Teleph Corp <Ntt> | データ群のトピック分析装置 |
US9566011B2 (en) * | 2012-09-13 | 2017-02-14 | University Of South Florida | Systems and methods for diagnosing cardiovascular conditions |
US9626594B2 (en) * | 2015-01-21 | 2017-04-18 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
US10606946B2 (en) * | 2015-07-06 | 2020-03-31 | Microsoft Technology Licensing, Llc | Learning word embedding using morphological knowledge |
WO2017090051A1 (en) * | 2015-11-27 | 2017-06-01 | Giridhari Devanathan | A method for text classification and feature selection using class vectors and the system thereof |
-
2016
- 2016-11-10 JP JP2016219735A patent/JP6223530B1/ja active Active
-
2017
- 2017-09-01 US US15/694,295 patent/US10896183B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178569A (ja) * | 2002-11-12 | 2004-06-24 | Matsushita Electric Ind Co Ltd | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 |
JP2010079871A (ja) * | 2008-06-09 | 2010-04-08 | Yahoo Japan Corp | ベクトルデータ検索装置 |
JP2013073256A (ja) * | 2011-09-26 | 2013-04-22 | Osaka Prefecture Univ | 近似最近傍探索方法、最近傍探索プログラムおよび装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114880473A (zh) * | 2022-04-29 | 2022-08-09 | 支付宝(杭州)信息技术有限公司 | 一种标签分类方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
US10896183B2 (en) | 2021-01-19 |
US20180129710A1 (en) | 2018-05-10 |
JP2018077715A (ja) | 2018-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2694001C2 (ru) | Способ и система создания параметра качества прогноза для прогностической модели, выполняемой в алгоритме машинного обучения | |
US20150142708A1 (en) | Retrieval of similar images to a query image | |
US8340405B2 (en) | Systems and methods for scalable media categorization | |
Caicedo et al. | Multimodal representation, indexing, automated annotation and retrieval of image collections via non-negative matrix factorization | |
CN1702654A (zh) | 计算显示页面中块的重要度的方法和系统 | |
US20150120760A1 (en) | Image tagging | |
US20110302163A1 (en) | System and method for clustering content according to similarity | |
US20120102018A1 (en) | Ranking Model Adaptation for Domain-Specific Search | |
JP6924571B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
US20150169723A1 (en) | Three-dimensional image file searching method and three-dimensional image file searching system | |
CN111723256A (zh) | 一种基于信息资源库的政务用户画像构建方法及其系统 | |
JP2018128942A (ja) | 解析装置、解析方法、およびプログラム | |
CN102081666B (zh) | 用于分布式图片搜索的索引构建方法和装置 | |
CN111694967B (zh) | 属性抽取方法、装置、电子设备及介质 | |
CN113806487A (zh) | 基于神经网络的语义搜索方法、装置、设备和存储介质 | |
JP6223530B1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2021068448A (ja) | データマッピングのための方法、装置、及びシステム | |
CN115048571A (zh) | 一种基于云平台的在线教育推荐管理系统 | |
CN111488479B (zh) | 超图构建方法、装置以及计算机系统和介质 | |
US20170235835A1 (en) | Information identification and extraction | |
Hu et al. | WSRank: a method for web service ranking in cloud environment | |
KR20180035477A (ko) | 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템 | |
TW201243627A (en) | Multi-label text categorization based on fuzzy similarity and k nearest neighbors | |
CN104615620A (zh) | 地图搜索类型识别方法及装置、地图搜索方法及系统 | |
Sun et al. | Research on question retrieval method for community question answering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6223530 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |