JP6680707B2 - 情報処理装置、情報処理方法、およびプログラム - Google Patents
情報処理装置、情報処理方法、およびプログラム Download PDFInfo
- Publication number
- JP6680707B2 JP6680707B2 JP2017030899A JP2017030899A JP6680707B2 JP 6680707 B2 JP6680707 B2 JP 6680707B2 JP 2017030899 A JP2017030899 A JP 2017030899A JP 2017030899 A JP2017030899 A JP 2017030899A JP 6680707 B2 JP6680707 B2 JP 6680707B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- classification
- unit
- learning
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 17
- 238000003672 processing method Methods 0.000 title claims description 5
- 239000013598 vector Substances 0.000 claims description 192
- 238000002372 labelling Methods 0.000 description 24
- 238000004891 communication Methods 0.000 description 18
- 238000000034 method Methods 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施形態に係るラベル付与装置100の使用環境を示す図である。実施形態のラベル付与装置100は、ネットワークNWを介してデータサーバ200と通信する。ネットワークNWは、例えば、WAN(Wide Area Network)、LAN(Local Area Network)、インターネット、プロバイダ装置、無線基地局、専用回線などのうちの一部または全部を含む。
図2は、実施形態に係るラベル付与装置100の詳細構成を示すブロック図である。ラベル付与装置100は、データサーバ200から対象データTDを受信し、受信した対象データTDにラベルを付与する。ラベルは、対象データTDを分類するためのデータであり、例えば、「政治」、「経済」、「スポーツ」などの対象データTDが属するジャンルを示すデータである。詳細は後述するが、ラベルは対象データTDに付与される。以下、ラベル付与装置100のラベル付与動作について詳細に説明する。
次に、学習部140による、第1記憶部160に記憶された分類ベクトルw1からws(図3参照)の学習処理の詳細を説明する。学習部140が分類ベクトルw1からwsの学習処理を行うことで、分類部120による特徴ベクトルxの分類処理を高精度に行うことができる。
図9は、実施形態に係るラベル付与処理を示すフローチャートである。本フローチャートによる処理は、ラベル付与装置100によって実行される。
図10は、実施形態に係る分類ベクトルwの学習処理を示すフローチャートである。本フローチャートによる処理は、学習部140によって実行される。
図11は、実施形態に係るラベル付与装置100のハードウェア構成の一例を示す図である。ラベル付与装置100は、例えば、CPU180、RAM181、ROM182、フラッシュメモリやHDDなどの二次記憶装置183、NIC184、ドライブ装置185、キーボード186、およびマウス187が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置185には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置183、またはドライブ装置185に装着された可搬型記憶媒体に記憶されたプログラムがDMA(Direct Memory Access)コントローラ(不図示)などによってRAM181に展開され、CPU180によって実行されることで、ラベル付与装置100の機能部が実現される。
110…特徴ベクトル変換部
120…分類部
130…ラベル取得部
140…学習部
150…通信部
160…第1記憶部
170…第2記憶部
200…データサーバ
210…制御部
220…通信部
Claims (9)
- 対象データから変換された特徴ベクトルを、複数の分類ベクトルを用いて分類する分類部と、
前記分類部による分類結果に基づいて、前記対象データに付与するラベルを取得するラベル取得部と、
複数の特徴ベクトルのそれぞれに、前記ラベルを示すラベルベクトルが対応付けられた学習データを取得し、類似するラベルベクトルが同じクラスタに分類されるように前記学習データを分割することを一回以上実行することで、前記複数の分類ベクトルを学習する学習部と、
を備える情報処理装置。 - 前記学習部は、第1ラベルベクトルに対応する第1特徴ベクトルと、前記第1ラベルベクトルとの内積の値が上位の第2ラベルベクトルに対応する第2特徴ベクトルとを取得し、前記第1特徴ベクトルと前記第2特徴ベクトルとを前記学習データとして用いて、前記複数の分類ベクトルを学習する
請求項1記載の情報処理装置。 - 前記学習部は、前記分類ベクトルと、前記第2特徴ベクトルとの内積が大きくなるように、前記分類ベクトルを調整する
請求項2記載の情報処理装置。 - 前記学習部は、前記分類ベクトルと、ランダムに取得された第3特徴ベクトルとの内積が小さくなるように、前記分類ベクトルを調整する
請求項2記載の情報処理装置。 - 前記学習部によって学習された前記複数の分類ベクトルを記憶する第1記憶部を更に備え、
前記分類部は、前記第1記憶部から前記複数の分類ベクトルを読み出し、読み出した前記複数の分類ベクトルの各々と前記特徴ベクトルとの内積を算出し、算出した内積に基づいて前記特徴ベクトルを分類する
請求項1から4の何れか一項に記載の情報処理装置。 - 複数のクラスタのそれぞれにラベルが対応付けられたラベルテーブルを記憶する第2記憶部を更に備え、
前記ラベル取得部は、前記対象データに付与するラベルとして、前記分類部によって前記特徴ベクトルが分類されたクラスタに対応付けられたラベルを、前記第2記憶部に記憶された前記ラベルテーブルから取得する
請求項1から5の何れか一項に記載の情報処理装置。 - 前記学習部は、前記学習データを繰り返し分割することで分類木を生成し、
前記分類部は、前記対象データから変換された前記特徴ベクトルを、前記分類木におけるいずれかのリーフノードに分類し、
前記ラベル取得部は、前記分類部によって分類された前記特徴ベクトルが属するリーフノードに対応するラベルを、前記対象データに付与するラベルとして取得する
請求項1記載の情報処理装置。 - 対象データから変換された特徴ベクトルを、複数の分類ベクトルを用いて分類する分類工程と、
前記分類工程における分類結果に基づいて、前記対象データに付与するラベルを取得するラベル取得工程と、
複数の特徴ベクトルのそれぞれに、前記ラベルを示すラベルベクトルが対応付けられた学習データを取得し、類似するラベルベクトルが同じクラスタに分類されるように前記学習データを分割することを一回以上実行することで、前記複数の分類ベクトルを学習する学習工程と、
を備える情報処理方法。 - コンピュータを、
対象データから変換された特徴ベクトルを、複数の分類ベクトルを用いて分類する分類部、
前記分類部による分類結果に基づいて、前記対象データに付与するラベルを取得するラベル取得部、
複数の特徴ベクトルのそれぞれに、前記ラベルを示すラベルベクトルが対応付けられた学習データを取得し、類似するラベルベクトルが同じクラスタに分類されるように前記学習データを分割することを一回以上実行することで、前記複数の分類ベクトルを学習する学習部
として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017030899A JP6680707B2 (ja) | 2017-02-22 | 2017-02-22 | 情報処理装置、情報処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017030899A JP6680707B2 (ja) | 2017-02-22 | 2017-02-22 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018136750A JP2018136750A (ja) | 2018-08-30 |
JP6680707B2 true JP6680707B2 (ja) | 2020-04-15 |
Family
ID=63365577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017030899A Active JP6680707B2 (ja) | 2017-02-22 | 2017-02-22 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6680707B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5208001B2 (ja) * | 2008-06-09 | 2013-06-12 | ヤフー株式会社 | ベクトルデータ検索装置 |
JP5243888B2 (ja) * | 2008-08-18 | 2013-07-24 | 日本放送協会 | データ分類装置及びデータ分類プログラム |
JP5754310B2 (ja) * | 2011-09-02 | 2015-07-29 | 富士ゼロックス株式会社 | 識別情報付与プログラム及び識別情報付与装置 |
EP2953062A4 (en) * | 2013-02-01 | 2017-05-17 | Fujitsu Limited | Learning method, image processing device and learning program |
-
2017
- 2017-02-22 JP JP2017030899A patent/JP6680707B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018136750A (ja) | 2018-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5454357B2 (ja) | 情報処理装置および方法、並びに、プログラム | |
US10037320B2 (en) | Context-aware approach to detection of short irrelevant texts | |
CN105247507B (zh) | 用于确定品牌的影响力得分的方法、系统和存储介质 | |
US20200159832A1 (en) | Device and text representation method applied to sentence embedding | |
JP6415619B2 (ja) | 解析装置、解析方法、およびプログラム | |
CN109271514B (zh) | 短文本分类模型的生成方法、分类方法、装置及存储介质 | |
JP2005317018A (ja) | 表示ページ内のブロックの重要度を計算するための方法およびシステム | |
JP6924571B2 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
CN105677931A (zh) | 信息搜索方法和装置 | |
US20180075324A1 (en) | Information processing apparatus, information processing method, and computer readable storage medium | |
JP6434954B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20140012853A1 (en) | Search device, search method, search program, and computer-readable memory medium for recording search program | |
CN113505154B (zh) | 一种基于大数据的数字阅读统计分析方法及系统 | |
JP6680663B2 (ja) | 情報処理装置、情報処理方法、予測モデルの生成装置、予測モデルの生成方法、およびプログラム | |
JP2019185299A (ja) | 検索ニーズの評価装置、評価システム、評価方法、及び評価モジュール生産方法 | |
JP6223530B1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6680707B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6979899B2 (ja) | 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム | |
JP5938006B2 (ja) | アイテム推薦装置、アイテム推薦方法、およびアイテム推薦プログラム | |
JP6985181B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2020042402A (ja) | 情報処理装置、学習装置、情報処理方法、生成方法、およびプログラム | |
JP2020046942A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2020027549A (ja) | 議論分析装置及びプログラム | |
JP7297855B2 (ja) | キーワード抽出装置、キーワード抽出方法、およびプログラム | |
JP2019109662A (ja) | 分類装置、データ構造、分類方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200319 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6680707 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |