JP2015153013A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2015153013A5 JP2015153013A5 JP2014024512A JP2014024512A JP2015153013A5 JP 2015153013 A5 JP2015153013 A5 JP 2015153013A5 JP 2014024512 A JP2014024512 A JP 2014024512A JP 2014024512 A JP2014024512 A JP 2014024512A JP 2015153013 A5 JP2015153013 A5 JP 2015153013A5
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- category
- registered
- classification target
- searched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims description 16
- 239000000203 mixture Substances 0.000 claims 6
- 239000000284 extract Substances 0.000 claims 3
- 238000000034 method Methods 0.000 claims 2
- 230000000875 corresponding Effects 0.000 description 1
Description
本発明の第1の態様においては、分類対象キーワードを入力するキーワード入力部と、複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、テキストを取得するテキスト取得部と、前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力部と、を備える情報処理装置、及び情報処理装置に対応する方法とプログラムとを提供する。
Claims (18)
- 分類対象キーワードを入力するキーワード入力部と、
複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、
テキストを取得するテキスト取得部と、
前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、
抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリ候補として、各カテゴリの重要度と共に出力する出力部と、
を備える情報処理装置。 - 前記抽出部は、前記類似度を編集距離に基づいて算出する請求項1に記載の情報処理装置。
- 前記抽出部は、前記検索された前記登録キーワードの数に応じて、当該カテゴリに重要度を設定する
請求項1または2に記載の情報処理装置。 - 前記抽出部は、各登録キーワードにより抽出した各カテゴリの組み合わせのうち、同一である組み合わせの数に応じて、当該カテゴリに重要度を設定する
請求項1から3のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードに対する類似度に基づき検索した登録キーワードに応じて抽出された各カテゴリの組み合わせのうち同一である組み合わせの数、及び、前記分類対象キーワードとの共起に基づき検索した登録キーワードに応じて抽出された各カテゴリの組み合わせのうち同一の組み合わせの数に応じて、当該カテゴリに重要度を設定する
請求項1から4のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードの文字数に応じて、前記分類対象キーワードに対する類似度に基づき検索した登録キーワード及び前記分類対象キーワードとの共起に基づき検索した登録キーワードに優先度を設定する
請求項1から5のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードの文字数が多くなるにつれて、前記分類対象キーワードに対する類似度に基づき検索した登録キーワードの優先度を、前記分類対象キーワードとの共起に基づき検索した登録キーワードの優先度より高くする
請求項6に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードに対する類似度に応じて、検索した前記登録キーワードに優先度を設定する
請求項1から7のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記共起の程度を示す共起尺度に基づいて、検索した前記登録キーワードに優先度を設定する
請求項1から8のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記登録キーワードの優先度に基づいて、抽出した前記カテゴリに重要度を設定する
請求項5から9のいずれか1項に記載の情報処理装置。 - 前記出力部は、検索された前記登録キーワードのそれぞれに対して割り当てられたカテゴリを関連付けてユーザに対して出力する
請求項1から10のいずれか1項に記載の情報処理装置。 - 前記出力部は、検索された前記登録キーワードのそれぞれと、当該登録キーワードを抽出した検索が類似度に基づく処理と共起に基づく処理とのいずれかであるかを識別可能に出力する
請求項1から11のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記カテゴリ辞書から前記分類対象キーワードを含む登録キーワードを更に検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出する
請求項1から12のいずれか1項に記載の情報処理装置。 - 前記出力部は、前記抽出部が抽出したカテゴリの候補を、他のカテゴリと異なる表示で出力する
請求項1から13のいずれか1項に記載の情報処理装置。 - 前記出力部は、前記抽出部が検索した前記登録キーワードのうち、前記分類対象キーワードの一部からなる登録キーワードを他の登録キーワードと異なる表示で出力する
請求項1から14のいずれか1項に記載の情報処理装置。 - 前記出力部は、前記抽出部が検索した前記登録キーワードのうち、前記分類対象キーワードを含む登録キーワードを他の登録キーワードと異なる表示で出力する
請求項1から15のいずれか1項に記載の情報処理装置。 - 分類対象キーワードを入力するキーワード入力段階と、
複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得段階と、
テキストを取得するテキスト取得段階と、
前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出する抽出段階と、
検索された前記登録キーワードに応じて、抽出された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する設定段階と、
抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力段階と、
を備える方法。 - 分類対象キーワードを入力するキーワード入力部と、
複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、
テキストを取得するテキスト取得部と、
前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、
抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力部と、
してコンピュータを機能させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014024512A JP6044963B2 (ja) | 2014-02-12 | 2014-02-12 | 情報処理装置、方法及びプログラム |
US14/609,474 US9792274B2 (en) | 2014-02-12 | 2015-01-30 | Categorizing keywords |
US15/705,302 US10606944B2 (en) | 2014-02-12 | 2017-09-15 | Categorizing keywords |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014024512A JP6044963B2 (ja) | 2014-02-12 | 2014-02-12 | 情報処理装置、方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015153013A JP2015153013A (ja) | 2015-08-24 |
JP2015153013A5 true JP2015153013A5 (ja) | 2016-03-17 |
JP6044963B2 JP6044963B2 (ja) | 2016-12-14 |
Family
ID=53775108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014024512A Active JP6044963B2 (ja) | 2014-02-12 | 2014-02-12 | 情報処理装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US9792274B2 (ja) |
JP (1) | JP6044963B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6044963B2 (ja) | 2014-02-12 | 2016-12-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、方法及びプログラム |
US10861604B2 (en) | 2016-05-05 | 2020-12-08 | Advinow, Inc. | Systems and methods for automated medical diagnostics |
US11106712B2 (en) * | 2016-10-24 | 2021-08-31 | Google Llc | Systems and methods for measuring the semantic relevance of keywords |
US11164679B2 (en) | 2017-06-20 | 2021-11-02 | Advinow, Inc. | Systems and methods for intelligent patient interface exam station |
US10939806B2 (en) | 2018-03-06 | 2021-03-09 | Advinow, Inc. | Systems and methods for optical medical instrument patient measurements |
US20190279767A1 (en) * | 2018-03-06 | 2019-09-12 | James Stewart Bates | Systems and methods for creating an expert-trained data model |
US11348688B2 (en) | 2018-03-06 | 2022-05-31 | Advinow, Inc. | Systems and methods for audio medical instrument patient measurements |
JP7189789B2 (ja) * | 2019-02-05 | 2022-12-14 | Biprogy株式会社 | 工事関連リスク管理システム、リスク分析用データ生成装置およびリスク情報提供装置 |
CN113378556B (zh) * | 2020-02-25 | 2023-07-14 | 华为技术有限公司 | 提取文本关键字的方法及装置 |
WO2021171373A1 (ja) * | 2020-02-25 | 2021-09-02 | 日本電気株式会社 | アイテム分類支援システム、方法およびプログラム |
JPWO2021171372A1 (ja) * | 2020-02-25 | 2021-09-02 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110409A (ja) | 1997-10-07 | 1999-04-23 | Ntt Data Corp | 情報分類方法及び装置 |
JP2001022761A (ja) | 1999-07-05 | 2001-01-26 | Nippon Telegr & Teleph Corp <Ntt> | 未知語登録方法および未知語登録装置、並びに未知語登録用プログラムを記録した記録媒体 |
JP2002041544A (ja) | 2000-07-25 | 2002-02-08 | Toshiba Corp | テキスト情報分析装置 |
EP1576586A4 (en) | 2002-11-22 | 2006-02-15 | Transclick Inc | LANGUAGE TRANSLATION SYSTEM AND METHOD |
JP3889010B2 (ja) | 2004-03-19 | 2007-03-07 | 沖電気工業株式会社 | 語句分類システム、語句分類方法、および語句分類プログラム |
JP3986531B2 (ja) | 2005-09-21 | 2007-10-03 | 沖電気工業株式会社 | 形態素解析装置及び形態素解析プログラム |
US7813919B2 (en) | 2005-12-20 | 2010-10-12 | Xerox Corporation | Class description generation for clustering and categorization |
JP2008065523A (ja) * | 2006-09-06 | 2008-03-21 | Sanyo Electric Co Ltd | ジャンル分類装置及びジャンル分類プログラム |
US7711747B2 (en) | 2007-04-06 | 2010-05-04 | Xerox Corporation | Interactive cleaning for automatic document clustering and categorization |
US20080294624A1 (en) * | 2007-05-25 | 2008-11-27 | Ontogenix, Inc. | Recommendation systems and methods using interest correlation |
JP5115059B2 (ja) * | 2007-07-03 | 2013-01-09 | 大日本印刷株式会社 | キーワード分類装置 |
JP5341375B2 (ja) | 2008-03-14 | 2013-11-13 | 日本放送協会 | 対訳表現処理装置およびプログラム |
JP2010198246A (ja) | 2009-02-24 | 2010-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 意味解析装置、方法、およびプログラム |
CN102081602B (zh) | 2009-11-30 | 2014-01-01 | 日电(中国)有限公司 | 确定未登录词的类别的方法和设备 |
JP5556711B2 (ja) | 2011-03-18 | 2014-07-23 | 富士通株式会社 | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム |
JP5611173B2 (ja) * | 2011-11-10 | 2014-10-22 | 日本電信電話株式会社 | 単語属性推定装置及び方法及びプログラム |
JP6044963B2 (ja) | 2014-02-12 | 2016-12-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、方法及びプログラム |
US20150286627A1 (en) | 2014-04-03 | 2015-10-08 | Adobe Systems Incorporated | Contextual sentiment text analysis |
-
2014
- 2014-02-12 JP JP2014024512A patent/JP6044963B2/ja active Active
-
2015
- 2015-01-30 US US14/609,474 patent/US9792274B2/en active Active
-
2017
- 2017-09-15 US US15/705,302 patent/US10606944B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015153013A5 (ja) | ||
JP2016508264A5 (ja) | ||
WO2017092622A1 (zh) | 法律条文的搜索方法及装置 | |
US20170091318A1 (en) | Apparatus and method for extracting keywords from a single document | |
Usman et al. | Urdu text classification using majority voting | |
WO2008152805A1 (ja) | 画像認識装置及び画像認識方法 | |
EP3308301A1 (en) | Image and text data hierarchical classifiers | |
MX2016004667A (es) | Metodo y dispositivo para construir una plantilla, metodo y dispositivo para identificar informacion. | |
MX2016003981A (es) | Metodo y dispositivo para capacitar un clasificador, reconocimiento de tipo. | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
GB2583679A (en) | Searching multilingual documents based on document structure extraction | |
JP2016071382A5 (ja) | ||
US9652997B2 (en) | Method and apparatus for building emotion basis lexeme information on an emotion lexicon comprising calculation of an emotion strength for each lexeme | |
JP2022069790A5 (ja) | ||
JP2010224984A5 (ja) | ||
Baraka et al. | Arabic text author identification using support vector machines | |
Sevgili et al. | N-hance at semeval-2017 task 7: A computational approach using word association for puns | |
JP2018045548A (ja) | Fmea作成支援システムおよび方法 | |
Iswanto et al. | Sentiment analysis on Bahasa Indonesia tweets using Unibigram models and machine learning techniques | |
CN107066474A (zh) | 文献搜索方法和装置 | |
JP6804913B2 (ja) | 表構造推定システムおよび方法 | |
Gârbacea et al. | Combining Multiple Signals for Semanticizing Tweets: University of Amsterdam at# Microposts2015. | |
JPWO2020230346A5 (ja) | 文書処理方法、文書処理プログラム及び情報処理装置 | |
JP2007156932A (ja) | 学習方法、学習装置、および検索方法、検索装置 | |
JP2014132502A5 (ja) | 情報処理システム、情報処理方法、プログラムおよび情報処理装置 |