JP2015153013A5 - - Google Patents

Download PDF

Info

Publication number
JP2015153013A5
JP2015153013A5 JP2014024512A JP2014024512A JP2015153013A5 JP 2015153013 A5 JP2015153013 A5 JP 2015153013A5 JP 2014024512 A JP2014024512 A JP 2014024512A JP 2014024512 A JP2014024512 A JP 2014024512A JP 2015153013 A5 JP2015153013 A5 JP 2015153013A5
Authority
JP
Japan
Prior art keywords
keyword
category
registered
classification target
searched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014024512A
Other languages
English (en)
Other versions
JP2015153013A (ja
JP6044963B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2014024512A priority Critical patent/JP6044963B2/ja
Priority claimed from JP2014024512A external-priority patent/JP6044963B2/ja
Priority to US14/609,474 priority patent/US9792274B2/en
Publication of JP2015153013A publication Critical patent/JP2015153013A/ja
Publication of JP2015153013A5 publication Critical patent/JP2015153013A5/ja
Application granted granted Critical
Publication of JP6044963B2 publication Critical patent/JP6044963B2/ja
Priority to US15/705,302 priority patent/US10606944B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明の第1の態様においては、分類対象キーワードを入力するキーワード入力部と、複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、テキストを取得するテキスト取得部と、前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力部と、を備える情報処理装置、及び情報処理装置に対応する方法とプログラムとを提供する。

Claims (18)

  1. 分類対象キーワードを入力するキーワード入力部と、
    複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、
    テキストを取得するテキスト取得部と、
    前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、
    抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリ候補として、各カテゴリの重要度と共に出力する出力部と、
    を備える情報処理装置。
  2. 前記抽出部は、前記類似度を編集距離に基づいて算出する請求項1に記載の情報処理装置。
  3. 前記抽出部は、前記検索された前記登録キーワードの数に応じて、当該カテゴリに重要度を設定する
    請求項1または2に記載の情報処理装置。
  4. 前記抽出部は、各登録キーワードにより抽出した各カテゴリの組み合わせのうち、同一である組み合わせの数に応じて、当該カテゴリに重要度を設定する
    請求項1から3のいずれか1項に記載の情報処理装置。
  5. 前記抽出部は、前記分類対象キーワードに対する類似度に基づき検索した登録キーワードに応じて抽出された各カテゴリの組み合わせのうち同一である組み合わせの数、及び、前記分類対象キーワードとの共起に基づき検索した登録キーワードに応じて抽出された各カテゴリの組み合わせのうち同一の組み合わせの数に応じて、当該カテゴリに重要度を設定する
    請求項1から4のいずれか1項に記載の情報処理装置。
  6. 前記抽出部は、前記分類対象キーワードの文字数に応じて、前記分類対象キーワードに対する類似度に基づき検索した登録キーワード及び前記分類対象キーワードとの共起に基づき検索した登録キーワードに優先度を設定する
    請求項1から5のいずれか1項に記載の情報処理装置。
  7. 前記抽出部は、前記分類対象キーワードの文字数が多くなるにつれて、前記分類対象キーワードに対する類似度に基づき検索した登録キーワードの優先度を、前記分類対象キーワードとの共起に基づき検索した登録キーワードの優先度より高くする
    請求項6に記載の情報処理装置。
  8. 前記抽出部は、前記分類対象キーワードに対する類似度に応じて、検索した前記登録キーワードに優先度を設定する
    請求項1から7のいずれか1項に記載の情報処理装置。
  9. 前記抽出部は、前記共起の程度を示す共起尺度に基づいて、検索した前記登録キーワードに優先度を設定する
    請求項1から8のいずれか1項に記載の情報処理装置。
  10. 前記抽出部は、前記登録キーワードの優先度に基づいて、抽出した前記カテゴリに重要度を設定する
    請求項5から9のいずれか1項に記載の情報処理装置。
  11. 前記出力部は、検索された前記登録キーワードのそれぞれに対して割り当てられたカテゴリを関連付けてユーザに対して出力する
    請求項1から10のいずれか1項に記載の情報処理装置。
  12. 前記出力部は、検索された前記登録キーワードのそれぞれと、当該登録キーワードを抽出した検索が類似度に基づく処理と共起に基づく処理とのいずれかであるかを識別可能に出力する
    請求項1から11のいずれか1項に記載の情報処理装置。
  13. 前記抽出部は、前記カテゴリ辞書から前記分類対象キーワードを含む登録キーワードを更に検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出する
    請求項1から12のいずれか1項に記載の情報処理装置。
  14. 前記出力部は、前記抽出部が抽出したカテゴリの候補を、他のカテゴリと異なる表示で出力する
    請求項1から13のいずれか1項に記載の情報処理装置。
  15. 前記出力部は、前記抽出部が検索した前記登録キーワードのうち、前記分類対象キーワードの一部からなる登録キーワードを他の登録キーワードと異なる表示で出力する
    請求項1から14のいずれか1項に記載の情報処理装置。
  16. 前記出力部は、前記抽出部が検索した前記登録キーワードのうち、前記分類対象キーワードを含む登録キーワードを他の登録キーワードと異なる表示で出力する
    請求項1から15のいずれか1項に記載の情報処理装置。
  17. 分類対象キーワードを入力するキーワード入力段階と、
    複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得段階と、
    テキストを取得するテキスト取得段階と、
    前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出する抽出段階と、
    検索された前記登録キーワードに応じて、抽出された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する設定段階と、
    抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力段階と、
    を備える方法。
  18. 分類対象キーワードを入力するキーワード入力部と、
    複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、
    テキストを取得するテキスト取得部と、
    前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、
    抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力部と、
    してコンピュータを機能させるプログラム。
JP2014024512A 2014-02-12 2014-02-12 情報処理装置、方法及びプログラム Active JP6044963B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014024512A JP6044963B2 (ja) 2014-02-12 2014-02-12 情報処理装置、方法及びプログラム
US14/609,474 US9792274B2 (en) 2014-02-12 2015-01-30 Categorizing keywords
US15/705,302 US10606944B2 (en) 2014-02-12 2017-09-15 Categorizing keywords

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014024512A JP6044963B2 (ja) 2014-02-12 2014-02-12 情報処理装置、方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2015153013A JP2015153013A (ja) 2015-08-24
JP2015153013A5 true JP2015153013A5 (ja) 2016-03-17
JP6044963B2 JP6044963B2 (ja) 2016-12-14

Family

ID=53775108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014024512A Active JP6044963B2 (ja) 2014-02-12 2014-02-12 情報処理装置、方法及びプログラム

Country Status (2)

Country Link
US (2) US9792274B2 (ja)
JP (1) JP6044963B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6044963B2 (ja) 2014-02-12 2016-12-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、方法及びプログラム
US10861604B2 (en) 2016-05-05 2020-12-08 Advinow, Inc. Systems and methods for automated medical diagnostics
US11106712B2 (en) * 2016-10-24 2021-08-31 Google Llc Systems and methods for measuring the semantic relevance of keywords
US11164679B2 (en) 2017-06-20 2021-11-02 Advinow, Inc. Systems and methods for intelligent patient interface exam station
US10939806B2 (en) 2018-03-06 2021-03-09 Advinow, Inc. Systems and methods for optical medical instrument patient measurements
US20190279767A1 (en) * 2018-03-06 2019-09-12 James Stewart Bates Systems and methods for creating an expert-trained data model
US11348688B2 (en) 2018-03-06 2022-05-31 Advinow, Inc. Systems and methods for audio medical instrument patient measurements
JP7189789B2 (ja) * 2019-02-05 2022-12-14 Biprogy株式会社 工事関連リスク管理システム、リスク分析用データ生成装置およびリスク情報提供装置
CN113378556B (zh) * 2020-02-25 2023-07-14 华为技术有限公司 提取文本关键字的方法及装置
WO2021171373A1 (ja) * 2020-02-25 2021-09-02 日本電気株式会社 アイテム分類支援システム、方法およびプログラム
JPWO2021171372A1 (ja) * 2020-02-25 2021-09-02

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11110409A (ja) 1997-10-07 1999-04-23 Ntt Data Corp 情報分類方法及び装置
JP2001022761A (ja) 1999-07-05 2001-01-26 Nippon Telegr & Teleph Corp <Ntt> 未知語登録方法および未知語登録装置、並びに未知語登録用プログラムを記録した記録媒体
JP2002041544A (ja) 2000-07-25 2002-02-08 Toshiba Corp テキスト情報分析装置
EP1576586A4 (en) 2002-11-22 2006-02-15 Transclick Inc LANGUAGE TRANSLATION SYSTEM AND METHOD
JP3889010B2 (ja) 2004-03-19 2007-03-07 沖電気工業株式会社 語句分類システム、語句分類方法、および語句分類プログラム
JP3986531B2 (ja) 2005-09-21 2007-10-03 沖電気工業株式会社 形態素解析装置及び形態素解析プログラム
US7813919B2 (en) 2005-12-20 2010-10-12 Xerox Corporation Class description generation for clustering and categorization
JP2008065523A (ja) * 2006-09-06 2008-03-21 Sanyo Electric Co Ltd ジャンル分類装置及びジャンル分類プログラム
US7711747B2 (en) 2007-04-06 2010-05-04 Xerox Corporation Interactive cleaning for automatic document clustering and categorization
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation
JP5115059B2 (ja) * 2007-07-03 2013-01-09 大日本印刷株式会社 キーワード分類装置
JP5341375B2 (ja) 2008-03-14 2013-11-13 日本放送協会 対訳表現処理装置およびプログラム
JP2010198246A (ja) 2009-02-24 2010-09-09 Nippon Telegr & Teleph Corp <Ntt> 意味解析装置、方法、およびプログラム
CN102081602B (zh) 2009-11-30 2014-01-01 日电(中国)有限公司 确定未登录词的类别的方法和设备
JP5556711B2 (ja) 2011-03-18 2014-07-23 富士通株式会社 カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム
JP5611173B2 (ja) * 2011-11-10 2014-10-22 日本電信電話株式会社 単語属性推定装置及び方法及びプログラム
JP6044963B2 (ja) 2014-02-12 2016-12-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、方法及びプログラム
US20150286627A1 (en) 2014-04-03 2015-10-08 Adobe Systems Incorporated Contextual sentiment text analysis

Similar Documents

Publication Publication Date Title
JP2015153013A5 (ja)
JP2016508264A5 (ja)
WO2017092622A1 (zh) 法律条文的搜索方法及装置
US20170091318A1 (en) Apparatus and method for extracting keywords from a single document
Usman et al. Urdu text classification using majority voting
WO2008152805A1 (ja) 画像認識装置及び画像認識方法
EP3308301A1 (en) Image and text data hierarchical classifiers
MX2016004667A (es) Metodo y dispositivo para construir una plantilla, metodo y dispositivo para identificar informacion.
MX2016003981A (es) Metodo y dispositivo para capacitar un clasificador, reconocimiento de tipo.
CN104484380A (zh) 个性化搜索方法及装置
GB2583679A (en) Searching multilingual documents based on document structure extraction
JP2016071382A5 (ja)
US9652997B2 (en) Method and apparatus for building emotion basis lexeme information on an emotion lexicon comprising calculation of an emotion strength for each lexeme
JP2022069790A5 (ja)
JP2010224984A5 (ja)
Baraka et al. Arabic text author identification using support vector machines
Sevgili et al. N-hance at semeval-2017 task 7: A computational approach using word association for puns
JP2018045548A (ja) Fmea作成支援システムおよび方法
Iswanto et al. Sentiment analysis on Bahasa Indonesia tweets using Unibigram models and machine learning techniques
CN107066474A (zh) 文献搜索方法和装置
JP6804913B2 (ja) 表構造推定システムおよび方法
Gârbacea et al. Combining Multiple Signals for Semanticizing Tweets: University of Amsterdam at# Microposts2015.
JPWO2020230346A5 (ja) 文書処理方法、文書処理プログラム及び情報処理装置
JP2007156932A (ja) 学習方法、学習装置、および検索方法、検索装置
JP2014132502A5 (ja) 情報処理システム、情報処理方法、プログラムおよび情報処理装置