JP6044963B2 - 情報処理装置、方法及びプログラム - Google Patents
情報処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6044963B2 JP6044963B2 JP2014024512A JP2014024512A JP6044963B2 JP 6044963 B2 JP6044963 B2 JP 6044963B2 JP 2014024512 A JP2014024512 A JP 2014024512A JP 2014024512 A JP2014024512 A JP 2014024512A JP 6044963 B2 JP6044963 B2 JP 6044963B2
- Authority
- JP
- Japan
- Prior art keywords
- category
- keyword
- registered
- classification target
- extraction unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
特許文献1 特開2013−105210号公報
特許文献2 特開平11−110409号公報
特許文献3 特開2002−41544号公報
特許文献4 特開2001−22761号公報
特許文献5 特開2011−118872号公報
特許文献6 特開2010−198246号公報
12 制御部
14 記憶部
16 表示部
20 キーワード入力部
22 辞書取得部
24 テキスト取得部
26 抽出部
28 出力部
30 カテゴリ辞書
32 テキストコーパス
40 表示画像
1900 コンピュータ
2000 CPU
2010 ROM
2020 RAM
2030 通信インターフェイス
2040 ハードディスクドライブ
2050 メモリドライブ
2070 入出力チップ
2075 グラフィック・コントローラ
2080 表示部
2082 ホスト・コントローラ
2084 入出力コントローラ
2090 メモリカード
Claims (18)
- 分類対象キーワードを入力するキーワード入力部と、
複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、
テキストを取得するテキスト取得部と、
前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、
抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリ候補として、各カテゴリの重要度と共に出力する出力部と、
を備える情報処理装置。 - 前記抽出部は、前記類似度を編集距離に基づいて算出する請求項1に記載の情報処理装置。
- 前記抽出部は、前記検索された前記登録キーワードの数に応じて、当該カテゴリに重要度を設定する
請求項1または2に記載の情報処理装置。 - 前記抽出部は、各登録キーワードにより抽出した各カテゴリの組み合わせのうち、同一である組み合わせの数に応じて、当該カテゴリに重要度を設定する
請求項1から3のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードに対する類似度に基づき検索した登録キーワードに応じて抽出された各カテゴリの組み合わせのうち同一である組み合わせの数、及び、前記分類対象キーワードとの共起に基づき検索した登録キーワードに応じて抽出された各カテゴリの組み合わせのうち同一の組み合わせの数に応じて、当該カテゴリに重要度を設定する
請求項1から4のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードの文字数に応じて、前記分類対象キーワードに対する類似度に基づき検索した登録キーワード及び前記分類対象キーワードとの共起に基づき検索した登録キーワードに優先度を設定する
請求項1から5のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードの文字数が多くなるにつれて、前記分類対象キーワードに対する類似度に基づき検索した登録キーワードの優先度を、前記分類対象キーワードとの共起に基づき検索した登録キーワードの優先度より高くする
請求項6に記載の情報処理装置。 - 前記抽出部は、前記分類対象キーワードに対する類似度に応じて、検索した前記登録キーワードに優先度を設定する
請求項1から7のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記共起の程度を示す共起尺度に基づいて、検索した前記登録キーワードに優先度を設定する
請求項1から8のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記登録キーワードの優先度に基づいて、抽出した前記カテゴリに重要度を設定する
請求項5から9のいずれか1項に記載の情報処理装置。 - 前記出力部は、検索された前記登録キーワードのそれぞれに対して割り当てられたカテゴリを関連付けてユーザに対して出力する
請求項1から10のいずれか1項に記載の情報処理装置。 - 前記出力部は、検索された前記登録キーワードのそれぞれと、当該登録キーワードを抽出した検索が類似度に基づく処理と共起に基づく処理とのいずれかであるかを識別可能に出力する
請求項1から11のいずれか1項に記載の情報処理装置。 - 前記抽出部は、前記カテゴリ辞書から前記分類対象キーワードを含む登録キーワードを更に検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出する
請求項1から12のいずれか1項に記載の情報処理装置。 - 前記出力部は、前記抽出部が抽出したカテゴリの候補を、他のカテゴリと異なる表示で出力する
請求項1から13のいずれか1項に記載の情報処理装置。 - 前記出力部は、前記抽出部が検索した前記登録キーワードのうち、前記分類対象キーワードの一部からなる登録キーワードを他の登録キーワードと異なる表示で出力する
請求項1から14のいずれか1項に記載の情報処理装置。 - 前記出力部は、前記抽出部が検索した前記登録キーワードのうち、前記分類対象キーワードを含む登録キーワードを他の登録キーワードと異なる表示で出力する
請求項1から15のいずれか1項に記載の情報処理装置。 - コンピュータが、分類対象キーワードを入力するキーワード入力段階と、
前記コンピュータが、複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得段階と、
前記コンピュータが、テキストを取得するテキスト取得段階と、
前記コンピュータが、前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出する抽出段階と、
前記コンピュータが、検索された前記登録キーワードに応じて、抽出された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する設定段階と、
前記コンピュータが、抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力段階と、
を備える方法。 - 分類対象キーワードを入力するキーワード入力部と、
複数の登録キーワードのそれぞれに対してカテゴリが割り当てられたカテゴリ辞書を取得する辞書取得部と、
テキストを取得するテキスト取得部と、
前記カテゴリ辞書から分類対象キーワードに対して類似度が予め定められた基準値以上の登録キーワード、および、前記テキスト中において前記分類対象キーワードと共起する登録キーワードを検索して、検索された登録キーワードに割り当てられたカテゴリを前記カテゴリ辞書から抽出し、検索された前記登録キーワードに応じて、抽出された前記カテゴリに重要度を設定する抽出部と、
抽出された前記カテゴリを、前記分類対象キーワードを分類すべきカテゴリの候補として、各カテゴリの重要度と共に出力する出力部と、
してコンピュータを機能させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014024512A JP6044963B2 (ja) | 2014-02-12 | 2014-02-12 | 情報処理装置、方法及びプログラム |
US14/609,474 US9792274B2 (en) | 2014-02-12 | 2015-01-30 | Categorizing keywords |
US15/705,302 US10606944B2 (en) | 2014-02-12 | 2017-09-15 | Categorizing keywords |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014024512A JP6044963B2 (ja) | 2014-02-12 | 2014-02-12 | 情報処理装置、方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015153013A JP2015153013A (ja) | 2015-08-24 |
JP2015153013A5 JP2015153013A5 (ja) | 2016-03-17 |
JP6044963B2 true JP6044963B2 (ja) | 2016-12-14 |
Family
ID=53775108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014024512A Active JP6044963B2 (ja) | 2014-02-12 | 2014-02-12 | 情報処理装置、方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US9792274B2 (ja) |
JP (1) | JP6044963B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10606944B2 (en) | 2014-02-12 | 2020-03-31 | International Business Machines Corporation | Categorizing keywords |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861604B2 (en) | 2016-05-05 | 2020-12-08 | Advinow, Inc. | Systems and methods for automated medical diagnostics |
US11106712B2 (en) * | 2016-10-24 | 2021-08-31 | Google Llc | Systems and methods for measuring the semantic relevance of keywords |
US11164679B2 (en) | 2017-06-20 | 2021-11-02 | Advinow, Inc. | Systems and methods for intelligent patient interface exam station |
US11348688B2 (en) | 2018-03-06 | 2022-05-31 | Advinow, Inc. | Systems and methods for audio medical instrument patient measurements |
US10939806B2 (en) | 2018-03-06 | 2021-03-09 | Advinow, Inc. | Systems and methods for optical medical instrument patient measurements |
US20190279767A1 (en) * | 2018-03-06 | 2019-09-12 | James Stewart Bates | Systems and methods for creating an expert-trained data model |
JP7189789B2 (ja) * | 2019-02-05 | 2022-12-14 | Biprogy株式会社 | 工事関連リスク管理システム、リスク分析用データ生成装置およびリスク情報提供装置 |
CN113378556B (zh) * | 2020-02-25 | 2023-07-14 | 华为技术有限公司 | 提取文本关键字的方法及装置 |
US20230042969A1 (en) * | 2020-02-25 | 2023-02-09 | Nec Corporation | Item classification assistance system, method, and program |
JP7456486B2 (ja) | 2020-02-25 | 2024-03-27 | 日本電気株式会社 | アイテム分類支援システム、方法およびプログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110409A (ja) | 1997-10-07 | 1999-04-23 | Ntt Data Corp | 情報分類方法及び装置 |
JP2001022761A (ja) | 1999-07-05 | 2001-01-26 | Nippon Telegr & Teleph Corp <Ntt> | 未知語登録方法および未知語登録装置、並びに未知語登録用プログラムを記録した記録媒体 |
JP2002041544A (ja) | 2000-07-25 | 2002-02-08 | Toshiba Corp | テキスト情報分析装置 |
EP1588283A2 (en) | 2002-11-22 | 2005-10-26 | Transclick, Inc. | System and method for language translation via remote devices |
JP3889010B2 (ja) | 2004-03-19 | 2007-03-07 | 沖電気工業株式会社 | 語句分類システム、語句分類方法、および語句分類プログラム |
JP3986531B2 (ja) | 2005-09-21 | 2007-10-03 | 沖電気工業株式会社 | 形態素解析装置及び形態素解析プログラム |
US7813919B2 (en) | 2005-12-20 | 2010-10-12 | Xerox Corporation | Class description generation for clustering and categorization |
JP2008065523A (ja) * | 2006-09-06 | 2008-03-21 | Sanyo Electric Co Ltd | ジャンル分類装置及びジャンル分類プログラム |
US7711747B2 (en) | 2007-04-06 | 2010-05-04 | Xerox Corporation | Interactive cleaning for automatic document clustering and categorization |
US20080294624A1 (en) * | 2007-05-25 | 2008-11-27 | Ontogenix, Inc. | Recommendation systems and methods using interest correlation |
JP5115059B2 (ja) * | 2007-07-03 | 2013-01-09 | 大日本印刷株式会社 | キーワード分類装置 |
JP5341375B2 (ja) | 2008-03-14 | 2013-11-13 | 日本放送協会 | 対訳表現処理装置およびプログラム |
JP2010198246A (ja) | 2009-02-24 | 2010-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 意味解析装置、方法、およびプログラム |
CN102081602B (zh) | 2009-11-30 | 2014-01-01 | 日电(中国)有限公司 | 确定未登录词的类别的方法和设备 |
JP5556711B2 (ja) | 2011-03-18 | 2014-07-23 | 富士通株式会社 | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム |
JP5611173B2 (ja) * | 2011-11-10 | 2014-10-22 | 日本電信電話株式会社 | 単語属性推定装置及び方法及びプログラム |
JP6044963B2 (ja) | 2014-02-12 | 2016-12-14 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、方法及びプログラム |
US20150286627A1 (en) | 2014-04-03 | 2015-10-08 | Adobe Systems Incorporated | Contextual sentiment text analysis |
-
2014
- 2014-02-12 JP JP2014024512A patent/JP6044963B2/ja active Active
-
2015
- 2015-01-30 US US14/609,474 patent/US9792274B2/en active Active
-
2017
- 2017-09-15 US US15/705,302 patent/US10606944B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10606944B2 (en) | 2014-02-12 | 2020-03-31 | International Business Machines Corporation | Categorizing keywords |
Also Published As
Publication number | Publication date |
---|---|
US20150227620A1 (en) | 2015-08-13 |
US10606944B2 (en) | 2020-03-31 |
US9792274B2 (en) | 2017-10-17 |
JP2015153013A (ja) | 2015-08-24 |
US20180004727A1 (en) | 2018-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6044963B2 (ja) | 情報処理装置、方法及びプログラム | |
CN109933785B (zh) | 用于实体关联的方法、装置、设备和介质 | |
JP5356197B2 (ja) | 単語意味関係抽出装置 | |
US8041557B2 (en) | Word translation device, translation method, and computer readable medium | |
US8442771B2 (en) | Methods and apparatus for term normalization | |
CN106030568B (zh) | 自然语言处理系统、自然语言处理方法、以及自然语言处理程序 | |
JP2012108570A (ja) | 単語意味関係抽出装置及び単語意味関係抽出方法 | |
WO2011134104A1 (en) | Method, system and appartus for selecting acronym expansion | |
US9164964B2 (en) | Context-aware text document analysis | |
JP5930228B2 (ja) | 情報処理装置、方法及びプログラム | |
Ding et al. | pGenN, a gene normalization tool for plant genes and proteins in scientific literature | |
US10977450B2 (en) | Terminal device and method for providing additional information | |
KR101607672B1 (ko) | 비구조화 임상 문서의 치환 기반 패턴 검색 장치 및 검색 방법 | |
JP6495124B2 (ja) | 用語意味コード判定装置、用語意味コード判定モデル学習装置、方法、及びプログラム | |
US9892107B2 (en) | Associating mentioned items between documents | |
JP2013222418A (ja) | パッセージ分割方法、装置、及びプログラム | |
US20210073258A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP5423282B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
Nitu et al. | Reconstructing scanned documents for full-text indexing to empower digital library services | |
US11100099B2 (en) | Data acquisition device, data acquisition method, and recording medium | |
JP6880956B2 (ja) | 解析プログラム、解析方法および解析装置 | |
JP6825039B2 (ja) | 検索支援装置、検索支援方法およびプログラム | |
US11797592B2 (en) | Document classification method, document classifier, and recording medium | |
JP2006031129A (ja) | 文書処理手法及び文書処理装置 | |
JP6300512B2 (ja) | 判定装置、判定方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151127 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160913 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161018 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20161018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6044963 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |