JP2008003656A - 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 - Google Patents
概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 Download PDFInfo
- Publication number
- JP2008003656A JP2008003656A JP2006169662A JP2006169662A JP2008003656A JP 2008003656 A JP2008003656 A JP 2008003656A JP 2006169662 A JP2006169662 A JP 2006169662A JP 2006169662 A JP2006169662 A JP 2006169662A JP 2008003656 A JP2008003656 A JP 2008003656A
- Authority
- JP
- Japan
- Prior art keywords
- words
- concept
- word
- concept dictionary
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本概念辞書生成装置は、特定概念に含むサンプル単語を入力するステップと、自然言語文書を複数の形態素単語に分割し、この分割した形態素単語の中から上記サンプル単語から共起される形態素単語を共起単語として抽出するステップと、この抽出した共起単語を上記サンプル単語と関連した概念単語に分類入れする候補としてサンプル単語と共に操作画面に表示するステップと、上記サンプル単語と上記抽出した共起単語とを操作画面上で選択するステップと、上記サンプル単語と、上記選択した共起単語とを保存するステップと、処理する構成。本文書分類装置は、取り込んだ自然言語文書を、上記概念辞書生成装置で生成した概念辞書を用いて分類し、その分類結果を表示する。
【選択図】図2
Description
4 クライアントコンピュータ
6 LAN
8 データベース
Claims (13)
- 取り込んだ自然言語文書から概念辞書を生成する、コンピュータから構成された概念辞書生成装置であって、
特定概念に含むサンプル単語の操作入力を処理するステップと、
上記自然言語文書を複数の形態素単語に分割し、この分割した形態素単語の中から上記サンプル単語から共起される形態素単語を共起単語として抽出処理するステップと、
上記サンプル単語および上記抽出した共起単語を登録単語として概念辞書データベースに保存処理するステップと、
を実行することが可能になっていることを特徴とする概念辞書生成装置。 - 取り込んだ自然言語文書から概念辞書を生成する、コンピュータから構成された概念辞書生成装置であって、
特定概念に含むサンプル単語の操作入力を処理するステップと、
自然言語文書を記憶処理するステップと、
上記記憶している自然言語文書を複数の形態素単語に分割し、この分割した形態素単語の中から上記サンプル単語から共起される形態素単語を共起単語として抽出処理するステップと、
上記サンプル単語および上記抽出した共起単語の中から概念辞書に登録する候補となる登録候補言語を選択する操作を処理するステップと、
上記選択操作処理で選択した登録候補言語を登録単語として概念辞書データベースに保存処理するステップと、
を実行することが可能になっている、ことを特徴とする概念辞書生成装置。 - 取り込んだ自然言語文書から概念辞書を生成する、コンピュータから構成された概念辞書生成装置であって、
特定概念に含むサンプル単語の操作入力を処理するステップと、
自然言語文書を記憶処理するステップと、
上記記憶している自然言語文書を複数の形態素単語に分割し、この分割した形態素単語の中から上記サンプル単語から共起される形態素単語を共起単語として抽出処理するステップと、
上記サンプル単語および上記抽出した共起単語を概念辞書へ登録する登録候補言語として画面上に表示処理するステップと、
上記画面上に表示している登録候補言語の中から概念辞書に登録する登録候補言語を選択する操作を処理するステップと、
上記選択操作処理で選択した登録候補言語を登録単語として概念辞書データベースに保存処理するステップと、
を実行することが可能になっている、ことを特徴とする概念辞書生成装置。 - 上記抽出処理するステップは、上記分割した形態素単語の中から上記サンプル単語から一定以上の共起頻度で共起される形態素単語を共起単語として抽出する処理である、ことを特徴とする請求項1ないし3のいずれかに記載の概念辞書生成装置。
- 上記表示処理するステップは、上記抽出した共起単語を上記サンプル単語と共に概念辞書への登録候補言語として画面上に一覧表にして表示する処理である、ことを特徴とする請求項3に記載の概念辞書生成装置。
- 上記登録処理するステップは、概念を示す概念単語と、それに対応するサンプル単語と、上記選択した共起単語とを関連付けして登録する処理である、ことを特徴とする請求項3に記載の概念辞書生成装置。
- 上記処理するステップが、サンプル単語の操作入力に加えてサンプル文書の操作入力も処理することができるステップであり、
上記抽出処理するステップが、上記サンプル文書が操作入力されたときは当該サンプル文書を複数の形態素単語に分割し、この分割した形態素単語を上記サンプル単語として抽出処理するステップである、
ことを特徴とする請求項1ないし3のいずれかに記載の概念辞書生成装置。 - 請求項1ないし7のいずれかに記載の概念辞書生成装置で生成した概念辞書を用いて複数の自然言語文書を分類する、コンピュータから構成された文書分類装置であって、
複数の自然言語文書を取り込むステップと、
上記概念単語を取り込むステップと、
上記取り込んだ複数の自然言語文書を、上記取り込んだ概念単語をキーとして上記概念辞書に保存されている概念単語または登録単語に対応して分類するステップと、
上記分類するステップで分類した分類結果を保存するステップと、
を実行可能に構成した、ことを特徴とする文書分類装置。 - 請求項1ないし7のいずれかに記載の概念辞書生成装置で生成した概念辞書を用いて複数の自然言語文書を分類する、コンピュータから構成された文書分類装置であって、
複数の自然言語文章を取り込むステップと、
上記概念単語を取り込むステップと、
上記取り込んだ複数の自然言語文書を、上記取り込んだ概念単語をキーとして、
上記概念辞書に保存されている概念単語または登録単語およびそれらに共起する単語に対応して分類するステップと、
上記分類するステップで分類した分類結果を保存するステップと、
を実行可能に構成した、ことを特徴とする文書分類装置。 - 上記分類結果を表示する表示ステップ、
を含むことを特徴とする請求項8または9に記載の文書分類装置。 - 取り込んだ自然言語文書から概念辞書を生成する概念辞書生成方法であって、
特定概念に含むサンプル単語の操作入力を処理するステップと、
上記自然言語文書を複数の形態素単語に分割し、この分割した形態素単語の中から上記サンプル単語から共起される形態素単語を共起単語として抽出処理するステップと、
上記サンプル単語および上記抽出した共起単語を登録単語として概念辞書データベースに保存処理するステップと、
を施す、ことを特徴とする概念辞書生成方法。 - 請求項1ないし7のいずれかに記載の概念辞書生成装置で生成した概念辞書を用いて複数の自然言語文書を分類する文書分類方法であって、
複数の自然言語文書を取り込むステップと、
上記概念単語を取り込むステップと、
上記取り込んだ複数の自然言語文書を、上記取り込んだ概念単語をキーとして上記概念辞書に保存されている概念単語または登録単語に対応して、分類するステップと、
上記分類するステップで分類した分類結果を保存するステップと、
を施す、ことを特徴とする文書分類方法。 - 請求項1ないし7のいずれかに記載の概念辞書生成装置で生成した概念辞書を用いて複数の自然言語文書を分類する文書分類方法であって、
複数の自然言語文書を取り込むステップと、
上記概念単語を取り込むステップと、
上記取り込んだ複数の自然言語文書を、上記取り込んだ概念単語をキーとして上記概念辞書に保存されている概念単語または登録単語およびそれらに共起する単語に対応して分類するステップと、
上記分類するステップで分類した分類結果を保存するステップと、
を実施する、ことを特徴とする文書分類方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006169662A JP2008003656A (ja) | 2006-06-20 | 2006-06-20 | 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006169662A JP2008003656A (ja) | 2006-06-20 | 2006-06-20 | 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008003656A true JP2008003656A (ja) | 2008-01-10 |
Family
ID=39008006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006169662A Pending JP2008003656A (ja) | 2006-06-20 | 2006-06-20 | 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008003656A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079858A (ja) * | 2008-09-29 | 2010-04-08 | Toshiba Solutions Corp | 辞書作成支援装置及びプログラム |
JP2010157178A (ja) * | 2009-01-05 | 2010-07-15 | Internatl Business Mach Corp <Ibm> | テキスト・データに含まれる固有表現又は専門用語から用語辞書を作成するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
KR101507521B1 (ko) | 2014-03-31 | 2015-03-31 | 주식회사 솔샘넷 | IPC 자동 분류 방법 및 F-Term 추천 방법과 그 장치 |
KR101734970B1 (ko) * | 2010-02-10 | 2017-05-12 | 오의진 | 사용자 검색의도에 부합하는 검색 결과 제공 방법 및 시스템 |
JP2018165907A (ja) * | 2017-03-28 | 2018-10-25 | 株式会社ぐるなび | 用語変換システム、用語変換方法及び用語変換プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274541A (ja) * | 1993-03-17 | 1994-09-30 | Nippon Steel Corp | 文献検索システム |
JP2001101194A (ja) * | 1999-09-27 | 2001-04-13 | Mitsubishi Electric Corp | テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラムが記録された記録媒体 |
JP2005149340A (ja) * | 2003-11-19 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類処理装置、および同装置におけるディレクトリのリスティング方法ならびにその処理プログラム |
-
2006
- 2006-06-20 JP JP2006169662A patent/JP2008003656A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274541A (ja) * | 1993-03-17 | 1994-09-30 | Nippon Steel Corp | 文献検索システム |
JP2001101194A (ja) * | 1999-09-27 | 2001-04-13 | Mitsubishi Electric Corp | テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラムが記録された記録媒体 |
JP2005149340A (ja) * | 2003-11-19 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類処理装置、および同装置におけるディレクトリのリスティング方法ならびにその処理プログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079858A (ja) * | 2008-09-29 | 2010-04-08 | Toshiba Solutions Corp | 辞書作成支援装置及びプログラム |
JP2010157178A (ja) * | 2009-01-05 | 2010-07-15 | Internatl Business Mach Corp <Ibm> | テキスト・データに含まれる固有表現又は専門用語から用語辞書を作成するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
JP4701292B2 (ja) * | 2009-01-05 | 2011-06-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキスト・データに含まれる固有表現又は専門用語から用語辞書を作成するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
US8538745B2 (en) | 2009-01-05 | 2013-09-17 | International Business Machines Corporation | Creating a terms dictionary with named entities or terminologies included in text data |
KR101734970B1 (ko) * | 2010-02-10 | 2017-05-12 | 오의진 | 사용자 검색의도에 부합하는 검색 결과 제공 방법 및 시스템 |
KR101507521B1 (ko) | 2014-03-31 | 2015-03-31 | 주식회사 솔샘넷 | IPC 자동 분류 방법 및 F-Term 추천 방법과 그 장치 |
JP2018165907A (ja) * | 2017-03-28 | 2018-10-25 | 株式会社ぐるなび | 用語変換システム、用語変換方法及び用語変換プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5315368B2 (ja) | 文書処理装置 | |
US20080126920A1 (en) | Method for creating FMEA sheet and device for automatically creating FMEA sheet | |
Smith et al. | Corpus tools and methods, today and tomorrow: Incorporating linguists’ manual annotations | |
Ojokoh et al. | A feature-opinion extraction approach to opinion mining | |
JP2007011604A (ja) | 不具合診断システム及びプログラム | |
JP2008003656A (ja) | 概念辞書生成装置、文書分類装置、概念辞書生成方法および文書分類方法 | |
US20190303437A1 (en) | Status reporting with natural language processing risk assessment | |
WO2017106610A1 (en) | Method and system for providing automated localized feedback for an extracted component of an lectronic document file | |
JP6653169B2 (ja) | キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム | |
US20170154029A1 (en) | System, method, and apparatus to normalize grammar of textual data | |
JP2006323517A (ja) | テキスト分類装置およびプログラム | |
JP2008112363A (ja) | 文書処理装置および文書処理プログラム | |
JP2008204133A (ja) | 回答検索装置及びコンピュータプログラム | |
JP5332128B2 (ja) | 情報検索装置、情報検索方法およびそのプログラム | |
JP2007128224A (ja) | 文書インデキシング装置、文書インデキシング方法及び文書インデキシングプログラム | |
JP2002288175A (ja) | 文書の標準化 | |
JP2021096395A (ja) | 文法学習システム、サーバー装置、データ検索方法、及び検索プログラム | |
JP2007257149A (ja) | 文書処理装置及び文書処理方法 | |
Sanda et al. | Opinion mining feature-level using Naive Bayes and feature extraction based analysis dependencies | |
Saranya | Mining features and ranking products from online customer reviews | |
JPS63175965A (ja) | 文書処理装置 | |
JP6982347B1 (ja) | コンピュータ言語処理における文書抽出プログラム、意味的に類似する文書抽出方法および言語処理装置 | |
JP2010152705A (ja) | 体験情報検索システム | |
JP2011076375A (ja) | 文章変換装置、方法及びプログラム | |
JP2011095802A (ja) | 機械翻訳装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121023 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130226 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130625 |