JP2005135113A - 電子機器装置、関連語抽出方法及びプログラム - Google Patents
電子機器装置、関連語抽出方法及びプログラム Download PDFInfo
- Publication number
- JP2005135113A JP2005135113A JP2003369525A JP2003369525A JP2005135113A JP 2005135113 A JP2005135113 A JP 2005135113A JP 2003369525 A JP2003369525 A JP 2003369525A JP 2003369525 A JP2003369525 A JP 2003369525A JP 2005135113 A JP2005135113 A JP 2005135113A
- Authority
- JP
- Japan
- Prior art keywords
- word
- related word
- words
- unit
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 この関連語抽出機構は、入力されたテキストからキーワードである単語とその関連語を抽出して関連語DB2を作成するための関連語DB作成エンジン6と、ユーザより入力されたキーワードに対する関連語を関連語DB2より検索し、入力キーワードとその関連語の組み合わせを出力するマッチングエンジン5とを有する。関連語DB作成エンジン6は、入力されたテキストから単語を抽出し、抽出された単語の中から出現頻度と単語間の共起度に基づいてキーワードとその関連語の抽出を行う。
【選択図】 図1
Description
2 関連語データベース(関連語DB)
3 入力キーワード
4 関連語リスト
5 マッチングエンジン
6 関連語DB作成エンジン
7 形態素解析部
8 辞書
9 単語抽出エンジン
10 関連語抽出エンジン
11 入力テキスト
12 単語リスト
13 単語選定基準
14 単語連結規則
30 操作入力部
42 ユーザ操作監視部
43 キーワード抽出部
100 電子機器装置
Claims (9)
- テキストを入力するテキスト入力部と、
前記テキスト入力部により入力された前記テキストからキーワードである単語とその関連語を抽出して関連語データベースを作成する関連語データベース作成部と、
キーワードを入力するキーワード入力部と、
前記キーワード入力部により入力された前記キーワードに対する関連語を、前記関連語データベース作成部により作成された前記関連語データベースより検索する関連語検索部と
を具備することを特徴とする電子機器装置。 - 前記関連語データベース作成部は、
前記テキスト入力部により入力されたテキストから単語を抽出する単語抽出部と、
前記単語抽出部により抽出された単語の中から出現頻度と単語間の共起度に基づいてキーワードとその関連語を抽出する関連語抽出部と
を有することを特徴とする請求項1に記載の電子機器装置。 - 前記関連語データベース作成部は、前記テキスト入力部により入力されたテキストを形態素解析により単語に分割する形態素解析部をさらに有し、
前記単語抽出部は、前記形態素解析部により分割された単語から所定の選定基準に従って単語を選定するとともに、所定の連結規則に従って複数の単語を連結して一つの単語として生成し、前記選定した単語および前記連結により生成された単語を、単語抽出結果として出力することを特徴とする請求項2に記載の電子機器装置。 - テキストを入力するステップと、
前記入力されたテキストからキーワードである単語とその関連語を抽出して関連語データベースを作成するステップと、
キーワードを入力するステップと、
前記入力されたキーワードに対する関連語を、前記作成された前記関連語データベースを検索して取得するステップと
を有することを特徴とする関連語抽出方法。 - 前記関連語データベースを作成するステップは、前記テキストから単語を抽出し、抽出された単語の中から出現頻度と単語間の共起度に基づいてキーワードとその関連語を抽出することを特徴とする請求項4に記載の関連語抽出方法。
- 前記テキストから単語を抽出するにあたり、入力されたテキストを形態素解析により単語に分割し、分割された単語から所定の選定基準に従って単語を選定するとともに、所定の連結規則に従って複数の単語を連結して一つの単語として生成し、前記選定した単語および前記連結により生成された単語を、単語抽出結果として出力することを特徴とする請求項5に記載の関連語抽出方法。
- テキストを入力するテキスト入力部と、
前記テキスト入力部により入力された前記テキストからキーワードである単語とその関連語を抽出して関連語データベースを作成する関連語データベース作成部と、
キーワードを入力するキーワード入力部と、
前記キーワード入力部により入力された前記キーワードに対する関連語を、前記関連語データベース作成部により作成された前記関連語データベースより検索する関連語検索部としてコンピュータを機能させることを特徴とするプログラム。 - 前記関連語データベース作成部は、
前記テキスト入力部により入力されたテキストから単語を抽出する単語抽出部と、
前記単語抽出部により抽出された単語の中から出現頻度と単語間の共起度に基づいてキーワードとその関連語を抽出する関連語抽出部と
を有することを特徴とする請求項7に記載のプログラム。 - 前記関連語データベース作成部は、前記テキスト入力部により入力されたテキストを形態素解析により単語に分割する形態素解析部をさらに有し、
前記単語抽出部は、前記形態素解析部により分割された単語から所定の選定基準に従って単語を選定するとともに、所定の連結規則に従って複数の単語を連結して一つの単語として生成し、前記選定した単語および前記連結により生成された単語を、単語抽出結果として出力することを特徴とする請求項8に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003369525A JP2005135113A (ja) | 2003-10-29 | 2003-10-29 | 電子機器装置、関連語抽出方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003369525A JP2005135113A (ja) | 2003-10-29 | 2003-10-29 | 電子機器装置、関連語抽出方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005135113A true JP2005135113A (ja) | 2005-05-26 |
Family
ID=34646850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003369525A Pending JP2005135113A (ja) | 2003-10-29 | 2003-10-29 | 電子機器装置、関連語抽出方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005135113A (ja) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004240A (ja) * | 2005-06-21 | 2007-01-11 | Hidetsugu Nanba | 情報処理装置、情報処理システム、およびプログラム |
JP2008071198A (ja) * | 2006-09-14 | 2008-03-27 | Ricoh Co Ltd | 文書検索装置、文書検索方法、文書検索プログラムおよび記録媒体 |
JP2009032118A (ja) * | 2007-07-27 | 2009-02-12 | Nec Corp | 情報構造化装置、情報構造化方法、及びプログラム |
JP2009098932A (ja) * | 2007-10-17 | 2009-05-07 | Nomura Research Institute Ltd | 連想検索システム |
JP2010055155A (ja) * | 2008-08-26 | 2010-03-11 | Nec Biglobe Ltd | サーバ装置、情報処理方法およびプログラム |
JP2010055159A (ja) * | 2008-08-26 | 2010-03-11 | Nec Biglobe Ltd | 情報検索装置、情報検索方法、およびプログラム |
JP2010198281A (ja) * | 2009-02-25 | 2010-09-09 | Hyogo Prefecture | 情報処理装置、情報処理方法、およびプログラム |
JP2011014032A (ja) * | 2009-07-03 | 2011-01-20 | Fujitsu Ltd | 携帯端末装置、情報検索方法および情報検索プログラム |
JP2011215897A (ja) * | 2010-03-31 | 2011-10-27 | Meiji Univ | データベース、類推エンジン及び類推システム |
US8108407B2 (en) | 2006-11-06 | 2012-01-31 | Panasonic Corporation | Informationn retrieval apparatus |
JP2012512465A (ja) * | 2008-12-12 | 2012-05-31 | アティジオ リミテッド ライアビリティ カンパニー | 関心領域についての判定情報を使用した勧告の提供 |
US8332208B2 (en) | 2007-09-05 | 2012-12-11 | Sony Corporation | Information processing apparatus, information processing method, and program |
JP2013105210A (ja) * | 2011-11-10 | 2013-05-30 | Nippon Telegr & Teleph Corp <Ntt> | 単語属性推定装置及び方法及びプログラム |
JP2016071849A (ja) * | 2014-09-23 | 2016-05-09 | ネイバー コーポレーションNAVER Corporation | メッセンジャの対話内容に基づいて推薦検索語を提供する方法とシステム、および記録媒体 |
JP2017538198A (ja) * | 2014-11-20 | 2017-12-21 | オラクル・インターナショナル・コーポレイション | 文脈検索文字列同義語の自動生成 |
-
2003
- 2003-10-29 JP JP2003369525A patent/JP2005135113A/ja active Pending
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007004240A (ja) * | 2005-06-21 | 2007-01-11 | Hidetsugu Nanba | 情報処理装置、情報処理システム、およびプログラム |
JP2008071198A (ja) * | 2006-09-14 | 2008-03-27 | Ricoh Co Ltd | 文書検索装置、文書検索方法、文書検索プログラムおよび記録媒体 |
US8108407B2 (en) | 2006-11-06 | 2012-01-31 | Panasonic Corporation | Informationn retrieval apparatus |
JP2009032118A (ja) * | 2007-07-27 | 2009-02-12 | Nec Corp | 情報構造化装置、情報構造化方法、及びプログラム |
US8332208B2 (en) | 2007-09-05 | 2012-12-11 | Sony Corporation | Information processing apparatus, information processing method, and program |
JP2009098932A (ja) * | 2007-10-17 | 2009-05-07 | Nomura Research Institute Ltd | 連想検索システム |
JP2010055155A (ja) * | 2008-08-26 | 2010-03-11 | Nec Biglobe Ltd | サーバ装置、情報処理方法およびプログラム |
JP2010055159A (ja) * | 2008-08-26 | 2010-03-11 | Nec Biglobe Ltd | 情報検索装置、情報検索方法、およびプログラム |
US8838616B2 (en) | 2008-08-26 | 2014-09-16 | Nec Biglobe, Ltd. | Server device for creating list of general words to be excluded from search result |
JP4587236B2 (ja) * | 2008-08-26 | 2010-11-24 | Necビッグローブ株式会社 | 情報検索装置、情報検索方法、およびプログラム |
JP4640554B2 (ja) * | 2008-08-26 | 2011-03-02 | Necビッグローブ株式会社 | サーバ装置、情報処理方法およびプログラム |
JP2012512465A (ja) * | 2008-12-12 | 2012-05-31 | アティジオ リミテッド ライアビリティ カンパニー | 関心領域についての判定情報を使用した勧告の提供 |
JP2010198281A (ja) * | 2009-02-25 | 2010-09-09 | Hyogo Prefecture | 情報処理装置、情報処理方法、およびプログラム |
JP2011014032A (ja) * | 2009-07-03 | 2011-01-20 | Fujitsu Ltd | 携帯端末装置、情報検索方法および情報検索プログラム |
JP2011215897A (ja) * | 2010-03-31 | 2011-10-27 | Meiji Univ | データベース、類推エンジン及び類推システム |
JP2013105210A (ja) * | 2011-11-10 | 2013-05-30 | Nippon Telegr & Teleph Corp <Ntt> | 単語属性推定装置及び方法及びプログラム |
JP2016071849A (ja) * | 2014-09-23 | 2016-05-09 | ネイバー コーポレーションNAVER Corporation | メッセンジャの対話内容に基づいて推薦検索語を提供する方法とシステム、および記録媒体 |
JP2017538198A (ja) * | 2014-11-20 | 2017-12-21 | オラクル・インターナショナル・コーポレイション | 文脈検索文字列同義語の自動生成 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6662152B2 (en) | Information retrieval apparatus and information retrieval method | |
JP3598211B2 (ja) | 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体 | |
JP3962763B2 (ja) | 対話支援装置 | |
JP3983265B1 (ja) | 辞書作成支援システム、方法及びプログラム | |
JP2003223437A (ja) | 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム | |
JP2005135113A (ja) | 電子機器装置、関連語抽出方法及びプログラム | |
JP2000148748A (ja) | 仮名漢字変換及び画像検索表示システム | |
JP2000200281A (ja) | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 | |
JP2007094547A (ja) | 情報表示制御装置及びプログラム | |
US20040024604A1 (en) | Chinese phonetic transcription input system and method with comparison function for imperfect and fuzzy phonetic transcriptions | |
JP2005122665A (ja) | 電子機器装置、関連語データベースの更新方法、プログラム | |
US20120254209A1 (en) | Searching method, searching device and recording medium recording a computer program | |
JP2010067021A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP2008225676A (ja) | 辞書検索装置及びその制御プログラム | |
JP2004295578A (ja) | 翻訳装置 | |
JP3162907B2 (ja) | 文書データ検索装置 | |
JP2018101224A (ja) | 検索装置、検索方法、及びプログラム | |
JP4426893B2 (ja) | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 | |
JP3222193B2 (ja) | 情報検索装置 | |
JPH07134720A (ja) | 文章作成システムにおける関連情報提示方法及び装置 | |
JP2005122515A (ja) | 電子機器装置、テキスト間の類似度計算方法、およびプログラム | |
JP2006178865A (ja) | 固有表現抽出装置、方法、プログラム及びそれを記録した記録媒体 | |
JP2006163645A (ja) | 情報検索方法、情報検索装置、情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 | |
JP2003099429A (ja) | 用語集生成装置及び用語集生成プログラム並びに用語集検索装置 | |
JP2004318480A (ja) | 電子機器装置、新語抽出方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060424 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090721 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090916 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091020 |