JP5116580B2 - 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 - Google Patents
他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 Download PDFInfo
- Publication number
- JP5116580B2 JP5116580B2 JP2008166340A JP2008166340A JP5116580B2 JP 5116580 B2 JP5116580 B2 JP 5116580B2 JP 2008166340 A JP2008166340 A JP 2008166340A JP 2008166340 A JP2008166340 A JP 2008166340A JP 5116580 B2 JP5116580 B2 JP 5116580B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- word
- concept
- vector
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
言語Bの見出し語が言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段40と、
言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段50と、
言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段60と、
言語Bの単語が2言語辞書記憶手段40に登録されていない場合に、該言語Bの単語に基づいて、言語B固有名詞意味カテゴリ表記憶手段50を参照して、該単語に対応付けられている意味カテゴリ名を取得し、該意味カテゴリ名に基づいて言語A概念ベース記憶手段60を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成手段10と、を有する。
生成された言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納する手段含み、
言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出手段と、
単語に基づいて言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力する手段と、
を更に有する。
言語Bの見出し語が言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段と、
言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段と、
言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段と、
単語概念ベース生成手段と、を有する装置において、
単語概念ベース生成手段が、言語Bの単語が2言語辞書記憶手段に登録されていない場合に(ステップ1、No)、該言語Bの単語に基づいて、言語B固有名詞意味カテゴリ表記憶手段を参照して、該単語に対応付けられている意味カテゴリ名を取得し(ステップ2)、該意味カテゴリ名に基づいて言語A概念ベース記憶手段を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成ステップを行う(ステップ3)。
生成された言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納するステップを含み、
単語頻度算出手段が、言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出ステップと、
単語に基づいて言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力するステップと、
を更に行う。
20 単語頻度算出部
30 文書ベクトル算出部
40 2言語辞書記憶手段、2言語辞書
50 言語B固有名詞意味カテゴリ表記憶手段、言語Bの固有名詞の意味カテゴリ表
60 言語A概念ベース記憶手段、言語A単語概念ベース
70 言語B単語概念ベース
Claims (6)
- 言語Aと言語Bの2つの自然言語の概念ベクトルを生成するための他言語の概念ベクトル生成装置であって、
前記言語Bの見出し語が前記言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段と、
前記言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段と、
前記言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段と、
前記言語Bの単語が前記2言語辞書記憶手段に登録されていない場合に、該言語Bの単語に基づいて、前記言語B固有名詞意味カテゴリ表記憶手段を参照して、該単語に対応付けられている意味カテゴリ名を取得し、該意味カテゴリ名に基づいて前記言語A概念ベース記憶手段を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成手段と、
を有することを特徴とする他言語の概念ベクトル生成装置。 - 前記単語概念ベース生成手段は、
生成された前記言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納する手段を含み、
言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出手段と、
前記単語に基づいて前記言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、前記出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力する手段と、
を更に有する請求項1記載の他言語の概念ベクトル生成装置。 - 言語Aと言語Bの2つの自然言語の概念ベクトルを生成するための他言語の概念ベクトル生成方法であって、
前記言語Bの見出し語が前記言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段と、
前記言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段と、
前記言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段と、
単語概念ベース生成手段と、を有する装置において、
前記単語概念ベース生成手段が、前記言語Bの単語が前記2言語辞書記憶手段に登録されていない場合に、該言語Bの単語に基づいて、前記言語B固有名詞意味カテゴリ表記憶手段を参照して、該単語に対応付けられている意味カテゴリ名を取得し、該意味カテゴリ名に基づいて前記言語A概念ベース記憶手段を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成ステップを行う
ことを特徴とする他言語の概念ベクトル生成方法。 - 前記単語概念ベース生成ステップにおいて、
生成された前記言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納するステップを更に行い、
単語頻度算出手段が、言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出ステップと、
前記単語に基づいて前記言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、前記出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力するステップと、
を行う請求項3記載の他言語の概念ベクトル生成方法。 - 請求項1または2に記載の他言語の概念ベクトル生成装置を構成する各手段としてコンピュータを機能させるための他言語の概念ベクトル生成プログラム。
- 請求項5記載の他言語の概念ベクトル生成プログラムを格納したことを特徴とするコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008166340A JP5116580B2 (ja) | 2008-06-25 | 2008-06-25 | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008166340A JP5116580B2 (ja) | 2008-06-25 | 2008-06-25 | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009238A JP2010009238A (ja) | 2010-01-14 |
JP5116580B2 true JP5116580B2 (ja) | 2013-01-09 |
Family
ID=41589672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008166340A Expired - Fee Related JP5116580B2 (ja) | 2008-06-25 | 2008-06-25 | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5116580B2 (ja) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3289894B2 (ja) * | 1990-11-30 | 2002-06-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 翻訳知識獲得方法及び装置並びに翻訳処理方法及び装置 |
JPH07210568A (ja) * | 1994-01-19 | 1995-08-11 | Oki Electric Ind Co Ltd | ファイル管理装置 |
JPH096799A (ja) * | 1995-06-19 | 1997-01-10 | Sharp Corp | 文書分類装置及び文書検索装置 |
JPH1173420A (ja) * | 1997-08-28 | 1999-03-16 | Sharp Corp | 文書処理装置及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7711547B2 (en) * | 2001-03-16 | 2010-05-04 | Meaningful Machines, L.L.C. | Word association method and apparatus |
JP2003108579A (ja) * | 2001-09-28 | 2003-04-11 | Toshiba Corp | 文書検索装置及び文書検索方法 |
JP3875143B2 (ja) * | 2002-05-24 | 2007-01-31 | 日本電信電話株式会社 | 単語類似度計算方法、この方法を実施する装置、単語類似度計算プログラム、このプログラムを記録した記録媒体 |
JP4325938B2 (ja) * | 2004-10-15 | 2009-09-02 | 日本電信電話株式会社 | 単語配置装置、単語配置方法およびプログラム |
JP2006163953A (ja) * | 2004-12-08 | 2006-06-22 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル推定方法、単語ベクトル推定装置、プログラムおよび記録媒体 |
JP2006331245A (ja) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
JP2006338342A (ja) * | 2005-06-02 | 2006-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル生成装置、単語ベクトル生成方法およびプログラム |
JP4099197B2 (ja) * | 2006-05-29 | 2008-06-11 | 日本電信電話株式会社 | 概念ベクトル推定方法及び装置及びプログラム及びコンピュータ読取可能な記憶媒体 |
-
2008
- 2008-06-25 JP JP2008166340A patent/JP5116580B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010009238A (ja) | 2010-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6310150B2 (ja) | 意図理解装置、方法およびプログラム | |
Cohn et al. | Sentence compression beyond word deletion | |
US8589148B2 (en) | Natural language watermarking | |
JP6328260B2 (ja) | 意図推定装置及び意図推定方法 | |
JP2004355483A (ja) | 形態素解析装置、形態素解析方法及び形態素解析プログラム | |
US20100125459A1 (en) | Stochastic phoneme and accent generation using accent class | |
JP5524138B2 (ja) | 同義語辞書生成装置、その方法、及びプログラム | |
JP5564705B2 (ja) | 文構造解析装置、文構造解析方法および文構造解析プログラム | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
Chennoufi et al. | Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization | |
JP2010055236A (ja) | 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 | |
JP5116580B2 (ja) | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
JP5976037B2 (ja) | モデル学習装置、ランキング装置、方法、及びプログラム | |
JP4940251B2 (ja) | 文書処理プログラム及び文書処理装置 | |
JP5398638B2 (ja) | 記号入力支援装置、記号入力支援方法、及びプログラム | |
JP6805927B2 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
JP2009129405A (ja) | 感情推定装置、事例感情情報生成装置、及び感情推定プログラム | |
JP7435740B2 (ja) | 音声認識装置、制御方法、及びプログラム | |
JP2005157823A (ja) | 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム | |
JP2011180836A (ja) | 記号変換装置、記号変換方法、記号変換プログラム | |
JP2003263432A (ja) | 翻字装置及びそのプログラム | |
JP6569543B2 (ja) | 短縮文生成装置、方法およびプログラム。 | |
WO2019044583A1 (ja) | コンフュージョンネットワーク分散表現生成装置、コンフュージョンネットワーク分類装置、コンフュージョンネットワーク分散表現生成方法、コンフュージョンネットワーク分類方法、プログラム | |
JP5755698B2 (ja) | 述語項構造解析方法、モデル学習方法、装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100817 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120918 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121009 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121016 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151026 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |