JP2010009238A - 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 - Google Patents
他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 Download PDFInfo
- Publication number
- JP2010009238A JP2010009238A JP2008166340A JP2008166340A JP2010009238A JP 2010009238 A JP2010009238 A JP 2010009238A JP 2008166340 A JP2008166340 A JP 2008166340A JP 2008166340 A JP2008166340 A JP 2008166340A JP 2010009238 A JP2010009238 A JP 2010009238A
- Authority
- JP
- Japan
- Prior art keywords
- language
- word
- concept
- storage means
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明は、言語Bの単語が2言語辞書記憶手段に登録されていない場合に、該言語Bの単語に基づいて、言語B固有名詞意味カテゴリ表記憶手段を参照して、該単語に対応付けられている意味カテゴリ名を取得し、該意味カテゴリ名に基づいて言語A概念ベース記憶手段を参照して、該言語Bの単語の概念ベクトルを生成する。更に、生成された言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納し、言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求め、単語に基づいて言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力する。
【選択図】図2
Description
言語Bの見出し語が言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段40と、
言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段50と、
言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段60と、
言語Bの単語が2言語辞書記憶手段40に登録されていない場合に、該言語Bの単語に基づいて、言語B固有名詞意味カテゴリ表記憶手段50を参照して、該単語に対応付けられている意味カテゴリ名を取得し、該意味カテゴリ名に基づいて言語A概念ベース記憶手段60を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成手段10と、を有する。
生成された言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納する手段含み、
言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出手段と、
単語に基づいて言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力する手段と、
を更に有する。
言語Bの見出し語が言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段と、
言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段と、
言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段と、を有する装置において、
単語概念ベース生成手段が、言語Bの単語が2言語辞書記憶手段に登録されていない場合に(ステップ1、No)、該言語Bの単語に基づいて、言語B固有名詞意味カテゴリ表記憶手段を参照して、該単語に対応付けられている意味カテゴリ名を取得し(ステップ2)、該意味カテゴリ名に基づいて言語A概念ベース記憶手段を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成ステップを行う(ステップ3)。
生成された言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納するステップを含み、
単語頻度算出手段が、言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出ステップと、
単語に基づいて言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力するステップと、
を更に行う。
20 単語頻度算出部
30 文書ベクトル算出部
40 2言語辞書記憶手段、2言語辞書
50 言語B固有名詞意味カテゴリ表記憶手段、言語Bの固有名詞の意味カテゴリ表
60 言語A概念ベース記憶手段、言語A単語概念ベース
70 言語B単語概念ベース
Claims (6)
- 言語Aと言語Bの2つの自然言語の概念ベクトルを生成するための他言語の概念ベクトル生成装置であって、
前記言語Bの見出し語が前記言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段と、
前記言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段と、
前記言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段と、
前記言語Bの単語が前記2言語辞書記憶手段に登録されていない場合に、該言語Bの単語に基づいて、前記言語B固有名詞意味カテゴリ表記憶手段を参照して、該単語に対応付けられている意味カテゴリ名を取得し、該意味カテゴリ名に基づいて前記言語A概念ベース記憶手段を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成手段と、
を有することを特徴とする他言語の概念ベクトル生成装置。 - 前記単語概念ベース生成手段は、
生成された前記言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納する手段含み、
言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出手段と、
前記単語に基づいて前記言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、前記出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力する手段と、
を更に有する請求項1記載の他言語の概念ベクトル生成装置。 - 言語Aと言語Bの2つの自然言語の概念ベクトルを生成するための他言語の概念ベクトル生成方法であって、
前記言語Bの見出し語が前記言語Aで説明されている2言語辞書を格納した2言語辞書記憶手段と、
前記言語Bの固有名詞を抽象化した意味カテゴリへの対応を記載した言語Bの固有名詞の意味カテゴリ表を格納した言語B固有名詞意味カテゴリ表記憶手段と、
前記言語Aの単語に対応する概念ベクトルを格納した言語A概念ベース記憶手段と、を有する装置において、
単語概念ベース生成手段が、前記言語Bの単語が前記2言語辞書記憶手段に登録されていない場合に、該言語Bの単語に基づいて、前記言語B固有名詞意味カテゴリ表記憶手段を参照して、該単語に対応付けられている意味カテゴリ名を取得し、該意味カテゴリ名に基づいて前記言語A概念ベース記憶手段を参照して、該言語Bの単語の概念ベクトルを生成する単語概念ベース生成ステップを行う
ことを特徴とする他言語の概念ベクトル生成方法。 - 前記単語概念ベース生成ステップにおいて、
生成された前記言語Bの単語の概念ベクトルを言語B単語概念ベース記憶手段に格納するステップを更に行い、
単語頻度算出手段が、言語Bの文書が入力されると、該文書を単語分割し、分割された単語の該文書における出現頻度を求める単語頻度算出ステップと、
前記単語に基づいて前記言語B単語概念ベース記憶手段を参照して、該単語をベクトルに変換し、前記出現頻度による加重平均をとり、該加重平均を文書ベクトルして出力するステップと、
を行う請求項3記載の他言語の概念ベクトル生成方法。 - 請求項1または2に記載の他言語の概念ベクトル生成装置を構成する各手段としてコンピュータを機能させるための他言語の概念ベクトル生成プログラム。
- 請求項5記載の他言語の概念ベクトル生成プログラムを格納したことを特徴とするコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008166340A JP5116580B2 (ja) | 2008-06-25 | 2008-06-25 | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008166340A JP5116580B2 (ja) | 2008-06-25 | 2008-06-25 | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009238A true JP2010009238A (ja) | 2010-01-14 |
JP5116580B2 JP5116580B2 (ja) | 2013-01-09 |
Family
ID=41589672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008166340A Expired - Fee Related JP5116580B2 (ja) | 2008-06-25 | 2008-06-25 | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5116580B2 (ja) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04205058A (ja) * | 1990-11-30 | 1992-07-27 | Internatl Business Mach Corp <Ibm> | 翻訳知識獲得方法、翻訳知識ベース・システム、機械翻訳方法及び装置 |
JPH07210568A (ja) * | 1994-01-19 | 1995-08-11 | Oki Electric Ind Co Ltd | ファイル管理装置 |
JPH096799A (ja) * | 1995-06-19 | 1997-01-10 | Sharp Corp | 文書分類装置及び文書検索装置 |
JPH1173420A (ja) * | 1997-08-28 | 1999-03-16 | Sharp Corp | 文書処理装置及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003108579A (ja) * | 2001-09-28 | 2003-04-11 | Toshiba Corp | 文書検索装置及び文書検索方法 |
JP2003345828A (ja) * | 2002-05-24 | 2003-12-05 | Nippon Telegr & Teleph Corp <Ntt> | 単語類似度計算方法、この方法を実施する装置、単語類似度計算プログラム、このプログラムを記録した記録媒体 |
JP2005529386A (ja) * | 2002-05-31 | 2005-09-29 | ミーニングフル・マシーンズ,エルエルシー | 単語関連付け方法及び装置 |
JP2006113917A (ja) * | 2004-10-15 | 2006-04-27 | Nippon Telegr & Teleph Corp <Ntt> | 単語配置装置、単語配置方法およびプログラム |
JP2006163953A (ja) * | 2004-12-08 | 2006-06-22 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル推定方法、単語ベクトル推定装置、プログラムおよび記録媒体 |
JP2006331245A (ja) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
JP2006338342A (ja) * | 2005-06-02 | 2006-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル生成装置、単語ベクトル生成方法およびプログラム |
JP2007317132A (ja) * | 2006-05-29 | 2007-12-06 | Nippon Telegr & Teleph Corp <Ntt> | 概念ベクトル推定方法及び装置及びプログラム |
-
2008
- 2008-06-25 JP JP2008166340A patent/JP5116580B2/ja not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04205058A (ja) * | 1990-11-30 | 1992-07-27 | Internatl Business Mach Corp <Ibm> | 翻訳知識獲得方法、翻訳知識ベース・システム、機械翻訳方法及び装置 |
JPH07210568A (ja) * | 1994-01-19 | 1995-08-11 | Oki Electric Ind Co Ltd | ファイル管理装置 |
JPH096799A (ja) * | 1995-06-19 | 1997-01-10 | Sharp Corp | 文書分類装置及び文書検索装置 |
JPH1173420A (ja) * | 1997-08-28 | 1999-03-16 | Sharp Corp | 文書処理装置及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2003108579A (ja) * | 2001-09-28 | 2003-04-11 | Toshiba Corp | 文書検索装置及び文書検索方法 |
JP2003345828A (ja) * | 2002-05-24 | 2003-12-05 | Nippon Telegr & Teleph Corp <Ntt> | 単語類似度計算方法、この方法を実施する装置、単語類似度計算プログラム、このプログラムを記録した記録媒体 |
JP2005529386A (ja) * | 2002-05-31 | 2005-09-29 | ミーニングフル・マシーンズ,エルエルシー | 単語関連付け方法及び装置 |
JP2006113917A (ja) * | 2004-10-15 | 2006-04-27 | Nippon Telegr & Teleph Corp <Ntt> | 単語配置装置、単語配置方法およびプログラム |
JP2006163953A (ja) * | 2004-12-08 | 2006-06-22 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル推定方法、単語ベクトル推定装置、プログラムおよび記録媒体 |
JP2006331245A (ja) * | 2005-05-30 | 2006-12-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索装置、情報検索方法およびプログラム |
JP2006338342A (ja) * | 2005-06-02 | 2006-12-14 | Nippon Telegr & Teleph Corp <Ntt> | 単語ベクトル生成装置、単語ベクトル生成方法およびプログラム |
JP2007317132A (ja) * | 2006-05-29 | 2007-12-06 | Nippon Telegr & Teleph Corp <Ntt> | 概念ベクトル推定方法及び装置及びプログラム |
Non-Patent Citations (6)
Title |
---|
CSNG200500802010; 別所 克人、外1名: '未知語の概念ベクトル推定手法' 情報処理学会研究報告 第2004巻,第108号, 20041106, p.59-64, 社団法人情報処理学会 * |
CSNG200600771005; 別所 克人、外2名: '単語・意味属性間共起に基づく概念ベースの拡張方式' 情報処理学会研究報告 第2006巻,第84号, 20060728, p.29-34, 社団法人情報処理学会 * |
CSNG200701204006; 戸谷 健二、外1名: '多言語情報検索への概念ベースの適用に関する検討' 第25回 ことば工学研究会資料 (SIG-LSE-A603) , 20070316, p.91-99, 社団法人人工知能学会 ことば工学事務局 * |
JPN6012039531; 別所 克人、外1名: '未知語の概念ベクトル推定手法' 情報処理学会研究報告 第2004巻,第108号, 20041106, p.59-64, 社団法人情報処理学会 * |
JPN6012039533; 別所 克人、外2名: '単語・意味属性間共起に基づく概念ベースの拡張方式' 情報処理学会研究報告 第2006巻,第84号, 20060728, p.29-34, 社団法人情報処理学会 * |
JPN6012039535; 戸谷 健二、外1名: '多言語情報検索への概念ベースの適用に関する検討' 第25回 ことば工学研究会資料 (SIG-LSE-A603) , 20070316, p.91-99, 社団法人人工知能学会 ことば工学事務局 * |
Also Published As
Publication number | Publication date |
---|---|
JP5116580B2 (ja) | 2013-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8589148B2 (en) | Natural language watermarking | |
JP6310150B2 (ja) | 意図理解装置、方法およびプログラム | |
JP6955963B2 (ja) | 検索装置、類似度算出方法、およびプログラム | |
JP2007108749A (ja) | 韻律統計モデル訓練方法及び装置、韻律解析方法及び装置、テキスト音声合成方法及びシステム | |
US20100125459A1 (en) | Stochastic phoneme and accent generation using accent class | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
KR20160133349A (ko) | 구 표 생성 방법 및 구 표를 이용한 기계 번역 방법 | |
JP2018205945A (ja) | 対話応答文書自動作成人工知能装置 | |
JP2010055236A (ja) | 文抽出および文短縮を組合せた文書要約方法、文書要約装置、文書要約プログラムおよびそのプログラムを記録した記録媒体 | |
US20120117068A1 (en) | Text mining device | |
JP5116580B2 (ja) | 他言語の概念ベクトル生成装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP6586055B2 (ja) | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
JP4940251B2 (ja) | 文書処理プログラム及び文書処理装置 | |
JP5398638B2 (ja) | 記号入力支援装置、記号入力支援方法、及びプログラム | |
JP2009129405A (ja) | 感情推定装置、事例感情情報生成装置、及び感情推定プログラム | |
JP2005157823A (ja) | 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム | |
JP6235373B2 (ja) | 言語解析方法及びシステム | |
WO2019044583A1 (ja) | コンフュージョンネットワーク分散表現生成装置、コンフュージョンネットワーク分類装置、コンフュージョンネットワーク分散表現生成方法、コンフュージョンネットワーク分類方法、プログラム | |
JP2011076375A (ja) | 文章変換装置、方法及びプログラム | |
JP2010182261A (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
JP2003263432A (ja) | 翻字装置及びそのプログラム | |
JP6573839B2 (ja) | 文生成装置、方法、及びプログラム | |
JP5553779B2 (ja) | 形態素列変換装置、形態素変換学習装置とそれらの方法とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100817 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120918 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121009 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121016 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151026 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |