JP5441937B2 - 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム - Google Patents
言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム Download PDFInfo
- Publication number
- JP5441937B2 JP5441937B2 JP2011006187A JP2011006187A JP5441937B2 JP 5441937 B2 JP5441937 B2 JP 5441937B2 JP 2011006187 A JP2011006187 A JP 2011006187A JP 2011006187 A JP2011006187 A JP 2011006187A JP 5441937 B2 JP5441937 B2 JP 5441937B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- learning
- probability
- language
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
まず、本発明で提案する言語モデル学習装置で用いるモデルについて説明する。図1は、一般に識別モデル(マルコフモデル)と呼ばれるモデルの一種であるCRFのグラフィカルモデルを表した図である。「この東京都の」という文字列に対するCRFのグラフィカルモデルを示している。
次に、形態素の分割結果が付与された文字列(文)を示す教師ありデータの集合、及び形態素の分割結果が付与されていない文字列(文)を示す教師なしデータの集合である学習データを入力として、言語モデルを学習する言語モデル学習装置に、本発明を適用した場合を例にして、第1の実施の形態を説明する。
次に、第1の実施の形態に係る言語モデル学習装置の作用について説明する。形態素の分割の区切り目が付与された文字列(文)を示す教師ありデータの集合が入力部1を介して言語モデル学習装置に入力され、教師ありデータ記憶部21に格納される。また、形態素の分割の区切り目が付与されていない文字列(文)を示す教師なしデータの集合が入力部1を介して言語モデル学習装置に入力され、教師なしデータ記憶部22に格納される。
次に、第2の実施の形態に係る言語解析装置の作用について説明する。
2 演算部
21 教師ありデータ記憶部
22 教師なしデータ記憶部
23 識別モデルパラメータ学習部
24 生成モデルパラメータ学習部
25 識別モデルパラメータ更新部
26 生成モデルパラメータ更新部
27 収束判定部
28 言語モデル記憶部
202 演算部
203 出力部
230 形態素解析部
Claims (10)
- 文字列又は記号列における隣接する文字または記号の各々が、分割単位の区切り目となる確率又は分割単位の区切り目とならない確率を示す同時確率を用いて、文字列又は記号列における分割単位の区切り目を推定する識別モデルのパラメータを、文字列又は記号列に分割単位の区切り目が付与されたデータを示す教師ありデータに基づいて学習する識別モデル学習手段と、
予め定められた前記分割単位を条件に、予め定められた後続の分割単位の候補が出現する確率を示す条件付確率を用いて、文字列又は記号列における分割単位の区切り目を推定する生成モデルのパラメータを、文字列又は記号列を示す教師なしデータに基づいて学習する生成モデル学習手段と、
前記生成モデルの前記条件付き確率に基づいて前記同時確率を算出し、算出した前記同時確率と対応する前記識別モデルの前記同時確率とを用いて前記分割単位の区切り目を推定する第1の統合モデルのパラメータを、前記教師ありデータに基づいて学習して、前記識別モデルのパラメータを更新する識別モデル更新手段と、
前記識別モデルの前記同時確率に基づいて前記条件付き確率を算出し、算出した前記条件付き確率と対応する前記生成モデルの前記条件付き確率とを用いて前記分割単位の区切り目を推定する第2の統合モデルのパラメータを、前記教師なしデータに基づいて学習して、前記生成モデルのパラメータを更新する生成モデル更新手段と、
前記識別モデル更新部による更新と前記生成モデル更新部による更新とを交互に繰り返して、所定の収束条件を満たしたときに、その時点の前記識別モデルのパラメータ及び前記生成モデルのパラメータを出力する収束判定手段と、
を含む言語モデル学習装置。 - 前記識別モデル更新手段は、前記識別モデルにおける前記同時確率の各々に対して、前記同時確率に対応する前記生成モデルの前記条件付確率の各々を足し合わせて正規化して前記同時確率を算出して、前記第1の統合モデルを求め、前記第1の統合モデルのパラメータを、前記教師ありデータに基づいて学習して、前記識別モデルのパラメータを更新する請求項1記載の言語モデル学習装置。
- 前記第1の統合モデルは、前記算出した同時確率と対応する前記識別モデルの前記同時確率と統合に関する重みとを用いて前記分割単位の区切り目を推定するモデルであり、
前記第2の統合モデルは、前記算出した条件付き確率と対応する前記生成モデルの前記条件付き確率と前記統合の重みとを用いて前記分割単位の区切り目を推定するモデルであり、
前記識別モデル更新手段は、前記教師ありデータに基づいて、前記第1の統合モデルのパラメータ及び前記統合の重みを学習する請求項1又は2記載の言語モデル学習装置。 - 前記識別モデル及び前記第1の統合モデルを、マルコフモデルとし、
前記生成モデル及び前記第2の統合モデルを、セミマルコフモデルとした請求項1〜請求項3の何れか1項記載の言語モデル学習装置。 - 請求項1〜請求項4の何れか1項に記載の言語モデル学習装置によって出力された前記識別モデルのパラメータ及び前記生成モデルのパラメータを記憶する記憶手段と、
前記記憶手段に記憶された前記識別モデルのパラメータ及び前記生成モデルのパラメータに基づいて、入力された文字列又は記号列における分割単位の区切り目を解析する言語解析手段と、
を含む言語解析装置。 - 識別モデル学習手段と、生成モデル学習手段と、識別モデル更新手段と、生成モデル更新手段と、収束判定手段とを含む言語モデル学習装置における言語モデル学習方法であって、
前記言語モデル学習装置は、
前記識別モデル学習手段によって、文字列又は記号列における隣接する文字または記号の各々が、分割単位の区切り目となる確率又は分割単位の区切り目とならない確率を示す同時確率を用いて、文字列又は記号列における分割単位の区切り目を推定する識別モデルのパラメータを、文字列又は記号列に分割単位の区切り目が付与されたデータを示す教師ありデータに基づいて学習するステップと、
前記生成モデル学習手段によって、予め定められた前記分割単位を条件に、予め定められた後続の分割単位の候補が出現する確率を示す条件付確率を用いて、文字列又は記号列における分割単位の区切り目を推定する生成モデルのパラメータを、文字列又は記号列を示す教師なしデータに基づいて学習するステップと、
前記識別モデル更新手段によって、前記生成モデルの前記条件付き確率に基づいて前記同時確率を算出し、算出した前記同時確率と対応する前記識別モデルの前記同時確率とを用いて前記分割単位の区切り目を推定する第1の統合モデルのパラメータを、前記教師ありデータに基づいて学習して、前記識別モデルのパラメータを更新するステップと、
前記生成モデル更新手段によって、前記識別モデルの前記同時確率に基づいて前記条件付き確率を算出し、算出した前記条件付き確率と対応する前記生成モデルの前記条件付き確率とを用いて前記分割単位の区切り目を推定する第2の統合モデルのパラメータを、前記教師なしデータに基づいて学習して、前記生成モデルのパラメータを更新するステップと、
前記収束判定手段によって、前記識別モデル更新部による更新と前記生成モデル更新部による更新とを交互に繰り返して、所定の収束条件を満たしたときに、その時点の前記識別モデルのパラメータ及び前記生成モデルのパラメータを出力するステップと、
を含んで実行することを特徴とする言語モデル学習方法。 - 前記識別モデルのパラメータを更新するステップは、前記識別モデルにおける前記同時確率の各々に対して、前記同時確率に対応する前記生成モデルの前記条件付確率の各々を足し合わせて正規化して前記同時確率を算出して、前記第1の統合モデルを求め、前記第1の統合モデルのパラメータを、前記教師ありデータに基づいて学習して、前記識別モデルのパラメータを更新する請求項6記載の言語モデル学習方法。
- 前記第1の統合モデルは、前記算出した同時確率と対応する前記識別モデルの前記同時確率と統合に関する重みとを用いて前記分割単位の区切り目を推定するモデルであり、
前記第2の統合モデルは、前記算出した条件付き確率と対応する前記生成モデルの前記条件付き確率と前記統合の重みとを用いて前記分割単位の区切り目を推定するモデルであり、
前記識別モデルのパラメータを更新するステップは、前記教師ありデータに基づいて、前記第1の統合モデルのパラメータ及び前記統合の重みを学習する請求項6又は7記載の言語モデル学習方法。 - 前記識別モデル及び前記第1の統合モデルを、マルコフモデルとし、
前記生成モデル及び前記第2の統合モデルを、セミマルコフモデルとした請求項6〜請求項8の何れか1項記載の言語モデル学習方法。 - コンピュータを、請求項1〜請求項4の何れか1項記載の言語モデル学習装置の各手段、又は請求項5記載の言語解析装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011006187A JP5441937B2 (ja) | 2011-01-14 | 2011-01-14 | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011006187A JP5441937B2 (ja) | 2011-01-14 | 2011-01-14 | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012146263A JP2012146263A (ja) | 2012-08-02 |
JP5441937B2 true JP5441937B2 (ja) | 2014-03-12 |
Family
ID=46789742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011006187A Active JP5441937B2 (ja) | 2011-01-14 | 2011-01-14 | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5441937B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6093542A (ja) * | 1983-10-27 | 1985-05-25 | Tokyo Electric Co Ltd | キ−ボ−ド装置 |
JP6244676B2 (ja) * | 2013-06-07 | 2017-12-13 | コニカミノルタ株式会社 | 操作支援プログラム及び操作支援方法並びに情報処理装置 |
JP6312467B2 (ja) * | 2014-03-04 | 2018-04-18 | 株式会社デンソーアイティーラボラトリ | 情報処理装置、情報処理方法、およびプログラム |
WO2020003374A1 (ja) * | 2018-06-26 | 2020-01-02 | 日本電気株式会社 | 学習装置、情報処理システム、学習方法、および学習プログラム |
CN110020428B (zh) * | 2018-07-19 | 2023-05-23 | 成都信息工程大学 | 一种基于半马尔可夫的联合识别和规范化中医症状名的方法 |
CN114970522B (zh) * | 2022-05-20 | 2023-11-24 | 北京百度网讯科技有限公司 | 语言模型的预训练方法、装置、设备、存储介质 |
-
2011
- 2011-01-14 JP JP2011006187A patent/JP5441937B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012146263A (ja) | 2012-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108363790B (zh) | 用于对评论进行评估的方法、装置、设备和存储介质 | |
US6684201B1 (en) | Linguistic disambiguation system and method using string-based pattern training to learn to resolve ambiguity sites | |
JP3768205B2 (ja) | 形態素解析装置、形態素解析方法及び形態素解析プログラム | |
CN111145718B (zh) | 一种基于自注意力机制的中文普通话字音转换方法 | |
JP5441937B2 (ja) | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム | |
KR102315984B1 (ko) | 사상 예측 장치, 예측 모델 생성 장치 및 사상 예측용 프로그램 | |
CN109492213B (zh) | 句子相似度计算方法和装置 | |
CN111401084A (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
CN106778878B (zh) | 一种人物关系分类方法及装置 | |
CN112069295B (zh) | 相似题推荐方法、装置、电子设备和存储介质 | |
CN111274829A (zh) | 一种利用跨语言信息的序列标注方法 | |
JP7155625B2 (ja) | 検査装置、検査方法、プログラム及び学習装置 | |
JPWO2015166606A1 (ja) | 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム | |
CN114021573B (zh) | 一种自然语言处理方法、装置、设备及可读存储介质 | |
JP6145059B2 (ja) | モデル学習装置、形態素解析装置、及び方法 | |
CN115168574A (zh) | 一种多价值链问题文本分类方法和装置 | |
CN109815497B (zh) | 基于句法依存的人物属性抽取方法 | |
JP2016224483A (ja) | モデル学習装置、方法、及びプログラム | |
CN111291565A (zh) | 一种用于命名实体识别的方法与装置 | |
Hao et al. | SCESS: a WFSA-based automated simplified chinese essay scoring system with incremental latent semantic analysis | |
US11893344B2 (en) | Morpheme analysis learning device, morpheme analysis device, method, and program | |
Zheng et al. | Character-based parsing with convolutional neural network | |
JP6558856B2 (ja) | 形態素解析装置、モデル学習装置、及びプログラム | |
CN114444492A (zh) | 一种非标准词类判别方法及计算机可读存储介质 | |
CN108073704B (zh) | 一种liwc词表扩展方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20120611 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120629 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5441937 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |