JP5823441B2 - 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム - Google Patents
格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5823441B2 JP5823441B2 JP2013094695A JP2013094695A JP5823441B2 JP 5823441 B2 JP5823441 B2 JP 5823441B2 JP 2013094695 A JP2013094695 A JP 2013094695A JP 2013094695 A JP2013094695 A JP 2013094695A JP 5823441 B2 JP5823441 B2 JP 5823441B2
- Authority
- JP
- Japan
- Prior art keywords
- pair
- type
- positional relationship
- case
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
dmax=1、smax=3、bmax=14、tmax=39、pmax=5
である。
ガ格、DEPタイプについては(p2,t1)、
ガ格、INTRA_Zタイプについては(p1,t1)、(p3,t1)、
ガ格、INTER_Zタイプについては(p4,t1)、
ヲ格、DEPタイプについては(p2,t9)、(p3,t13)、(p4,t24)、
ニ格、DEPタイプについては(p5,t32)、が真の答えになっており、これらの中で、上記図11の代表ペアと異なる、ガ格、INTER_Zタイプ、及び述語p4に対する代表ペアのセルについて、ガ格、INTER_Zタイプ、述語p4に対する真の答えのペア(p4,t1)で上書きする。その結果、上記図12の代表ペアの表が得られる。
20 演算部
21 格解析モデルパラメータ学習部
22 格解析部
30 出力部
100 格解析装置
211 特徴ベクトル作成部
212 位置タイプ判定部
213 局所分類学習部
214 局所順位判定部
215 大域分類学習部
221 分類モデルパラメータ記憶部
222 特徴ベクトル作成部
223 位置タイプ判定部
224 局所順位判定部
225 大域順位判定部
Claims (7)
- テキスト中に含まれる述語と前記述語に対する必須格の格要素とのペアの正解情報が予め付与された訓練テキストに基づいて、述語と格要素候補とのペアの各々を抽出し、前記抽出された前記ペアの各々について、複数の特徴量を抽出して特徴ベクトルを作成する特徴ベクトル作成部と、
前記述語と格要素候補とのペアの各々について、前記ペアの前記述語と格要素候補との位置関係が、予め定められた複数の位置関係のタイプの何れであるかを判定する位置タイプ判定部と、
前記複数の位置関係のタイプの各々について、前記位置関係のタイプであると判定された前記述語と格要素候補とのペアの各々について作成された前記特徴ベクトル、及び前記正解情報に基づいて、前記位置関係のタイプに該当する前記述語と格要素候補とのペアについての前記特徴ベクトルに基づいて前記述語に対し前記格要素候補が正解であるか否かを判定するための局所分類器の分類モデルパラメータを学習する局所分類学習部と、
前記述語と前記位置関係のタイプとの組み合わせの各々について、前記述語を有する前記ペアであって、かつ、前記位置関係のタイプに該当する前記述語と格要素候補とのペアのうち、前記位置関係のタイプについての局所分類器を用いて得られるスコアが最大となる前記ペアを代表ペアとして選択し、前記述語を有する前記ペアであって、かつ、前記位置関係のタイプに該当する前記述語と格要素候補とのペアのうち、前記正解情報の前記ペアがある場合には、前記ペアを代表ペアとする局所順位判定部と、
前記複数の位置関係のタイプのうちの2つの位置関係のタイプの組み合わせの各々について、前記述語毎に、前記組み合わせの一方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルと、前記組み合わせの他方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルとに基づく組み合わせ特徴ベクトル、及び前記代表ペアについての前記正解情報を用いた訓練データを作成し、前記述語毎に作成した前記訓練データに基づいて、前記位置関係のタイプの組み合わせに該当する2つの前記代表ペアに対する前記組み合わせ特徴ベクトルに基づいて一方の前記代表ペアが正解であるか、他方の前記代表ペアが正解であるか、及び前記2つの代表ペアの何れも不正解であるかを判定するための大域分類器の分類モデルパラメータを学習する大域分類学習部と、
を含む格解析モデルパラメータ学習装置。 - 前記予め定められた複数の位置関係のタイプは、述語と格要素が同一文内にあり、かつ、述語と格要素の間に係り受け関係があるDEPタイプ、述語と格要素が同一文内にあり、かつ同一文節内にあるSAME_BSタイプ、述語と格要素が同一文内にあり、かつ、述語と格要素が係り受け関係にないINTRA_Zタイプ、述語と格要素が同一テキスト中の異なる文内にあるINTER_Zタイプ、及び格要素が述語と同一テキスト中に存在しないEXOタイプであり、
前記大域分類学習部は、前記DEPタイプ、前記SAME_BSタイプ、前記INTRA_Zタイプ、及びINTER_Zタイプのうちの2つの位置関係のタイプの組み合わせの各々について、前記大域分類器の分類モデルパラメータを学習する請求項1記載の格解析モデルパラメータ学習装置。 - 解析対象のテキストに基づいて、述語と格要素候補とのペアの各々を抽出し、前記抽出された前記ペアの各々について、複数の特徴量を抽出して特徴ベクトルを作成する特徴ベクトル作成部と、
前記述語と格要素候補とのペアの各々について、前記ペアの前記述語と格要素候補との位置関係が、予め定められた複数の位置関係のタイプの何れであるかを判定する位置タイプ判定部と、
前記位置関係のタイプ毎に予め学習された、前記位置関係のタイプに該当する前記述語と格要素候補とのペアについての前記特徴ベクトルに基づいて前記述語に対し前記格要素候補が正解であるか否かを判定するための局所分類器の分類モデルパラメータに基づいて、前記述語と前記位置関係のタイプとの組み合わせの各々について、前記述語を有する前記ペアであって、かつ、前記位置関係のタイプに該当する前記述語と格要素候補とのペアのうち、前記位置関係のタイプについての前記局所分類器を用いて得られるスコアが最大となる前記ペアを代表ペアとして選択する局所順位判定部と、
前記複数の位置関係のタイプのうちの2つの位置関係のタイプの組み合わせの各々について、前記述語毎に、前記組み合わせの一方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルと、前記組み合わせの一方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルとに基づく組み合わせ特徴ベクトルを作成し、前記位置関係のタイプの組み合わせ毎に予め学習された、前記位置関係のタイプの組み合わせに該当する2つの前記代表ペアに対する前記組み合わせ特徴ベクトルに基づいて一方の前記代表ペアが正解であるか、他方の前記代表ペアが正解であるか、及び前記2つの代表ペアの何れも不正解であるかを判定するための大域分類器の分類モデルパラメータと、前記作成した前記組み合わせ特徴ベクトルとに基づいて、前記代表ペアの各々について、前記代表ペアの正解らしさを示すスコアを計算する大域順位判定部と、
を含む格解析装置。 - 前記予め定められた複数の位置関係のタイプは、述語と格要素が同一文内にあり、かつ、述語と格要素の間に係り受け関係があるDEPタイプ、述語と格要素が同一文内にあり、かつ同一文節内にあるSAME_BSタイプ、述語と格要素が同一文内にあり、かつ、述語と格要素が係り受け関係にないINTRA_Zタイプ、述語と格要素が同一テキスト中の異なる文内にあるINTER_Zタイプ、及び格要素が述語と同一テキスト中に存在しないEXOタイプであり、
前記大域順位判定部は、前記DEPタイプ、前記SAME_BSタイプ、前記INTRA_Zタイプ、及びINTER_Zタイプのうちの2つの位置関係のタイプの組み合わせの各々について、前記述語毎に、前記組み合わせ特徴ベクトルを作成し、前記2つの位置関係のタイプの組み合わせ毎に予め学習された前記大域分類器の分類モデルパラメータと、前記作成した前記組み合わせ特徴ベクトルとに基づいて、前記代表ペアの各々について、前記スコアを計算する請求項3載の格解析装置。 - 特徴ベクトル作成部によって、テキスト中に含まれる述語と前記述語に対する必須格の格要素とのペアの正解情報が予め付与された訓練テキストに基づいて、述語と格要素候補とのペアの各々を抽出し、前記抽出された前記ペアの各々について、複数の特徴量を抽出して特徴ベクトルを作成し、
位置タイプ判定部によって、前記述語と格要素候補とのペアの各々について、前記ペアの前記述語と格要素候補との位置関係が、予め定められた複数の位置関係のタイプの何れであるかを判定し、
局所分類学習部によって、前記複数の位置関係のタイプの各々について、前記位置関係のタイプであると判定された前記述語と格要素候補とのペアの各々について作成された前記特徴ベクトル、及び前記正解情報に基づいて、前記位置関係のタイプに該当する前記述語と格要素候補とのペアについての前記特徴ベクトルに基づいて前記述語に対し前記格要素候補が正解であるか否かを判定するための局所分類器の分類モデルパラメータを学習し、
局所順位判定部によって、前記述語と前記位置関係のタイプとの組み合わせの各々について、前記述語を有する前記ペアであって、かつ、前記位置関係のタイプに該当する前記述語と格要素候補とのペアのうち、前記位置関係のタイプについての局所分類器を用いて得られるスコアが最大となる前記ペアを代表ペアとして選択し、前記述語を有する前記ペアであって、かつ、前記位置関係のタイプに該当する前記述語と格要素候補とのペアのうち、前記正解情報の前記ペアがある場合には、前記ペアを代表ペアとし、
大域分類学習部によって、前記複数の位置関係のタイプのうちの2つの位置関係のタイプの組み合わせの各々について、前記述語毎に、前記組み合わせの一方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルと、前記組み合わせの他方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルとに基づく組み合わせ特徴ベクトル、及び前記代表ペアについての前記正解情報を用いた訓練データを作成し、前記述語毎に作成した前記訓練データに基づいて、前記位置関係のタイプの組み合わせに該当する2つの前記代表ペアに対する前記組み合わせ特徴ベクトルに基づいて一方の前記代表ペアが正解であるか、他方の前記代表ペアが正解であるか、及び前記2つの代表ペアの何れも不正解であるかを判定するための大域分類器の分類モデルパラメータを学習する
格解析モデルパラメータ学習方法。 - 特徴ベクトル作成部によって、解析対象のテキストに基づいて、述語と格要素候補とのペアの各々を抽出し、前記抽出された前記ペアの各々について、複数の特徴量を抽出して特徴ベクトルを作成し、
位置タイプ判定部によって、前記述語と格要素候補とのペアの各々について、前記ペアの前記述語と格要素候補との位置関係が、予め定められた複数の位置関係のタイプの何れであるかを判定し、
局所順位判定部によって、前記位置関係のタイプ毎に予め学習された、前記位置関係のタイプに該当する前記述語と格要素候補とのペアについての前記特徴ベクトルに基づいて前記述語に対し前記格要素候補が正解であるか否かを判定するための局所分類器の分類モデルパラメータに基づいて、前記述語と前記位置関係のタイプとの組み合わせの各々について、前記述語を有する前記ペアであって、かつ、前記位置関係のタイプに該当する前記述語と格要素候補とのペアのうち、前記位置関係のタイプについての前記局所分類器を用いて得られるスコアが最大となる前記ペアを代表ペアとして選択し、
大域順位判定部によって、前記複数の位置関係のタイプのうちの2つの位置関係のタイプの組み合わせの各々について、前記述語毎に、前記組み合わせの一方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルと、前記組み合わせの一方の位置関係のタイプ及び前記述語に対する前記代表ペアについての前記特徴ベクトルとに基づく組み合わせ特徴ベクトルを作成し、前記位置関係のタイプの組み合わせ毎に予め学習された、前記位置関係のタイプの組み合わせに該当する2つの前記代表ペアに対する前記組み合わせ特徴ベクトルに基づいて一方の前記代表ペアが正解であるか、他方の前記代表ペアが正解であるか、及び前記2つの代表ペアの何れも不正解であるかを判定するための大域分類器の分類モデルパラメータと、前記作成した前記組み合わせ特徴ベクトルとに基づいて、前記代表ペアの各々について、前記代表ペアの正解らしさを示すスコアを計算する
格解析方法。 - コンピュータを、請求項1又は2記載の格解析モデルパラメータ学習装置又は請求項3又は4記載の格解析装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013094695A JP5823441B2 (ja) | 2013-04-26 | 2013-04-26 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013094695A JP5823441B2 (ja) | 2013-04-26 | 2013-04-26 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014215920A JP2014215920A (ja) | 2014-11-17 |
JP5823441B2 true JP5823441B2 (ja) | 2015-11-25 |
Family
ID=51941594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013094695A Active JP5823441B2 (ja) | 2013-04-26 | 2013-04-26 | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5823441B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110196981B (zh) * | 2019-06-11 | 2023-07-25 | 百度在线网络技术(北京)有限公司 | 文本表示方法、装置、设备和存储介质 |
CN113157880B (zh) * | 2021-03-25 | 2023-01-17 | 科大讯飞股份有限公司 | 一种要素内容获取方法、装置、设备及存储介质 |
CN115048425A (zh) * | 2022-06-09 | 2022-09-13 | 深圳计算科学研究院 | 一种基于强化学习的数据筛选方法及其装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04289969A (ja) * | 1991-03-18 | 1992-10-14 | Csk Corp | 日本語構文解析システム |
JP5220676B2 (ja) * | 2008-11-20 | 2013-06-26 | ヤフー株式会社 | 能動学習装置及び方法 |
JP5225219B2 (ja) * | 2009-06-30 | 2013-07-03 | 日本電信電話株式会社 | 述語項構造解析方法、その装置及びプログラム |
JP5564705B2 (ja) * | 2010-07-16 | 2014-08-06 | 株式会社日立製作所 | 文構造解析装置、文構造解析方法および文構造解析プログラム |
JP2013011985A (ja) * | 2011-06-28 | 2013-01-17 | Nippon Telegr & Teleph Corp <Ntt> | 解析モデル学習装置、方法、及びプログラム |
-
2013
- 2013-04-26 JP JP2013094695A patent/JP5823441B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014215920A (ja) | 2014-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Amin et al. | Bengali vader: A sentiment analysis approach using modified vader | |
Xu et al. | Optimizing statistical machine translation for text simplification | |
JP5356197B2 (ja) | 単語意味関係抽出装置 | |
KR101799681B1 (ko) | 어휘 의미망 및 단어 임베딩을 이용한 동형이의어 분별 장치 및 방법 | |
Kriz et al. | Simplification using paraphrases and context-based lexical substitution | |
US11593557B2 (en) | Domain-specific grammar correction system, server and method for academic text | |
Hiai et al. | A sarcasm extraction method based on patterns of evaluation expressions | |
CN110309513B (zh) | 一种文本依存分析的方法和装置 | |
Reshadat et al. | A new open information extraction system using sentence difficulty estimation | |
JP5823441B2 (ja) | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム | |
Fujihira et al. | Multilingual sentiment analysis for web text based on word to word translation | |
JP2005208782A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
JP2012220666A (ja) | 読解問題回答装置、方法、及びプログラム | |
Rauf et al. | Automated grammatical error correction: A comprehensive review | |
Manjula | Identification of languages from the text document using natural language processing system | |
Leng et al. | Analysis and research on lexical errors in machine translation in Chinese and Korean translation | |
Azhar et al. | Roman urdu sentiment analysis using pre-trained distilbert and xlnet | |
Kaur et al. | Prediction of sentiment from macaronic reviews | |
JP2018010481A (ja) | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム | |
Shaheer et al. | Evaluating Question generation models using QA systems and Semantic Textual Similarity | |
Nishy Reshmi et al. | Textual entailment classification using syntactic structures and semantic relations | |
Navoda et al. | Automated spelling and grammar checker tool for sinhala | |
Huszár | Multilingual prompt engineering via large language models: an approach to sentiment analysis | |
Agarwal et al. | Gradient Boosted Trees for Identification of Complex Words in Context. | |
Kolappan | Computer Assisted Short Answer Grading with Rubrics using Active Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150331 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150908 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5823441 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |