JP5197774B2 - 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム - Google Patents
学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム Download PDFInfo
- Publication number
- JP5197774B2 JP5197774B2 JP2011007663A JP2011007663A JP5197774B2 JP 5197774 B2 JP5197774 B2 JP 5197774B2 JP 2011007663 A JP2011007663 A JP 2011007663A JP 2011007663 A JP2011007663 A JP 2011007663A JP 5197774 B2 JP5197774 B2 JP 5197774B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- boundary
- determination
- range
- antecedent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 149
- 230000006870 function Effects 0.000 claims description 42
- 238000012545 processing Methods 0.000 description 108
- 230000008569 process Effects 0.000 description 80
- 239000013598 vector Substances 0.000 description 73
- 238000004458 analytical method Methods 0.000 description 48
- 238000012549 training Methods 0.000 description 44
- 238000011156 evaluation Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 10
- 230000010354 integration Effects 0.000 description 8
- 239000000470 constituent Substances 0.000 description 6
- 230000010365 information processing Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000004043 responsiveness Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 235000014102 seafood Nutrition 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
「<ボブ>[1]が現れた。<彼>[1]は学生である。」 --(9900)
「<魚介類>[2]など、<風物>[2]を捉える感性が感じられる。」 --(9901)
「<モナコの外交官>[3]と面会した。<彼>[3]は忙しそうだった。」 --(9902)
「昨日青坂プリンスホテルで紹介された3Dテレビ南芝XXXXYYYYYは、報道機関の注目を集めた。ネット掲示板でも、南芝からのこの一刻も早い発売に期待しているとの前向きな声が聞かれた。」----(9903)
ここで、本実施の形態に係る共参照解析の背景及び概要について説明する。従来の訓練データの共参照要素タグは、共参照の組となり得る構成要素として形態素列の開始位置及び終了位置、あるいは別の言い方をすれば構成要素の前方境界及び後方境界を示している。これに加えて構成要素間の対応関係(リンク)を示すためのリンクタグが示されている。まとめると、従来の訓練データは、共参照関係を有する各構成要素の前方境界及び後方境界と、先行詞となる構成要素及び照応詞となる構成要素の対応関係との3種類の情報を示す。この訓練データをチャンキングタスクを回避した情報にするには、共参照関係を有する組となる構成要素を範囲ではなく点で示せれば良い。
「魚介<類>[2]など、<風物>[2]を捉える感性が感じられる。」 --(9905)
「モナコの外交<官>[3]と面会した。<彼>[3]は忙しそうだった。」 --(9906)
次に、学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラムの第2の実施の形態について説明する。なお、上述の第1の実施の形態と共通する部分については、同一の符号を使用して説明したり、説明を省略したりする。
次に、学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラムの第3の実施の形態について説明する。なお、上述の第1の実施の形態又は第2の実施の形態と共通する部分については、同一の符号を使用して説明したり、説明を省略したりする。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
60 学習処理部
61 ペアワイズ正例生成器
62 ペアワイズ負例生成器
63 非学習型要素範囲推定器
64 特徴抽出器
65 2値学習器
66 特徴統合器
70 判定処理部
71 ペアワイズ事例生成器
72 非学習型要素範囲推定器
73 特徴抽出器
74 2値判定器
75 特徴統合器
81 先行詞後方境界候補出力器
82 照応判定器
83 先行詞形態素列推定器
84 応用別有効性評価判定プラグイン
85 前回位置記憶領域
Claims (6)
- 文章と、前記文章内で照応関係を有する各要素の後方境界と、先行詞となる第1の要素及び照応詞となる第2の要素の対応関係とを示す第1のデータの入力を受け付ける入力受付部と、
前記第1のデータに基づいて、所定のルールに従って、前記第1の要素及び前記第2の要素のそれぞれについて、前方境界を推定することにより、前記前方境界及び前記後方境界によって決定される、前記第1の要素の範囲及び前記第2の要素の範囲を各々推定する推定部と、
前記第1の要素の範囲及び前記第2の要素の範囲に基づいて、任意の文章において照応関係の有無を判定するための判定基準を学習する学習部とを備える
ことを特徴とする学習装置。 - 文章と、前記文章内で照応関係を有する可能性のある各要素の後方境界とを示す第1のデータの入力を受け付ける入力受付部と、
前記第1のデータに基づいて、所定のルールに従って、各前記要素のそれぞれについて、前方境界を推定することにより、前記前方境界及び前記後方境界によって決定される、各前記要素の範囲を各々推定する推定部と、
各前記要素の範囲に基づいて、所定の判定基準に従って、各前記要素の照応関係の有無を判定する判定部とを備える
ことを特徴とする判定装置。 - 入力受付部と、推定部と、学習部とを備える学習装置で実行される学習方法であって、
前記入力受付部が、文章と、前記文章内で照応関係を有する各要素の後方境界と、先行詞となる第1の要素及び照応詞となる第2の要素の対応関係とを示す第1のデータの入力を受け付ける入力受付ステップと、
前記推定部が、前記第1のデータに基づいて、所定のルールに従って、前記第1の要素及び前記第2の要素のそれぞれについて、前方境界を推定することにより、前記前方境界及び前記後方境界によって決定される、前記第1の要素の範囲及び前記第2の要素の範囲を各々推定する推定ステップと、
前記学習部が、前記第1の要素の範囲及び前記第2の要素の範囲に基づいて、任意の文章において照応関係の有無を判定するための判定基準を学習する学習ステップとを含む
ことを特徴とする学習方法。 - 入力受付部と、推定部と、判定部とを備える判定装置で実行される判定方法であって、
前記入力受付部が、文章と、前記文章内で照応関係を有する可能性のある各要素の後方境界とを示す第1のデータの入力を受け付ける入力受付部と、
前記推定部が、前記第1のデータに基づいて、所定のルールに従って、各前記要素のそれぞれについて、前方境界を推定することにより、前記前方境界及び前記後方境界によって決定される、各前記要素の範囲を各々推定する推定ステップと、
前記判定部が、各前記要素の範囲に基づいて、所定の判定基準に従って、各前記要素の照応関係の有無を判定する判定ステップとを含む
ことを特徴とする判定方法。 - コンピュータを、
文章と、前記文章内で照応関係を有する各要素の後方境界と、先行詞となる第1の要素及び照応詞となる第2の要素の対応関係とを示す第1のデータの入力を受け付ける入力受付手段と、
前記第1のデータに基づいて、所定のルールに従って、前記第1の要素及び前記第2の要素のそれぞれについて、前方境界を推定することにより、前記前方境界及び前記後方境界によって決定される、前記第1の要素の範囲及び前記第2の要素の範囲を各々推定する推定手段と、
前記第1の要素の範囲及び前記第2の要素の範囲に基づいて、任意の文章において照応関係の有無を判定するための判定基準を学習する学習手段と
して機能させるための学習プログラム。 - コンピュータを、
文章と、前記文章内で照応関係を有する可能性のある各要素の後方境界とを示す第1のデータの入力を受け付ける入力受付手段と、
前記第1のデータに基づいて、所定のルールに従って、各前記要素のそれぞれについて、前方境界を推定することにより、前記前方境界及び前記後方境界によって決定される、各前記要素の範囲を各々推定する推定手段と、
各前記要素の範囲に基づいて、所定の判定基準に従って、各前記要素の照応関係の有無を判定する判定手段と
して機能させるための判定プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011007663A JP5197774B2 (ja) | 2011-01-18 | 2011-01-18 | 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム |
US13/303,258 US9141601B2 (en) | 2011-01-18 | 2011-11-23 | Learning device, determination device, learning method, determination method, and computer program product |
CN201110414927.6A CN102609406B (zh) | 2011-01-18 | 2011-12-13 | 学习装置、判断装置、学习方法和判断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011007663A JP5197774B2 (ja) | 2011-01-18 | 2011-01-18 | 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012150586A JP2012150586A (ja) | 2012-08-09 |
JP5197774B2 true JP5197774B2 (ja) | 2013-05-15 |
Family
ID=46491055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011007663A Expired - Fee Related JP5197774B2 (ja) | 2011-01-18 | 2011-01-18 | 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9141601B2 (ja) |
JP (1) | JP5197774B2 (ja) |
CN (1) | CN102609406B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9286291B2 (en) * | 2013-02-15 | 2016-03-15 | International Business Machines Corporation | Disambiguation of dependent referring expression in natural language processing |
WO2014132402A1 (ja) * | 2013-02-28 | 2014-09-04 | 株式会社東芝 | データ処理装置および物語モデル構築方法 |
JP6074820B2 (ja) * | 2015-01-23 | 2017-02-08 | 国立研究開発法人情報通信研究機構 | アノテーション補助装置及びそのためのコンピュータプログラム |
CN105988990B (zh) * | 2015-02-26 | 2021-06-01 | 索尼公司 | 汉语零指代消解装置和方法、模型训练方法和存储介质 |
US10042961B2 (en) * | 2015-04-28 | 2018-08-07 | Microsoft Technology Licensing, Llc | Relevance group suggestions |
US10264081B2 (en) | 2015-04-28 | 2019-04-16 | Microsoft Technology Licensing, Llc | Contextual people recommendations |
JP6737025B2 (ja) | 2016-07-19 | 2020-08-05 | 富士通株式会社 | 符号化プログラム、検索プログラム、符号化装置、検索装置、符号化方法、及び検索方法 |
CA3055379C (en) * | 2017-03-10 | 2023-02-21 | Eduworks Corporation | Automated tool for question generation |
JP6506360B2 (ja) * | 2017-08-24 | 2019-04-24 | 三菱電機インフォメーションシステムズ株式会社 | 教師データを生成する方法、学習済みモデルを生成する方法、学習済みモデル、コンピュータおよびプログラム |
CN111984766B (zh) * | 2019-05-21 | 2023-02-24 | 华为技术有限公司 | 缺失语义补全方法及装置 |
CN112001190B (zh) * | 2020-07-20 | 2024-09-20 | 北京百度网讯科技有限公司 | 自然语言处理模型的训练方法、装置、设备及存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6199037B1 (en) * | 1997-12-04 | 2001-03-06 | Digital Voice Systems, Inc. | Joint quantization of speech subframe voicing metrics and fundamental frequencies |
JP3135235B2 (ja) * | 1999-02-26 | 2001-02-13 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 照応解析装置 |
JP2002288190A (ja) * | 2001-03-26 | 2002-10-04 | Just Syst Corp | 要約装置、要約方法、ならびに、プログラム |
JP2002351870A (ja) * | 2001-05-29 | 2002-12-06 | Communication Research Laboratory | 形態素の解析方法 |
JP4065936B2 (ja) | 2001-10-09 | 2008-03-26 | 独立行政法人情報通信研究機構 | 機械学習法を用いた言語解析処理システムおよび機械学習法を用いた言語省略解析処理システム |
NO316480B1 (no) * | 2001-11-15 | 2004-01-26 | Forinnova As | Fremgangsmåte og system for tekstuell granskning og oppdagelse |
US7475010B2 (en) * | 2003-09-03 | 2009-01-06 | Lingospot, Inc. | Adaptive and scalable method for resolving natural language ambiguities |
US7813916B2 (en) * | 2003-11-18 | 2010-10-12 | University Of Utah | Acquisition and application of contextual role knowledge for coreference resolution |
US20050108630A1 (en) * | 2003-11-19 | 2005-05-19 | Wasson Mark D. | Extraction of facts from text |
JP3899414B2 (ja) * | 2004-03-31 | 2007-03-28 | 独立行政法人情報通信研究機構 | 教師データ作成装置およびプログラム、ならびに言語解析処理装置およびプログラム |
JP4654780B2 (ja) * | 2005-06-10 | 2011-03-23 | 富士ゼロックス株式会社 | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
CN100533431C (zh) * | 2005-09-21 | 2009-08-26 | 富士通株式会社 | 一种基于语素标注的自然语言成分识别、校正装置及方法 |
US8712758B2 (en) * | 2007-08-31 | 2014-04-29 | Microsoft Corporation | Coreference resolution in an ambiguity-sensitive natural language processing system |
US8463593B2 (en) * | 2007-08-31 | 2013-06-11 | Microsoft Corporation | Natural language hypernym weighting for word sense disambiguation |
CN101539907B (zh) * | 2008-03-19 | 2013-01-23 | 日电(中国)有限公司 | 词性标注模型训练装置、词性标注系统及其方法 |
CN101751455B (zh) * | 2009-12-31 | 2011-09-21 | 浙江大学 | 采用人工智能技术自动产生标题的方法 |
-
2011
- 2011-01-18 JP JP2011007663A patent/JP5197774B2/ja not_active Expired - Fee Related
- 2011-11-23 US US13/303,258 patent/US9141601B2/en not_active Expired - Fee Related
- 2011-12-13 CN CN201110414927.6A patent/CN102609406B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20120183935A1 (en) | 2012-07-19 |
CN102609406B (zh) | 2015-11-25 |
JP2012150586A (ja) | 2012-08-09 |
CN102609406A (zh) | 2012-07-25 |
US9141601B2 (en) | 2015-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5197774B2 (ja) | 学習装置、判定装置、学習方法、判定方法、学習プログラム及び判定プログラム | |
Garrette et al. | Learning a part-of-speech tagger from two hours of annotation | |
KR101851785B1 (ko) | 챗봇의 트레이닝 세트 생성 장치 및 방법 | |
US10460028B1 (en) | Syntactic graph traversal for recognition of inferred clauses within natural language inputs | |
JP6955963B2 (ja) | 検索装置、類似度算出方法、およびプログラム | |
CN105988990A (zh) | 用于汉语中的零指代消解的装置和方法以及模型训练方法 | |
SG188994A1 (en) | Textual entailment recognition apparatus, textual entailment recognition method, and computer-readable recording medium | |
JP6705318B2 (ja) | 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム | |
KR101851789B1 (ko) | 도메인 유사어구 생성 장치 및 방법 | |
JP5564705B2 (ja) | 文構造解析装置、文構造解析方法および文構造解析プログラム | |
US10055404B2 (en) | Translation apparatus | |
Li et al. | Active learning for dependency parsing with partial annotation | |
JP5911098B2 (ja) | 翻訳装置、およびプログラム | |
JP2009181408A (ja) | 単語意味付与装置、単語意味付与方法、プログラムおよび記録媒体 | |
KR20160108886A (ko) | 개방형 정보 추출을 이용한 지식베이스 확장 방법 및 장치 | |
US20210133394A1 (en) | Experiential parser | |
KR20170131893A (ko) | 오픈 디렉터리 프로젝트 기반의 텍스트 분류기, 및 텍스트 분류기의 생성 및 분류 방법 | |
JP2009187048A (ja) | 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム | |
JP4435144B2 (ja) | データ検索システム及びプログラム | |
JP5150277B2 (ja) | 言語処理装置、言語処理方法および言語処理プログラム並びに言語処理プログラムを記録した記録媒体 | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
JP2008305291A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Wang et al. | Transition-based chinese semantic dependency graph parsing | |
Boroş et al. | RACAI GEC–a hybrid approach to grammatical error correction | |
JP2019021096A (ja) | 言語解析装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160215 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5197774 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |