JP5389273B1 - 文脈解析装置および文脈解析方法 - Google Patents
文脈解析装置および文脈解析方法 Download PDFInfo
- Publication number
- JP5389273B1 JP5389273B1 JP2012542314A JP2012542314A JP5389273B1 JP 5389273 B1 JP5389273 B1 JP 5389273B1 JP 2012542314 A JP2012542314 A JP 2012542314A JP 2012542314 A JP2012542314 A JP 2012542314A JP 5389273 B1 JP5389273 B1 JP 5389273B1
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- probability
- prediction
- series
- context analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (12)
- 共有項を持つ述語と、該述語の語義を特定する語義特定情報と、前記共有項の格の種別を表す格種別情報との組み合わせを要素とし、該要素を複数並べた系列の一部の要素を予測により求めた予測系列を、解析対象の文書から生成する予測系列生成部と、
任意の文書群から事前に獲得された前記系列であって前記予測系列と一致する前記系列の出現確率に基づいて、前記予測系列の発生確率を予測する確率予測部と、
予測された前記予測系列の発生確率を用いて、解析対象の文書に対する文脈解析を行う解析処理部と、を備える文脈解析装置。 - 前記解析処理部は、予測された前記予測系列の発生確率を前記予測系列の特徴量として用いた機械学習により、解析対象の文書に対する照応解析を行う、請求項1に記載の文脈解析装置。
- 任意の文書群から前記系列を獲得する系列獲得部と、
獲得された前記系列の出現確率を算出する確率算出部と、をさらに備える、請求項1に記載の文脈解析装置。 - 前記系列獲得部は、任意の文書群から共有項を持つ複数の述語を検出し、検出した複数の述語のそれぞれについて、該述語と、前記語義特定情報と、前記格種別情報との組み合わせを前記要素として求め、複数の述語ごとに求めた複数の前記要素を前記文書群における述語の出現順に並べて前記系列を獲得する、請求項3に記載の文脈解析装置。
- 獲得された前記系列の出現頻度を算出する頻度算出部をさらに備え、
前記確率算出部は、前記系列の出現頻度に基づいて前記系列の出現確率を算出する、請求項3に記載の文脈解析装置。 - 前記系列獲得部は、1つの述語に対して複数の語義を推定して、前記組み合わせのうち前記語義特定情報のみが異なる複数の要素候補を含む要素を複数並べた前記系列を獲得し、
前記頻度算出部は、前記系列の出現頻度を、前記要素候補の組み合わせの数で除算して、前記要素候補の組み合わせごとの出現頻度をそれぞれ算出する、請求項5に記載の文脈解析装置。 - 前記確率算出部は、N階マルコフ過程に基づいて、前記系列の出現確率を算出する、請求項5に記載の文脈解析装置。
- 前記確率算出部は、前記系列内の任意の要素のペアに関するポイントワイズ相互情報量の総和に基づいて、前記系列の出現確率を算出する、請求項5に記載の文脈解析装置。
- 前記頻度算出部は、前記系列内のN個の要素の部分集合である部分系列ごとに出現頻度を算出し、
前記確率算出部は、前記部分系列ごとに出現確率を算出する、請求項5に記載の文脈解析装置。 - 前記頻度算出部は、前記系列において隣接していない要素の組み合わせを許容して前記部分系列を求める、請求項9に記載の文脈解析装置。
- 前記文書群は、共参照関係にある名詞同士を識別するための共参照情報が付与されており、
前記系列獲得部は、前記共参照情報に基づいて前記共有項を特定する、請求項4に記載の文脈解析装置。 - 文脈解析装置において実行される文脈解析方法であって、
前記文脈解析装置の予測系列生成部が、共有項を持つ述語と、該述語の語義を特定する語義特定情報と、前記共有項の格の種別を表す格種別情報との組み合わせを要素とし、該要素を複数並べた系列の一部の要素を予測により求めた予測系列を、解析対象の文書から生成し、
前記文脈解析装置の確率予測部が、任意の文書群から事前に獲得された前記系列であって前記予測系列と一致する前記系列の出現確率に基づいて、前記予測系列の発生確率を予測し、
前記文脈解析装置の解析処理部が、予測された前記予測系列の発生確率を用いて、解析対象の文書に対する文脈解析を行う文脈解析方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/066182 WO2014002172A1 (ja) | 2012-06-25 | 2012-06-25 | 文脈解析装置および文脈解析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5389273B1 true JP5389273B1 (ja) | 2014-01-15 |
JPWO2014002172A1 JPWO2014002172A1 (ja) | 2016-05-26 |
Family
ID=49782407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012542314A Active JP5389273B1 (ja) | 2012-06-25 | 2012-06-25 | 文脈解析装置および文脈解析方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150032444A1 (ja) |
JP (1) | JP5389273B1 (ja) |
CN (1) | CN104169909B (ja) |
WO (1) | WO2014002172A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7481251B2 (ja) | 2020-06-30 | 2024-05-10 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テキスト中のイベント抽出方法、装置、電子機器及び記憶媒体 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014132402A1 (ja) * | 2013-02-28 | 2014-09-04 | 株式会社東芝 | データ処理装置および物語モデル構築方法 |
JP6074820B2 (ja) * | 2015-01-23 | 2017-02-08 | 国立研究開発法人情報通信研究機構 | アノテーション補助装置及びそのためのコンピュータプログラム |
CN105988990B (zh) * | 2015-02-26 | 2021-06-01 | 索尼公司 | 汉语零指代消解装置和方法、模型训练方法和存储介质 |
US10607152B2 (en) | 2015-05-26 | 2020-03-31 | Textio, Inc. | Using machine learning to predict outcomes for documents |
US10831802B2 (en) * | 2016-04-11 | 2020-11-10 | Facebook, Inc. | Techniques to respond to user requests using natural-language machine learning based on example conversations |
US10606952B2 (en) | 2016-06-24 | 2020-03-31 | Elemental Cognition Llc | Architecture and processes for computer learning and understanding |
JP6727610B2 (ja) * | 2016-09-05 | 2020-07-22 | 国立研究開発法人情報通信研究機構 | 文脈解析装置及びそのためのコンピュータプログラム |
US10860800B2 (en) * | 2017-10-30 | 2020-12-08 | Panasonic Intellectual Property Management Co., Ltd. | Information processing method, information processing apparatus, and program for solving a specific task using a model of a dialogue system |
US11106872B2 (en) * | 2018-01-09 | 2021-08-31 | Jyu-Fang Yu | System and method for improving sentence diagram construction and analysis by enabling a user positioning sentence construction components and words on a diagramming interface |
EP3759656A4 (en) * | 2018-02-28 | 2022-03-30 | Northrup, Charles | SYSTEM AND METHOD FOR A DING MACHINE FOR RUNNING MODELS |
US11182540B2 (en) * | 2019-04-23 | 2021-11-23 | Textio, Inc. | Passively suggesting text in an electronic document |
CN111984766B (zh) * | 2019-05-21 | 2023-02-24 | 华为技术有限公司 | 缺失语义补全方法及装置 |
CN112001190A (zh) * | 2020-07-20 | 2020-11-27 | 北京百度网讯科技有限公司 | 自然语言处理模型的训练方法、装置、设备及存储介质 |
WO2022047252A1 (en) * | 2020-08-27 | 2022-03-03 | Unified Compliance Framework (Network Frontiers) | Automatically identifying multi-word expressions |
CN112183060B (zh) * | 2020-09-28 | 2022-05-10 | 重庆工商大学 | 多轮对话系统的指代消解方法 |
US11977852B2 (en) * | 2022-01-12 | 2024-05-07 | Bank Of America Corporation | Anaphoric reference resolution using natural language processing and machine learning |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5696916A (en) * | 1985-03-27 | 1997-12-09 | Hitachi, Ltd. | Information storage and retrieval system and display method therefor |
US8180633B2 (en) * | 2007-03-08 | 2012-05-15 | Nec Laboratories America, Inc. | Fast semantic extraction using a neural network architecture |
US8527262B2 (en) * | 2007-06-22 | 2013-09-03 | International Business Machines Corporation | Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications |
CN101539907B (zh) * | 2008-03-19 | 2013-01-23 | 日电(中国)有限公司 | 词性标注模型训练装置、词性标注系统及其方法 |
JP5527504B2 (ja) * | 2009-04-20 | 2014-06-18 | 日本電気株式会社 | 語句抽出ルール生成装置、語句抽出システム、語句抽出ルール生成方法、及びプログラム |
JP2011150450A (ja) * | 2010-01-20 | 2011-08-04 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
EP2622592A4 (en) * | 2010-09-28 | 2017-04-05 | International Business Machines Corporation | Providing answers to questions using multiple models to score candidate answers |
-
2012
- 2012-06-25 JP JP2012542314A patent/JP5389273B1/ja active Active
- 2012-06-25 WO PCT/JP2012/066182 patent/WO2014002172A1/ja active Application Filing
- 2012-06-25 CN CN201280071298.4A patent/CN104169909B/zh active Active
-
2014
- 2014-09-03 US US14/475,700 patent/US20150032444A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7481251B2 (ja) | 2020-06-30 | 2024-05-10 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テキスト中のイベント抽出方法、装置、電子機器及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20150032444A1 (en) | 2015-01-29 |
JPWO2014002172A1 (ja) | 2016-05-26 |
CN104169909B (zh) | 2016-10-05 |
CN104169909A (zh) | 2014-11-26 |
WO2014002172A1 (ja) | 2014-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5389273B1 (ja) | 文脈解析装置および文脈解析方法 | |
Yang et al. | Joint extraction of events and entities within a document context | |
US10289952B2 (en) | Semantic frame identification with distributed word representations | |
US9465865B2 (en) | Annotating entities using cross-document signals | |
US20150095017A1 (en) | System and method for learning word embeddings using neural language models | |
US8321418B2 (en) | Information processor, method of processing information, and program | |
US20160104075A1 (en) | Identifying salient terms for passage justification in a question answering system | |
Szarvas et al. | Supervised all-words lexical substitution using delexicalized features | |
Celano et al. | Part of speech tagging for ancient greek | |
Rozovskaya et al. | Correcting grammatical verb errors | |
JP6665061B2 (ja) | 整合性判定装置、方法、及びプログラム | |
Singh et al. | Named entity recognition for manipuri using support vector machine | |
Wong et al. | iSentenizer‐μ: Multilingual Sentence Boundary Detection Model | |
Jain et al. | Improving Kullback-Leibler based legal document summarization using enhanced text representation | |
JP4979637B2 (ja) | 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム | |
Rachman et al. | Word Embedding for Rhetorical Sentence Categorization on Scientific Articles. | |
Jayasuriya et al. | Learning a stochastic part of speech tagger for sinhala | |
Vaishnavi et al. | Paraphrase identification in short texts using grammar patterns | |
Oudah et al. | Person name recognition using the hybrid approach | |
Hoceini et al. | Towards a New Approach for Disambiguation in NLP by Multiple Criterian Decision-Aid. | |
Zheng et al. | Character-based parsing with convolutional neural network | |
Surahio et al. | Prediction system for sindhi parts of speech tags by using support vector machine | |
Huang et al. | Modeling human inference process for textual entailment recognition | |
Bölücü et al. | A cascaded unsupervised model for PoS tagging | |
Chang et al. | Zero pronoun identification in chinese language with deep neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131008 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5389273 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |