JP2018197953A - 解析装置、解析方法、および解析プログラム - Google Patents
解析装置、解析方法、および解析プログラム Download PDFInfo
- Publication number
- JP2018197953A JP2018197953A JP2017102345A JP2017102345A JP2018197953A JP 2018197953 A JP2018197953 A JP 2018197953A JP 2017102345 A JP2017102345 A JP 2017102345A JP 2017102345 A JP2017102345 A JP 2017102345A JP 2018197953 A JP2018197953 A JP 2018197953A
- Authority
- JP
- Japan
- Prior art keywords
- analysis result
- analysis
- sentence
- result candidate
- predicate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、実施の形態にかかる解析方法の一実施例を示す説明図である。解析装置100は、対象文書の述語項構造を解析するコンピュータである。解析装置100は、例えば、サーバやPC(Personal Computer)などである。
次に、図2を用いて、解析装置100のハードウェア構成例について説明する。
次に、図3を用いて、解析装置100の機能的構成例について説明する。
次に、図4および図5を用いて、解析装置100が対象文書400の述語項構造を解析する流れについて説明する。
次に、図6〜図10を用いて、解析装置100が対象文書600の述語項構造を解析する具体例について説明する。まず、図6を用いて、対象文書600の具体例について説明する。
次に、図11を用いて、解析装置100が実行する解析処理手順の一例について説明する。
取得した前記対象文書のうち、所定単位の文章ごとに、述語項構造の1以上の解析結果候補を生成し、
前記所定単位の文章ごとに生成した前記1以上の解析結果候補のいずれかの解析結果候補を選択して組み合わせた、複数の解析結果候補集合を生成し、
生成した前記複数の解析結果候補集合のそれぞれの解析結果候補集合について文脈の一貫性を評価し、
評価した結果に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、
制御部を有することを特徴とする解析装置。
前記所定単位の文章ごとに、所定種別と判断される、当該文章における1以上の名詞のそれぞれの名詞について、前記所定種別としての尤度を算出し、
前記所定単位の文章ごとに、当該文章における述語に、算出した前記尤度が所定値以上の名詞のそれぞれの名詞を対応付けた、前記1以上の解析結果候補を生成する、ことを特徴とする付記1に記載の解析装置。
前記それぞれの解析結果候補集合について、連続する2つの解析結果候補のうち前段の解析結果候補において第1種別と判断され、後段の解析結果候補において第2種別と判断された名詞の数が大きいほど、文脈の一貫性を示す評価値が大きくなるように、前記評価値を算出し、
前記それぞれの解析結果候補集合について算出した前記評価値に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、ことを特徴とする付記2に記載の解析装置。
生成した前記複数の解析結果候補集合のそれぞれの解析結果候補集合について、Entity Gridモデルを用いて、文脈の一貫性を示す評価値を算出する、ことを特徴とする付記3に記載の解析装置。
述語項構造の解析対象になる対象文書を取得し、
取得した前記対象文書のうち、所定単位の文章ごとに、述語項構造の1以上の解析結果候補を生成し、
前記所定単位の文章ごとに生成した前記1以上の解析結果候補のいずれかの解析結果候補を選択して組み合わせた、複数の解析結果候補集合を生成し、
生成した前記複数の解析結果候補集合のそれぞれの解析結果候補集合について文脈の一貫性を評価し、
評価した結果に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、
処理を実行することを特徴とする解析方法。
述語項構造の解析対象になる対象文書を取得し、
取得した前記対象文書のうち、所定単位の文章ごとに、述語項構造の1以上の解析結果候補を生成し、
前記所定単位の文章ごとに生成した前記1以上の解析結果候補のいずれかの解析結果候補を選択して組み合わせた、複数の解析結果候補集合を生成し、
生成した前記複数の解析結果候補集合のそれぞれの解析結果候補集合について文脈の一貫性を評価し、
評価した結果に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、
処理を実行させることを特徴とする解析プログラム。
101,400,600 対象文書
102,421,422,801,802,803 解析結果候補集合
103 解析結果
200 バス
201 CPU
202 メモリ
203 ネットワークI/F
204 記録媒体I/F
205 記録媒体
210 ネットワーク
300 記憶部
301 取得部
302 生成部
303 評価部
304 出力部
811,812 解析結果候補
Claims (5)
- 述語項構造の解析対象になる対象文書を取得し、
取得した前記対象文書のうち、所定単位の文章ごとに、述語項構造の1以上の解析結果候補を生成し、
前記所定単位の文章ごとに生成した前記1以上の解析結果候補のいずれかの解析結果候補を選択して組み合わせた、複数の解析結果候補集合を生成し、
生成した前記複数の解析結果候補集合のそれぞれの解析結果候補集合について文脈の一貫性を評価し、
評価した結果に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、
制御部を有することを特徴とする解析装置。 - 前記制御部は、
前記所定単位の文章ごとに、所定種別と判断される、当該文章における1以上の名詞のそれぞれの名詞について、前記所定種別としての尤度を算出し、
前記所定単位の文章ごとに、当該文章における述語に、算出した前記尤度が所定値以上の名詞のそれぞれの名詞を対応付けた、前記1以上の解析結果候補を生成する、ことを特徴とする請求項1に記載の解析装置。 - 前記制御部は、
前記それぞれの解析結果候補集合について、連続する2つの解析結果候補のうち前段の解析結果候補において第1種別と判断され、後段の解析結果候補において第2種別と判断された名詞の数が大きいほど、文脈の一貫性を示す評価値が大きくなるように、前記評価値を算出し、
前記それぞれの解析結果候補集合について算出した前記評価値に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、ことを特徴とする請求項2に記載の解析装置。 - コンピュータが、
述語項構造の解析対象になる対象文書を取得し、
取得した前記対象文書のうち、所定単位の文章ごとに、述語項構造の1以上の解析結果候補を生成し、
前記所定単位の文章ごとに生成した前記1以上の解析結果候補のいずれかの解析結果候補を選択して組み合わせた、複数の解析結果候補集合を生成し、
生成した前記複数の解析結果候補集合のそれぞれの解析結果候補集合について文脈の一貫性を評価し、
評価した結果に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、
処理を実行することを特徴とする解析方法。 - コンピュータに、
述語項構造の解析対象になる対象文書を取得し、
取得した前記対象文書のうち、所定単位の文章ごとに、述語項構造の1以上の解析結果候補を生成し、
前記所定単位の文章ごとに生成した前記1以上の解析結果候補のいずれかの解析結果候補を選択して組み合わせた、複数の解析結果候補集合を生成し、
生成した前記複数の解析結果候補集合のそれぞれの解析結果候補集合について文脈の一貫性を評価し、
評価した結果に基づいて、前記複数の解析結果候補集合のいずれかの解析結果候補集合を出力する、
処理を実行させることを特徴とする解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017102345A JP6907703B2 (ja) | 2017-05-24 | 2017-05-24 | 解析装置、解析方法、および解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017102345A JP6907703B2 (ja) | 2017-05-24 | 2017-05-24 | 解析装置、解析方法、および解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018197953A true JP2018197953A (ja) | 2018-12-13 |
JP6907703B2 JP6907703B2 (ja) | 2021-07-21 |
Family
ID=64663215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017102345A Active JP6907703B2 (ja) | 2017-05-24 | 2017-05-24 | 解析装置、解析方法、および解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6907703B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7481251B2 (ja) | 2020-06-30 | 2024-05-10 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テキスト中のイベント抽出方法、装置、電子機器及び記憶媒体 |
-
2017
- 2017-05-24 JP JP2017102345A patent/JP6907703B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7481251B2 (ja) | 2020-06-30 | 2024-05-10 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | テキスト中のイベント抽出方法、装置、電子機器及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP6907703B2 (ja) | 2021-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11861307B2 (en) | Request paraphrasing system, request paraphrasing model and request determining model training method, and dialogue system | |
Schepens et al. | Cross-language distributions of high frequency and phonetically similar cognates | |
US10242670B2 (en) | Syntactic re-ranking of potential transcriptions during automatic speech recognition | |
KR20210158344A (ko) | 디지털 어시스턴트를 위한 머신 러닝 시스템 | |
WO2022218186A1 (zh) | 个性化知识图谱的生成方法、装置及计算机设备 | |
KR101498331B1 (ko) | 텍스트 세그먼트를 가진 문서로부터 용어를 추출하기 위한 시스템 | |
Briscoe et al. | Evaluating the accuracy of an unlexicalized statistical parser on the PARC DepBank | |
JP2022013586A (ja) | 議事録の生成方法、装置、電子機器、及びコンピュータ可読記憶媒体 | |
US11082369B1 (en) | Domain-specific chatbot utterance collection | |
Chen et al. | Chinese zero pronoun resolution: An unsupervised approach combining ranking and integer linear programming | |
Glass et al. | A naive salience-based method for speaker identification in fiction books | |
JP6830226B2 (ja) | 換言文識別方法、換言文識別装置及び換言文識別プログラム | |
Chen | Computational generation of Chinese noun phrases | |
Körner et al. | Natural language specification improvement with ontologies | |
Roll et al. | Measuring syntactic complexity in spontaneous spoken Swedish | |
Dunn | Exposure and emergence in usage-based grammar: computational experiments in 35 languages | |
JP6907703B2 (ja) | 解析装置、解析方法、および解析プログラム | |
US20140325490A1 (en) | Classifying Source Code Using an Expertise Model | |
Radeva et al. | Web Application for Retrieval-Augmented Generation: Implementation and Testing | |
US11907656B2 (en) | Machine based expansion of contractions in text in digital media | |
JP6586055B2 (ja) | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム | |
CN113254573A (zh) | 文本摘要生成方法、装置、电子设备及可读存储介质 | |
CN113378561A (zh) | 词语预测模板生成方法及装置 | |
JP2020052818A (ja) | 情報処理装置、情報処理方法及びプログラム | |
Hilpert et al. | Fixed-effects regression modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210614 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6907703 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |