JP7487768B2 - 要約生成装置、要約生成方法及びプログラム - Google Patents
要約生成装置、要約生成方法及びプログラム Download PDFInfo
- Publication number
- JP7487768B2 JP7487768B2 JP2022509755A JP2022509755A JP7487768B2 JP 7487768 B2 JP7487768 B2 JP 7487768B2 JP 2022509755 A JP2022509755 A JP 2022509755A JP 2022509755 A JP2022509755 A JP 2022509755A JP 7487768 B2 JP7487768 B2 JP 7487768B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- feature information
- unit
- service
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000004458 analytical method Methods 0.000 claims description 37
- 230000000877 morphologic effect Effects 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 11
- 238000007621 cluster analysis Methods 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000001364 causal effect Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010225 co-occurrence analysis Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
塩分濃度-データ
塩分濃度-海洋
携帯電話-確認
作業内容-記憶
最高値-表示
:
なお、特徴計算部112は、上記の各サービス特徴をベクトル化(数値化)してもよい。具体的には、Word2Vecを用いて、各名詞を分散表現に変換し、係り受けの関係にある名詞同士の分散表現の平均を、当該名詞同士のサービス特徴の値としてもよい。例えば、「塩分濃度-データ」であれば、「塩分濃度」の分散表現と「データ」の分散表現との平均がサービス特徴とされてもよい。また、当該名詞同士の分散表現の値を加算し正規化したものをサービス特徴としてもよい。
自然災害-適応
:
といった単語又は句の集合が特徴情報(以下、「ターゲット特徴」という。)の集合として得られる。特徴計算部112によって計算されるサービス特徴がベクトル(分散表現)である場合、構文解析部13は、特徴計算部112と同様の方法で各ターゲット特徴をベクトルに変換すればよい。すなわち、構文解析部13によって、ターゲット文書に関して、ICTサービスのテキストデータの特徴情報と対比可能な特徴情報が得られる。
11 サービス特徴抽出部
12 形態素解析部
13 構文解析部
14 判定部
15 要約生成部
16 要約出力部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
111 形態素解析部
112 特徴計算部
121 テキストDB
122 特徴記憶部
B バス
Claims (6)
- ICTサービスに関するテキストデータの構成要素に基づいて、1以上の第1の特徴情報を前記テキストデータから抽出する第1の抽出部と、
SDGsの目標に属するターゲットの構成要素に基づいて、前記ターゲットの特徴を示す1以上の第2の特徴情報を前記ターゲットから抽出する第2の抽出部と、
前記第2の特徴情報のそれぞれについて、前記第1の特徴情報との類似度を判定する判定部と、
前記類似度が閾値以上である前記第2の特徴情報のそれぞれに対応する、前記ターゲットの前記構成要素の集合をクラスター分析した結果を、前記目標の要約として生成する生成部と、
を有することを特徴とする要約生成装置。 - 前記第1の抽出部は、前記テキストデータについて形態素解析を実行し、前記形態素解析の結果を入力とする自然言語処理に基づいて前記第1の特徴情報を抽出する、
ことを特徴とする請求項1記載の要約生成装置。 - 前記第2の抽出部は、前記ターゲットについて形態素解析を実行し、前記形態素解析の結果を入力とする自然言語処理に基づいて前記第2の特徴情報を抽出する、
ことを特徴とする請求項1又は2記載の要約生成装置。 - 前記生成部が生成した前記要約を出力する出力部、
を有することを特徴とする請求項1乃至3いずれか一項記載の要約生成装置。 - ICTサービスに関するテキストデータの構成要素に基づいて、1以上の第1の特徴情報を前記テキストデータから抽出する第1の抽出手順と、
SDGsの目標に属するターゲットの構成要素に基づいて、前記ターゲットの特徴を示す1以上の第2の特徴情報を前記ターゲットから抽出する第2の抽出手順と、
前記第2の特徴情報のそれぞれについて、前記第1の特徴情報との類似度を判定する判定手順と、
前記類似度が閾値以上である前記第2の特徴情報のそれぞれに対応する、前記ターゲットの前記構成要素の集合をクラスター分析した結果を、前記目標の要約として生成する生成手順と、
をコンピュータが実行することを特徴とする要約生成方法。 - 請求項1乃至4いずれか一項記載の要約生成装置としてコンピュータを機能させることを特徴とするプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/012589 WO2021191938A1 (ja) | 2020-03-23 | 2020-03-23 | 要約生成装置、要約生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021191938A1 JPWO2021191938A1 (ja) | 2021-09-30 |
JP7487768B2 true JP7487768B2 (ja) | 2024-05-21 |
Family
ID=77891076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022509755A Active JP7487768B2 (ja) | 2020-03-23 | 2020-03-23 | 要約生成装置、要約生成方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US12019666B2 (ja) |
JP (1) | JP7487768B2 (ja) |
WO (1) | WO2021191938A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230047849A (ko) | 2021-10-01 | 2023-04-10 | 네이버 주식회사 | 초대형 언어 모델을 이용한 문서 요약 방법 및 시스템 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323570A (ja) | 2006-06-05 | 2007-12-13 | Nippon Telegr & Teleph Corp <Ntt> | 情報通信を利用したサービスの評価方法およびプログラム |
JP2016153998A (ja) | 2015-02-16 | 2016-08-25 | 日本電信電話株式会社 | サービスの評価装置及びサービスの評価方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130060720A (ko) * | 2011-11-30 | 2013-06-10 | 한국전자통신연구원 | 목적 기반 시맨틱 서비스 디스커버리를 위한 서비스 목적 해석 장치 및 방법 |
CN108170684B (zh) * | 2018-01-22 | 2020-06-05 | 京东方科技集团股份有限公司 | 文本相似度计算方法及系统、数据查询系统和计算机产品 |
US11222167B2 (en) * | 2019-12-19 | 2022-01-11 | Adobe Inc. | Generating structured text summaries of digital documents using interactive collaboration |
-
2020
- 2020-03-23 US US17/906,497 patent/US12019666B2/en active Active
- 2020-03-23 JP JP2022509755A patent/JP7487768B2/ja active Active
- 2020-03-23 WO PCT/JP2020/012589 patent/WO2021191938A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323570A (ja) | 2006-06-05 | 2007-12-13 | Nippon Telegr & Teleph Corp <Ntt> | 情報通信を利用したサービスの評価方法およびプログラム |
JP2016153998A (ja) | 2015-02-16 | 2016-08-25 | 日本電信電話株式会社 | サービスの評価装置及びサービスの評価方法 |
Non-Patent Citations (3)
Title |
---|
Galsurkar et al.,Assessing national development plans for alignment with sustainable development goals via semantic search,In Proceedings of the AAAI Conference on Artificial Intelligence,vol. 32, no. 1,2018年02月02日,pp.7753-7758 |
古谷 崇 外3名,ICTサービスによる持続可能な開発目標(SDGs)への貢献に向けた一考察,電子情報通信学会2019年総合大会講演論文集 基礎・境界,一般社団法人電子情報通信学会,2019年03月05日,pp.114 |
関 洋平 外2名,文の機能的タイプを利用した複数文書要約,第66回(平成16年)全国大会講演論文集(2) 人工知能と認知科学,社団法人情報処理学会,2004年03月09日,pp.2-61~2-62 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021191938A1 (ja) | 2021-09-30 |
US20230146583A1 (en) | 2023-05-11 |
US12019666B2 (en) | 2024-06-25 |
WO2021191938A1 (ja) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12019978B2 (en) | Lean parsing: a natural language processing system and method for parsing domain-specific languages | |
US20200334492A1 (en) | Ablation on observable data for determining influence on machine learning systems | |
JP7251181B2 (ja) | 対訳処理方法および対訳処理プログラム | |
US9607035B2 (en) | Extensible validation framework for question and answer systems | |
CN108875059B (zh) | 用于生成文档标签的方法、装置、电子设备和存储介质 | |
WO2022218186A1 (zh) | 个性化知识图谱的生成方法、装置及计算机设备 | |
US10380263B2 (en) | Translation synthesizer for analysis, amplification and remediation of linguistic data across a translation supply chain | |
CN104462057A (zh) | 用于产生语言分析的词汇资源的方法和系统 | |
CN111783450B (zh) | 语料文本中的短语提取方法、装置、存储介质及电子设备 | |
CN108319586B (zh) | 一种信息提取规则的生成和语义解析方法及装置 | |
US20150212976A1 (en) | System and method for rule based classification of a text fragment | |
CA3207902A1 (en) | Auditing citations in a textual document | |
Zhong et al. | Natural language processing for systems engineering: automatic generation of systems modelling language diagrams | |
JP7487768B2 (ja) | 要約生成装置、要約生成方法及びプログラム | |
CN112417860A (zh) | 训练样本增强方法、系统、设备及存储介质 | |
CN113569578B (zh) | 一种用户意图识别方法、装置和计算机设备 | |
US11675980B2 (en) | Bias identification and correction in text documents | |
CN115495556A (zh) | 文档处理方法及装置 | |
US20220269860A1 (en) | Evaluation apparatus and evaluation method | |
CN113378543B (zh) | 数据分析方法、训练数据分析模型的方法及电子设备 | |
WO2020026229A2 (en) | Proposition identification in natural language and usage thereof | |
WO2023162129A1 (ja) | 学習用データ生成装置、リスク検知装置、学習用データ生成方法、リスク検知方法、学習用データ生成プログラム及びリスク検知プログラム | |
CN112733492B (zh) | 基于知识库的辅助设计方法、装置、终端和存储介质 | |
US20230325606A1 (en) | Method for extracting information from an unstructured data source | |
CA3076418C (en) | Lean parsing: a natural language processing system and method for parsing domain-specific languages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7487768 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |