KR20210036318A - 이벤트 아규먼트 추출 방법, 장치 및 전자 기기 - Google Patents

이벤트 아규먼트 추출 방법, 장치 및 전자 기기 Download PDF

Info

Publication number
KR20210036318A
KR20210036318A KR1020210033440A KR20210033440A KR20210036318A KR 20210036318 A KR20210036318 A KR 20210036318A KR 1020210033440 A KR1020210033440 A KR 1020210033440A KR 20210033440 A KR20210033440 A KR 20210033440A KR 20210036318 A KR20210036318 A KR 20210036318A
Authority
KR
South Korea
Prior art keywords
event
argument
training
extraction model
data
Prior art date
Application number
KR1020210033440A
Other languages
English (en)
Other versions
KR102653312B1 (ko
Inventor
바왠 리
위광 첸
루 판
웬전 리위
추이윈 한
시 스
쟈엔 황
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20210036318A publication Critical patent/KR20210036318A/ko
Application granted granted Critical
Publication of KR102653312B1 publication Critical patent/KR102653312B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시는 지식 그래프 기술분야에 관한 것이며, 이벤트 아규먼트 추출 방법, 장치 및 전자 기기를 제공한다. 구체적인 구현 방안은: 추출될 이벤트 내용을 획득하는 단계; 및 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계; 를 포함하며, 그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.

Description

이벤트 아규먼트 추출 방법, 장치 및 전자 기기{Method and apparatus for extracting event argument, electronic device}
본 개시는 컴퓨터 기술중의 지식 그래프(Graph) 기술분야에 관한 것으로, 특히 이벤트 아규먼트(argument) 추출 방법, 장치 및 전자 기기에 관한 것이다.
이벤트 아규먼트 추출은 이벤트 설명으로부터 이벤트의 각각의 구성 요소(시간, 로케이션, 참여자, 이벤트에 의해 적절하게 배치된 관련 내용 등)를 추출하는 것을 의미하고, 요소는 아규먼트이며, 각각의 아규먼트에 대응하는 하나의 아규먼트 역할은, 최종적으로 구조화된 지식의 형태로 사용자에게 표시된다.
현재, 통상적으로 채용되는 이벤트 아규먼트 추출 모델은 분류 사로를 기초로 한 것인데, 그러나, 상이한 이벤트 타입의 이벤트 아규먼트 역할은 상이하며, 간단한 분류 모델은 유효하게 아규먼트 식별을 진행할 수 없으며, 즉 이벤트 아규먼트 추출 효과가 비교적 차하다.
본 개시는 이벤트 아규먼트 추출 방법, 장치 및 전자 기기를 제공하여, 이벤트 아규먼트 추출 효과가 비교적 차한 문제를 해결하려 한다.
제1 측면에 있어서, 본 개시의 실시예는 이벤트 아규먼트 추출 방법을 제공하며, 상기 방법은:
추출될 이벤트 내용을 획득하는 단계; 및
훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계; 를 포함하며,
그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.
본 개시의 실시예의 이벤트 아규먼트 추출 방법에서, 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하기 위한 훈련된 이벤트 아규먼트 추출 모델은, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 토대로 프리 트레이닝 모델에 대해 훈련하여 획득되며, 즉 훈련된 이벤트 아규먼트 추출 모델은 두번의 훈련을 통해 획득되며, 또한 두번의 훈련 과정에서 상이한 데이터를 통해 훈련을 진행하고, 즉 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련을 진행하여 중간 추출 모델을 획득하여, 중간 추출 모델로 하여금 이벤트 뉴스 샘플과 관련되는 분야의 지식을 학습하도록 하고, 및 독서 이해 데이터와 관련되는 지식을 학습하도록 하며, 그리고, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 다시 훈련을 진행하여 획득된다. 이로서, 획득한 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킬 수 있고, 따라서, 아규먼트 추출 효과를 향상시킬 수 있다.
선택적으로, 상기 훈련된 이벤트 아규먼트 추출 모델은:
상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및
상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식을 통해 획득된다.
상술한 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하고, 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하는 것을 통해, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시키고, 따라서 아규먼트 추출의 효과를 향상시킨다.
선택적으로, 상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:
상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;
상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것; 을 포함한다.
즉 본 개시의 실시예에서, 이벤트 뉴스 샘플을 통해 프리 트레이닝 모델에 입력하여, 연산하는 것은 적어도 하나의 제1 손실 함수의 제1 손실 값이고, 적어도 하나의 제1 손실 값을 획득하며, 독서 이해 데이터를 통해 프리 트레이닝 모델을 입력하여, 연산하는 것은 제2 손실 함수의 제2 손실 값이다. 그리고 총 손실 값을 획득하고, 총 손실 값을 통해 모델 훈련을 진행하여, 중간 추출 모델을 획득하며, 중간 추출 모델의 성능을 향상시킬 수 있다.
선택적으로, 상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것; 을 포함한다.
본 개시의 실시예에서, 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하는 기초상에서, 포맷 전환 후 획득된 뉴스 문답 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하고, 이로서, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시키고, 따라서 아규먼트 추출의 효과를 향상시킨다.
선택적으로, 상기 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계는:
상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축하는 단계; 및
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계; 를 포함한다.
본 개시의 실시예에서, 이벤트 아규먼트 추출 모델을 입력하는 추출될 문답 데이터는 상기 추출될 이벤트 내용의 이벤트 묘사 문장, 상기 추출될 이벤트 내용의 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 포함하며, 포맷이 독서 이해 데이터의 포맷과 매칭되는 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하고, 이벤트 아규먼트 추출 모델은 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해 훈련을 진행하여 획득되며, 따라서 이벤트 아규먼트 추출 효과를 향상시킨다.
선택적으로, 상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계는:
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 단계를 포함한다.
이로서, 아규먼트 추출 과정에서, 훈련된 이벤트 아규먼트 추출 모델을 통해 입력된 추출될 문답 데이터 중의 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 아규먼트를 추출하고, 추출될 이벤트 내용의 타겟 아규먼트를 획득할 수 있으며, 추출 효과를 향상시킨다.
제2 측면에 있어서, 본 개시의 실시예는 이벤트 아규먼트 추출 장치를 제공하며, 상기 장치는:
추출될 이벤트 내용을 획득하기 위한 제1 획득 모듈; 및
훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하기 위한 추출 모듈; 을 포함하며,
그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.
선택적으로, 상기 훈련된 이벤트 아규먼트 추출 모델은:
상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및
상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식을 통해 획득된다.
선택적으로, 상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:
상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;
상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것; 을 포함한다.
선택적으로, 상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것; 을 포함한다.
선택적으로, 상기 추출 모듈은:
상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 구축 모듈로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되고, 상기 추출될 문답 데이터는 상기 추출될 이벤트 내용의 이벤트 묘사 문장, 상기 추출될 이벤트 내용의 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 포함하는 것인, 구축 모듈; 및
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하기 위한 아규먼트 추출 모듈; 을 포함한다.
선택적으로, 상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 것은:
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 것; 을 포함한다.
제3 측면에 있어서, 본 개시의 실시예는 전자 기기를 더 제공하며, 상기 전자 기기는:
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결되는 메모리; 를 포함하며,
그 중, 상기 메모리에 상기 적어도 하나의 프로세서에 의해 실행가능한 명령이 저장되어 있으며, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서로 하여금 본 개시의 각 실시예에서 제공하는 방법을 실행할 수 있도록 한다.
제4 측면에 있어서, 본 개시의 실시예는 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체를 제공하고, 상기 컴퓨터 명령은 상기 컴퓨터로 하여금 본 개시의 각 실시예에서 제공하는 방법을 실행할 수 있도록 한다.
도면들은 해당 기술방안의 이해를 돕기 위한 것이지, 본 개시에 대한 한정을 구성하지 않는다.
도 1은 본 개시에서 제공하는 일 실시예에 따른 이벤트 아규먼트 추출 방법의 흐름 예시도이다.
도 2는 본 개시에서 제공하는 일 실시예에 따른 이벤트 아규먼트 추출 방법의 원리도이다.
도 3은 본 개시에서 제공하는 일 실시예에 따른 이벤트 아규먼트 추출 장치의 구조도이다.
도 4는 본 개시의 실시예에 따른 이벤트 아규먼트 추출 방법을 실현하는 전자 기기 블록도이다.
이하, 본 개시의 실시예에서의 도면을 결부시켜, 본 개시의 실시예에 따른 기술방안을 명확하고 완전하게 설명하기로 한다. 그 중에는 이해를 돕기 위한 본 개시의 실시예의 각종 디테일도 포함되어 있으며, 전술한 실시예들은 단지 예시적인 것이며, 해당 기술분야에서 통상의 지식을 가진 자들은 본 개시의 실시예에 대해 본 개시의 정신 및 특허청구범위를 일탈하지 않고 다양한 개변 및 변형을 진행할 수 있다. 간단 명료하게 설명하기 위해, 아래에서는 해당 기술분야에 공지된 기능 및 구조에 대해 진일보하여 기술하지 않기로 한다.
도 1에서 도시하다 시피, 본 개시의 실시예는 전자 기기에 응용될 수 있는 이벤트 아규먼트 추출 방법을 제공하며, 상기 방법은 하기의 단계를 포함한다.
단계 S101: 추출될 이벤트 내용을 획득한다.
이벤트 내용은 이벤트 뉴스(예컨대, 뉴스 타이틀, 뉴스 텍스트 등) 등을 포함할 수 있음을 이해할 수 있으며, 추출될 이벤트 내용은 즉 추출될 이벤트 뉴스를 포함하고, 후속으로 추출될 이벤트 내용에 대해 아규먼트 추출을 진행한다. 상기 추출될 이벤트 내용은 실제 애플리케이션 영역의 이벤트 중에서 획득할 수 있고, 추출될 이벤트 내용은 타겟 영역과 관련되며, 즉 추출될 내용은 타겟 영역에 대응되는 이벤트 내용이다. 예컨대, 금융 영역에 있어서, 금융 영역의 추출될 이벤트 내용에 대해 획득을 진행하고, 후속으로 아규먼트 추출을 진행한다. 예를 더 들면, 인터넷 기술 영역에 있어서, 인터넷 기술 영역의 이벤트 뉴스 중에서 추출될 이벤트 뉴스를 획득하고, 후속으로 아규먼트 추출을 진행한다.
단계 S102: 훈련된 이벤트 아규먼트 추출 모델을 토대로 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 추출될 이벤트 내용의 타겟 아규먼트를 획득하며;
그 중, 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.
미리 훈련을 통해 훈련된 이벤트 아규먼트 추출 모델을 획득하고, 추출될 이벤트 내용을 획득한 후, 훈련된 이벤트 아규먼트 추출 모델을 이용하여 추출될 이벤트 내용의 아규먼트를 추출하여, 타겟 아규먼트를 확정한다. 본 개시의 실시예에서, 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터, 이벤트 뉴스 샘플 및 독서 이해 데이터를 토대로 훈련하여 획득되고, 그 중, 이벤트 뉴스 라벨링 데이터는 이벤트 아규먼트 라벨링 데이터로 이해할 수 있으나, 이벤트 뉴스를 포함하지 않고, 또한 이벤트 뉴스 중 아규먼트는 이미 라벨링 되어 있으며, 아규먼트 라벨링 데이터를 더 포함하고, 이벤트 뉴스 샘플은 뉴스 텍스트로 이해할 수 있으며, 실제 애플리케이션 영역 중의 이벤트 뉴스 샘플일 수 있는바, 예컨대, 실제 애플리케이션 영역 중의 실시간 뉴스일 수 있고, 독서 이해 데이터의 포맷은 묘사 문장, 문답 및 물음에 대응되는 응답(즉 아규먼트) 이 세가지 요소로 구성되고, 즉 독서 이해 데이터는 독서 묘사 문장(묘사 문장 요소에 대응되는 내용은, 독서 이해 데이터의 독서 텍스트로 이해할 수 있음), 독서 물음(물음 요소에 대응되는 내용) 및 독서 물음에 대응되는 응답(독서 응답으로 이해할 수 있고, 대응되는 독서 묘사 문장 중에서, 응답 요소에 대응되는 내용임)으로 이해할 수 있으며, 문답식 데이터로 이해할 수 있다. 독서 이해 데이터 중의 독서 묘사 문장들은 현재 고유한 서적, 문헌 및 논문 등 데이터 중에서 획득할 수 있다. 본 개시의 실시예에서, 먼저 이벤트 뉴스 샘플(이벤트 뉴스 텍스트 샘플로 이해할 수 있음) 및 독서 이해 데이터를 이용하여 프리 트레이닝 모델에 대해 훈련을 진행하여 중간 추출 모델을 획득하고, 그 다음, 이벤트 뉴스 라벨링 데이터를 이용하여 중간 추출 모델에 대해 훈련을 진행하며, 이로서 훈련된 이벤트 아규먼트 추출 모델을 획득한다. 하나의 실시예에서, 상술한 프리 트레이닝 모델은 프리 트레이닝 언어 모델을 의미하고, 프리 트레이닝 언어 모델은 이미 데이터 세트(본 개시의 실시예에서 훈련에 사용되는 데이터와 상이함)를 이용하여 훈련된 언어 모델로 이해할 수 있다. 본 개시의 실시예에서, 이벤트 뉴스 라벨링 데이터, 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킨다.
본 개시의 실시예의 이벤트 아규먼트 추출 방법에서, 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하기 위한 훈련된 이벤트 아규먼트 추출 모델은, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득되며, 즉 훈련된 이벤트 아규먼트 추출 모델은 두번의 훈련을 통해 획득되고, 그리고, 두번의 훈련 과정에서 상이한 데이터를 통해 훈련을 진행하며, 즉 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 중간 추출 모델을 획득하여, 중간 추출 모델로 하여금 이벤트 뉴스 샘플과 관련되는 분야의 지식을 학습하도록 하고, 및 독서 이해 데이터와 관련되는 지식을 학습하도록 하며, 그리고, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 다시 훈련을 진행하여 획득된다. 이로서, 획득한 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킬 수 있고, 따라서, 아규먼트 추출 효과를 향상시킬 수 있다.
하나의 실시예에서, 훈련된 이벤트 아규먼트 추출 모델은:
이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하며;
이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식; 을 통해 획득된다.
프리 트레이닝 모델 훈련 과정에서, 복수 개의 손실 함수가 있는 것에 관련될 수 있으며, 상이한 프리 트레이닝 모델에 대응되는 손실 함수는 상이할 수 있고, 구체적으로 제1 손실 함수가 상이한 것일 수 있다. 본 개시의 실시예에서, 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수를 통해 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하고, 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수를 이용하여 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하며, 즉, 모델 훈련 과정에서, 세가지 타입의 손실 함수에 관한 것으로, 제1 손실 함수의 수량은 적어도 하나일 수 있고, 또한 복수 개일 수도 있다.
상술한 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하고, 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하는 것을 통해, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시키고, 따라서 아규먼트 추출의 효과를 향상시킨다.
하나의 실시예에서, 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하는 방식은:
이벤트 뉴스 샘플을 상기 트레이닝 모델에 입력하고, 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
독서 이해 데이터를 프리 트레이닝 모델에 입력하고, 제2 손실 함수의 제2 손실 값을 연산하는 것;
적어도 하나의 제1 손실 값과 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
총 손실 값에 따라, 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하는 것; 을 포함한다.
즉 본 개시의 실시예에서, 이벤트 뉴스 샘플을 통해 프리 트레이닝 모델에 입력하여, 연산하는 것은 적어도 하나의 제1 손실 함수의 제1 손실 값이고, 적어도 하나의 제1 손실 값을 획득하며, 독서 이해 데이터를 통해 프리 트레이닝 모델을 입력하여, 연산하는 것은 제2 손실 함수의 제2 손실 값이다. 그리고 총 손실 값(적어도 하나의 제1 손실 값의 합과 제2 손실 값의 합)을 획득하고, 총 손실 값을 통해 모델 훈련을 진행하여, 중간 추출 모델을 획득하며, 중간 추출 모델의 성능을 향상시킬 수 있다. 이해할 수 있는 것은, 이벤트 뉴스 샘플 및 독서 이해 데이터의 끊임없는 입력에 따라, 제1 손실 값과 제2 손실 값은 끊임없이 업데이트되고, 총 손실 값도 끊임없이 업데이트되며, 이로서 총 손실 값에 따라, 그래디언트 하강 및 역방향 전파를 통해, 모델 파라미터를 반복적으로 업데이트하여, 수렴 모델, 즉 중간 추출 모델을 획득한다.
하나의 실시예에서, 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
독서 이해 데이터의 포맷에 따라, 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
뉴스 문답 데이터 및 제3 손실 함수에 따라, 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것; 을 포함한다.
위에서 기술된 바와 같이, 독서 이해 데이터의 포맷은 묘사 문장, 문답 및 응답 이 세가지 요소를 포함하고, 즉 문답 포맷이며, 독서 이해 데이터 중 독서 문답의 응답은 독서 물음에 따라 대응되는 묘사 문장에서 획득한다. 이벤트 뉴스 라벨링 데이터에 대해 독서 이해 데이터의 문답 포맷에 따라 포맷 전환을 진행할 수 있고, 즉 이벤트 뉴스 라벨링 데이터를 문답 포맷인 뉴스 문답 데이터로 전환하며, 뉴스 문답 데이터 중의 응답 요소의 내용은 이벤트 뉴스 라벨링 데이터 중 라벨링된 아규먼트이고, 이벤트 뉴스 라벨링 데이터 중 이벤트 뉴스는 묘사 문장 요소의 내용에 대응한다. 그리고, 이벤트 뉴스 라벨링 데이터 중 이벤트 타입 및 이벤트 타입의 각 아규먼트 역할에 따라 물음을 구축하며, 그 중, 각각의 이벤트 타입에 대응되는 아규먼트 역할은 미리 확정한 것이며, 이벤트 뉴스 라벨링 데이터의 이벤트 타입은 다양한 방식을 통해 확정할 수 있고, 본 개시의 실시예는 이에 대해 한정하지 않으며, 예컨대, 이미 존재하는 이벤트 타입 분류 모델을 통해 이벤트 뉴스 라벨링 데이터에 대해 이벤트 타입을 예측하여 획득할 수 있다.
본 개시의 실시예에서, 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하는 기초상에서, 포맷 전환 후 획득된 뉴스 문답 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하고, 이로서, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시키고, 따라서 아규먼트 추출의 효과를 향상시킨다.
하나의 실시예에서, 상기 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계는:
상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축하는 단계; 및 상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계; 를 포함한다.
추출될 이벤트 내용을 획득한 후, 독서 이해 데이터의 포맷에 따라 추출될 이벤트 뉴스의 포맷에 대해 전환을 진행하여, 상기 추출될 이벤트 뉴스의 추출될 문답 데이터를 획득하고, 추출될 문답 데이터의 포맷과 독서 이해 데이터의 포맷은 매칭된다. 그리고, 상기 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여 추출될 이벤트 내용의 타겟 아규먼트를 획득한다.
본 개시의 실시예에서, 포맷이 독서 이해 데이터의 포맷과 매칭되는 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하고, 이벤트 아규먼트 추출 모델은 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해 훈련을 진행하여 획득되며, 따라서 이벤트 아규먼트 추출 효과를 향상시킨다.
하나의 예시적인 실시예에서, 추출될 문답 데이터의 포맷은 상술한 독서 이해 데이터의 포맷 중 3개의 요소중의 2개의 요소를 포함하며, 즉 묘사 문장 및 물음 요소를 포함하며, 이로서, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭되는 것으로 알 수 있다.
하나의 실시예에서, 상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계는: 훈련된 이벤트 타입 분류 모델을 통해 추출될 이벤트 내용의 이벤트 타입을 예측하는 단계; 훈련된 이벤트 문장 판별 모델을 통해 추출될 이벤트 내용의 이벤트 묘사 문장을 예측하는 단계; 이벤트 타입, 이벤트 묘사 문장, 이벤트 타입에 대응되는 아규먼트 역할 및 독서 이해 데이터의 포맷을 토대로, 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계; 를 포함하며, 그 중, 추출될 문답 데이터는 추출될 이벤트 내용의 이벤트 묘사 문장, 추출될 이벤트 내용의 이벤트 타입 및 이벤트 타입에 대응되는 아규먼트 역할을 포함한다.
추출될 이벤트 내용을 획득한 후, 훈련된 이벤트 타입 분류 모델을 통해 이벤트 타입을 예측하여 획득하고, 및 훈련된 이벤트 문장 판별 모델을 통해 추출될 이벤트 뉴스의 이벤트 묘사 문장을 판별하여, 추출될 이벤트 뉴스의 이벤트 묘사 문장, 이벤트 타입 및 해당 이벤트 타입에 대응되는 아규먼트 역할을 사용하고, 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 뉴스의 추출될 문답 데이터를 구축하며, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭된다. 그리고, 상기 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여 추출될 이벤트 내용의 타겟 아규먼트를 획득한다.
본 개시의 실시예에서, 이벤트 아규먼트 추출 모델로 입력하는 추출될 문답 데이터는 상기 추출될 이벤트 내용의 이벤트 묘사 문장, 상기 추출될 이벤트 내용의 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 포함하며, 또한 포맷과 독서 이해 데이터의 포맷이 매칭되는 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하는데, 이벤트 아규먼트 추출 모델은 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해 훈련을 진행하여 획득되며, 따라서 이벤트 아규먼트 추출 효과를 향상시킨다.
위에서 기술한 바와 같이, 추출될 문답 데이터의 포맷은 상술한 독서 이해 데이터의 포맷 중 3개의 요소중의 2개의 요소를 포함하며, 즉 묘사 문장 및 물음 요소를 포함하며, 이로서, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭되는 것으로 알 수 있다. 하나의 예시적인 실시예에서, 추출될 이벤트 뉴스 중의 이벤트 묘사 문장은 묘사 문장 요소의 내용에 대응되고, 즉 추출될 문답 데이터는 추출될 이벤트 뉴스 중의 이벤트 묘사 문장 및 물음 요소(추출될 문답 데이터에서 물음 요소의 내용은 예측하여 획득한 추출될 이벤트 뉴스의 이벤트 타입 및 추출될 이벤트 뉴스의 이벤트 타입에 대응되는 아규먼트 역할을 포함함)의 내용을 포함한다.
하나의 실시예에서, 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 타겟 아규먼트를 획득하는 단계는: 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 훈련된 이벤트 아규먼트 추출 모델을 통해 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 타겟 아규먼트를 예측하여 획득하는 단계를 포함한다.
즉 상기 추출될 문답 데이터를 훈련된 이벤트 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델은 상기 추출될 문답 데이터의 이벤트 묘사 문장으로부터 상기 추출될 문답 데이터 중 물음의 응답을 예측하며, 즉 상기 추출될 문답 데이터의 이벤트 묘사 문장 중에서 상기 추출될 문답 데이터 중 물음 요소 내용에 대응되는 응답을 예측하여, 추출될 이벤트 내용의 타겟 아규먼트로한다. 이로서, 아규먼트 추출 과정에서, 훈련된 이벤트 아규먼트 추출 모델은 입력된 추출될 문답 데이터 중의 추출될 이벤트 내용의 이벤트 묘사 문장중에서 아규먼트를 추출하는 것을 통해, 추출될 이벤트 내용의 타겟 아규먼트를 획득할 수 있고, 추출 효과를 향상시킨다.
아래에서는, 하나의 구체적인 실시예로부터 상술한 이벤트 아규먼트 추출 방법의 과정에 대해 구체적으로 추가 설명하려 한다.
도 2에서 도시하다 시피, 도 2 는 상술한 이벤트 아규먼트 추출 방법을 구현하기 위한 시스템 원리도이고, 상기 시스템은 데이터 준비 모듈, 이벤트 아규먼트 추출 모델 오프라인 훈련 모듈 및 이벤트 아규먼트 추출 서비스 모듈을 포함한다.
먼저, 데이터 준비 모듈은, 이벤트 뉴스 샘플, 독서 이해 데이터 및 이벤트 뉴스 라벨링 데이터의 수집을 진행할 수 있다. 현재 이벤트 그래프 프로젝트에는 이벤트 검출 시스템이 있는데, 이는 컨텐츠 스트림으로부터 이벤트 뉴스 샘플을 마이닝하기 위한 것이다. 독서 이해 데이터는, 오픈 소스의 중문 독서 이해 데이터 세트 DuReader 및 영문 데이터 세트 SQUAD 중에서 획득할 수 있다. 독서 이해 데이터의 문답 포맷에 따라 이벤트 뉴스 아규먼트 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득한다. 뉴스 아규먼트 라벨링 데이터의 뉴스 내용은 뉴스 아규먼트 라벨링 데이터의 이벤트 묘사 문장이고, 즉 묘사 문장 요소의 내용이며, 이벤트 타입과 각 아규먼트 역할에 의해 각각 물음을 구축하고, 상기 아규먼트 역할에 대응되는 아규먼트는 응답이며, 독서 이해 데이터의 문답 포맷인 뉴스 문답 데이터를 형성한다. 예를 들면: 묘사 문장의 내용은 "웨윈펑은 엽기적인 큰 얼굴 사진을 올려 많은 눈길을 끌었는데, 와이프의 한마디에 현장은 아수라장"이라면, 물음의 내용은 "사진을 올려 사진 내용"이고, 응답의 내용은 "엽기적인 큰 얼굴 사진"이다. 그 중, "사진을 올려"는 이벤트 타입이고, "사진 내용"은 상기 이벤트 타입의 하나의 아규먼트 역할이며, 이벤트 타입에 대응되는 아규먼트 역할은 미리 확정된 것이고, 이벤트 타입을 확정한 후, 대응되는 아규먼트 역할을 확정할 수 있으며, 물음의 내용은 이벤트 타입 및 이벤트 타입에 대응되는 아규먼트 역할을 포함함을 이해할 수 있다.
그리고, 이벤트 아규먼트 추출 모델 오프라인 모델 훈련 모듈이다. 여기서 프리 트레이닝 모델은 딥(Deep) 프리 트레이닝 모델이며, 딥 프리 트레이닝 모델은 BERT인 것으로 예를 든다. 딥 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플을 사용하여 딥 프리 트레이닝 모델을 입력하여, 마스크 언어 모델(masked LM) 손실 함수 및 넥스트 문장 예측(Next Sentence Predicton) 손실 함수를 연산하고, 즉 적어도 하나의 제1 손실 함수는 마스크 언어 모델 손실 함수 값 및 넥스트 문장 예측 손실 함수를 포함하며, 마스크 언어 모델 손실 함수의 손실 값 및 넥스트 문장 예측 손실 함수의 손실 값을 획득하며, 즉 적어도 하나의 제1 손실 함수의 손실 값을 획득한 후, 마스크 언어 모델 손실 함수의 손실 값 및 넥스트 문장 예측 손실 함수의 손실 값의 총합을 구하여, Loss_KD 손실 값을 획득한다. 독서 이해 데이터(예컨대, DuReader)를 사용하여 딥 프리 트레이닝 모델에 입력하여, 모델이 독서 이해 데이터의 예측 응답과 독서 이해 데이터 중 표준 응답(즉 독서 데이터 중 독서 응답) 사이의 손실 값 Loss_MRC(즉 제2 손실 함수와 딥 프리 트레이닝 모델이 독서 이해 데이터에 대한 예측 응답과 독서 이해 데이터 중 표준 응답은 관련됨을 이해할 수 있음)을 연산하고, 즉 제2 손실 값이다. 총 손실은 Loss=Loss_KD+Loss_MRC이다. 총 손실 값을 이용하여, 그래디언트 하강 및 역방향 전파를 통해, 모델 파라미터를 반복적으로 업데이트하여, 수렴된 훈련 모델, 즉 중간 추출 모델을 획득한다. 이벤트 아규먼트 라벨링 데이터 포맷을 전환한 후의 뉴스 문답 데이터를 통해 중간 추출 모델에 대해 미세하게 조정하여, 훈련된 아규먼트 추출 모델을 획득하고, 모델 이벤트 아규먼트 추출 능력을 향상시킨다.
다음으로, 이벤트 아규먼트 추출 서비스 모듈이다.
추출될 이벤트 뉴스(예컨대, 뉴스 타이틀, 뉴스 텍스트)를 획득하고, 즉 상술한 추출될 이벤트 내용이며, 이미 고유한 이벤트 타입 분류 모델(즉 훈련된 이벤트 타입 분류 모델)을 통해 이벤트 타입을 예측하여 획득하고, 및 이미 고유한 이벤트 문장 판별 모델(즉 훈련된 이벤트 문장 판별 모델)을 통해 추출될 이벤트 뉴스의 이벤트 묘사 문장을 획득하며, 추출될 이벤트 뉴스의 이벤트 묘사 문장, 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 사용하여, 또한 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 뉴스의 추출될 문답 데이터를 구축하고, 추출될 문답 데이터의 포맷과 독서 이해 데이터의 포맷은 매칭되며, 추출도리 문답 데이터의 포맷은 상술한 독서 이해 데이터의 포맷 중 3개의 요소중의 2개의 요소를 포함하며, 즉 묘사 문장 및 물음 요소를 포함하며, 이로서, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭되는 것으로 알 수 있다. 그 중, 추출될 이벤트 뉴스 중의 이벤트 묘사 문장은 묘사 문장 요소의 내용에 대응되고, 즉 추출될 문답 데이터는 추출될 이벤트 뉴스 중의 이벤트 묘사 문장 및 물음 요소의 내용(추출될 문답 데이터에서 물음 요소의 내용은 예측하여 획득한 추출될 이벤트 뉴스의 이벤트 타입 및 추출될 이벤트 뉴스의 이벤트 타입에 대응되는 아규먼트 역할을 포함함)을 포함한다. 상기 추출될 문답 데이터를 훈련된 이벤트 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델은 이벤트 묘사 문장에서 상기 추출될 문답 데이터 중 물음의 응답을 예측하여, 추출될 이벤트 뉴스의 타겟 아규먼트로 한다.
본 개시는 추출될 이벤트 뉴스의 문답 포맷인 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하며, 또한 딥 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해, 따라서 이벤트 아규먼트 추출 효과를 향상시키고, 현실 시나리오에서 비교적 바람직한 추출 효과를 획득한다.
이벤트 아규먼트 추출은 이벤트 그래프 프로젝트에서 중요한 응용을 가지는데, 이벤트 아규먼트 추출을 통해, 구조화된 형태로 이벤트를 나 나타내고 표현함으로서, 빅 검색 및 Feed 이벤트 맥리어에서 이벤트를 디스플레이하여, 사용자의 신속한 이해를 돕는다. 그리고, 이벤트 아규먼트 추출은 각 분야에 응용될 수 있는바, 예컨대, 금융 분야, 회사의 이벤트를 통해 추출을 진행하여, 효율적인 위험 제어 등을 진행할 수 있다.
도 3 을 참조하면, 도 3은 본 개시의 실시예에서 제공하는 전자 기기에 응용되는 이벤트 아규먼트 추출 장치(300)이며, 상기 장치(300)는:
추출될 이벤트 내용을 획득하기 위한 제1 획득 모듈(301); 및
훈련된 이벤트 아규먼트 추출 모델을 토대로 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 추출될 이벤트 내용의 타겟 아규먼트를 획득하기 위한 추출 모듈(302); 을 포함하며,
그 중, 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.
하나의 실시예에서, 훈련된 이벤트 아규먼트 추출 모델은:
이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및
이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식; 을 통해 획득된다.
하나의 실시예에서, 상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:
상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;
상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것; 을 포함한다.
하나의 실시예에서, 상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것; 을 포함한다.
하나의 실시예에서, 추출 모듈은:
상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 구축 모듈로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축 모듈; 및
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하기 위한 아규먼트 추출 모듈; 을 포함한다.
하나의 실시예에서, 구축 모듈은:
훈련된 이벤트 타입 분류 모델을 통해 추출될 이벤트 내용의 이벤트 타입을 예측하기 위한 제1 예측 모듈;
훈련된 이벤트 문장 판별 모듈을 통해 추출될 이벤트 내용의 이벤트 묘사 문장을 예측하기 위한 제2 예측 모듈;
이벤트 타입, 이벤트 묘사 문장, 이벤트 타입에 대응되는 아규먼트 역할 및 독서 이해 데이터의 포맷을 토대로, 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 제1 구축 서브 모듈; 을 포함하며, 그 중, 추출될 문답 데이터는 추출될 이벤트 내용의 이벤트 묘사 문장, 추출될 이벤트 내용의 이벤트 타입 및 이벤트 타입에 대응되는 아규먼트 역할을 포함한다.
하나의 실시예에서, 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 타겟 아규먼트를 획득하는 것은:
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 것을 포함한다.
상술한 각 실시예의 이벤트 아규먼트 추출 장치는 상술한 각각의 실시예에 따른 이벤트 아규먼트 추출 방법을 구현하기 위한 장치이고, 기술 특징은 대응되고, 기술 효과는 대응되며, 여기서 더 이상 상세하게 기술하지 않기로 한다.
본 개시의 실시예에 있어서, 본 개시의 실시예는 전자 기기 및 판독 가능 저장 매체를 더 제공한다.
도 4에서 도시하다 시피, 도 4는 본 개시의 실시예에 따른 이벤트 아규먼트 추출 방법의 전자 기기의 블록도이다. 전자 기기는 예하면 랩탑 컴퓨터, 데스크톱 컴퓨터, 워킹 테이블, 개인용 디지털 보조기, 서버, 블레이드 서버, 대형 컴퓨터, 및 기타 적합한 컴퓨터와 같이 다양한 형태의 디지털 컴퓨터를 나타낸다. 전자 기기는 또한 다양한 형태의 이동 장치를 나타낼 수 있으며, 예컨대, 개인용 디지털 처리, 셀룰러 휴대폰, 스마트 휴대폰, 웨어러블 기기 및 기타 유사한 컴퓨팅 장치이다. 본문에서 나타내는 컴포넌트, 그들의 연결 및 관계, 및 그들의 기능은 단지 예시적인 것이지, 본 명세서에 설명된 및/또는 요구하는 본 개시의 구현을 제한하기 위함이 아님은 자명한 것이다.
도 4에서 도시하다 시피, 상기 전자 기기는: 하나 또는 복수 개의 프로세서(401), 메모리(402), 및 각 컴포넌트들을 연결하기 위한 인터페이스를 포함하고, 고속 인터페이스 및 저속 인터페이스를 포함한다. 각 컴포넌트들은 상이한 버스를 이용하여 서로 연결되고, 코먼 메인 플레이트 상에 설치되거나 또는 수요에 따라 기타 방식으로 설치될 수 있다. 프로세서는 전자 기기내에서 수행하는 명령에 대해 처리를 진행할 수 있으며, 메모리 또는 메모리상에 저장되어 외부 입력/출력 장치(예컨대, 인터페이스에 연결되는 표시 기기)상에서 GUI의 그래픽 정보를 나타내는 이미지 정보의 명령을 포함한다. 기타 실시방식에 있어서, 필요하다면, 복수 개의 프로세서 및/또는 복수 개의 버스를 복수 개의 메모리 및 복수 개의 메모리와 함께 사용할 수 있다. 동일하게, 복수 개의 전자 기기를 연결할 수 있으며, 각 기기들은 부분적으로 필요한 조작을 제공한다(예컨대, 서버 어레이, 블레이드 서버, 또는 멀티 프로세서 시스템). 도 4에서는 하나의 프로세서(401)를 예로 들었다.
메모리(402)는 본 개시에서 제공하는 비일시적 컴퓨터 판독 가능 저장 매체이다. 그 중, 상기 메모리에 적어도 하나의 프로세서에 의해 실행되는 명령이 저장되어 있으며, 상기 적어도 하나의 프로세서로 하여금 본 개시에서 제공하는 이벤트 아규먼트 추출 방법을 수행하도록 한다. 본 개시의 비일시적 컴퓨터 판독 가능 저장 매체에 컴퓨터 명령이 저장되어 있으며, 상기 컴퓨터 명령은 컴퓨터로 하여금 본 개시에서 제공하는 이벤트 아규먼트 추출 방법을 수행하도록 하기 위한 것이다.
메모리(402)는 하나의 비일시적 컴퓨터 판독 가능 저장 매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터가 실행가능한 프로그램 및 모듈을 저장하기 위한 것이며, 예하면 본 개시의 실시예에서의 더이벤트 아규먼트 추출 방법법에 대응되는 명령/모듈(예컨대, 도 3에서 도시된 제1 획득 모듈(301), 추출 모듈(302))이다. 프로세서(401)는 메모리(402)중의 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행하는 것을 통해, 따라서 서버의 각종 기능 애플리케이션 및 데이터 처리를 수행하여, 상술한 방법 실시예에서의 이벤트 아규먼트 추출 방법을 구현한다.
메모리(402)는 프로그램 저장 영역 및 데이터 저장 영역을 포함할 수 있으며, 그 중, 프로그램 저장 영역은 작업 시스템, 적어도 하나의 기능에 필요한 애플리케이션 등을 저장할 수 있으며; 데이터 저장 영역은 전자 기기의 사용에 따라 작성된 데이터 등을 저장할 수 있다. 또한, 메모리(402)는 고속 랜덤 액세스 메모리를 포함할 수도 있고, 비일시적 메모리를 포함할 수도 있으며, 예컨대 적어도 하나의 자기 디스크 저장 디바이스, 플래시 메모리 디바이스 또는 기타 비일시적 솔리드 스테이트 저장 디바이스를 더 포함할 수 있다. 일부 실시예에서, 메모리(402)는 선택적으로 프로세서(401)에 의해 원격으로 상대적으로 설치된 메모리를 포함할 수 있으며, 이러한 원격 메모리는 네트워크를 통해 키보드에 의해 표시되는 전자 기기에 연결될 수 있다. 상술한 네트워크의 실시예는 인터넷, 기업 내부 네트워크, 로컬 영역 네트워크, 이동 통신망 및 이들의 조합을 포함할 수 있으나 이에 한정되지 않는다.
이벤트 아규먼트 추출 방법에 따른 전자 기기는: 입력 장치(403) 및 출력 장치(404)를 더 포함할 수 있다. 프로세서(401), 메모리(402), 입력 장치(403) 및 출력 장치(404)는 버스 또는 기타 방식을 통해 연결될 수 있고, 도 4에서는 버스를 통해 연결된 것으로 예를 들었다.
입력 장치(403)는 입력된 숫자 또는 문자 부호 정보를 수신하고, 키보드에 의해 표시되는 전자 기기의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 산생시킬 수 있는바. 예컨대, 입력 장치(403)는 터치 패널, 기능키, 마우스, 트랙패널, 터치 패널, 표시 로드, 하나 또는 복수 개의 마우스 버튼, 트랙볼, 조이스틱 등 입력 장치이다. 출력 장치(404)는 표시 기기, 보조 조명 장치(예컨대, LED) 및 촉각 피드백 장치(예컨대, 진동 전기) 등을 포함할 수 있다. 상기 표시 기기는 액정 디스플레이(LCD), 유기 발광 다이오드(OLED) 디스플레이 및 플라즈마 디스플레이를 포함할 수 있으나, 이에 한정되지 않는다. 표시 기기는 터치 스크린일 수 있다.
여기서 설명되는 시스템 및 기술의 각종 실시방식들은 디지털 전기 회로 시스템, 집적 회로 시스템, 전용 ASIC(전용 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합에서 구현될 수 있다. 이러한 각종 실시방식은: 하나 또는 복수 개의 컴퓨터 프로그램에서 구현하는 방식을 포함할 수 있으며, 상기 하나 또는 복수 개의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능한 프로세서를 포함하는 프로그램 시스템에서 실행 및/또는 해석될 수 있으며, 상기 프로그램 가능한 프로세서는 전용 또는 범용으로 프로그램 가능한 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 데이터 및 명령을 상기 저장 시스템, 상기 적어도 하나의 입력 장치, 및 상기 적어도 하나의 출력 장치로 전송한다.
이러한 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션, 또는 코드로도 칭할 수 있음)은 프로그램 가능한 프로세서의 기계 명령을 포함하며, 과정 및/또는 대상을 향한 프로그램 언어 및/또는 어셈블링/기계 언어를 이용하여 이러한 컴퓨팅 프로그램을 구현할 수 있다. 본문에서 사용되는 용어 “기계 판독 가능 매체” 및 “컴퓨터 판독 가능 매체”는 기계 판독 가능 신호로서 기계 명령을 수신하는 기계 판독 가능한 매체를 포함하는, 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기, 및/또는 장치(예컨대, 자기 디스크, 광 디스크, 메모리, 프로그램 가능한 로직 장치(PLD))를 의미한다. 용어 “기계 판독 가능 신호”는 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하기 위한 임의의 신호를 의미한다.
사용자와의 인터렉션을 제공하기 위해, 본 명세서에서 설명된 시스템 및 기술을 컴퓨터에서 구현할 수 있으며, 상기 컴퓨터는: 사용자에게 정보를 디스플레이하기 위한 디스플레이 장치(예컨대, CRT (칼라 음극선관) 또는 LCD(액정 디스플레이) 모니터); 및 키보드 및 포인팅 장치(예컨대, 마우스 또는 트랙볼)를 구비하고, 사용자는 상기 키보드 및 포인팅 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 기타 타입의 장치는 사용자와의 인터렉션을 제공할 수 있으며; 예컨대, 사용자에게 제공된 피드백은 임의의 형태의 센싱 피드백(예컨대, 시각적 피드백, 청각적 피드백, 또는 촉각 피드백)일 수 있으며; 그리고 임의의 형태(소리 입력, 음성 입력, 또는 촉각 입력)를 사용하여 사용자로부터의 입력을 수신할 수 있다.
여기서 설명한 시스템 및 기술을 백스테이지 컴포넌트를 포함하는 컴퓨팅 시스템(예컨대, 데이터 서버), 또는 중간 컴포넌트를 포함하는 컴퓨팅 시스템(예컨대, 애플리케이션 서버), 또는 전방 컴포넌트를 포함하는 컴퓨팅 시스템(예컨대, 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비한 사용자 컴퓨터, 사용자는 상기 그래픽 사용자 인터페이스 또는 상기 네트워크 브라우저를 통해 여기에서 설명된 시스템 및 기술의 실시방식을 인터렉션할 수 있음), 또는 이런 백스테이지 컴포넌트, 중간 컴포넌트, 또는 전방 컴포넌트의 임의의 조합을 포함하는 컴퓨팅 시스템에서 구현될 수 있다. 시스템의 컴포넌트들은 임의의 형태 또는 매체의 디지털 데이터 통신(예컨대, 통신 네트워크)에 의해 서로 연결될 수 있다. 통신 네트워크의 예는 로컬 네트워크(LAN), 광역 네트워크(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트 및 서버는 일반적으로 서로 멀리 떨어져 있고, 통상적으로 통신 네트워크를 통해 서로 인터렉션을 진행한다. 상응한 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 구비한 컴퓨터 프로그램을 통해 클라이언트와 서버의 관계가 생성된다.
본 개시의 실시예의 기술방안에 있어서, 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하기 위한 훈련된 이벤트 아규먼트 추출 모델은, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득되며, 즉 훈련된 이벤트 아규먼트 추출 모델은 두번의 훈련을 통해 획득되며, 또한 두번의 훈련 과정에서 상이한 데이터를 통해 훈련을 진행하고, 즉 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련을 진행하여 중간 추출 모델을 획득하여, 중간 추출 모델로 하여금 이벤트 뉴스 샘플과 관련되는 지식을 학습하도록 하고, 및 독서 이해 데이터와 관련되는 지식을 학습하도록 하며, 그리고, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 다시 훈련을 진행하여 획득된다. 이로서, 획득한 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킬 수 있고, 따라서, 아규먼트 추출 효과를 향상시킬 수 있다.
위에서 나타내는 다양한 형태의 절차를 사용하여, 단계를 재 정렬, 추가 또는 삭제할 수 있다는 것을 이해할 수 있다. 예컨대, 본 개시에서 기재된 각 단계는 병렬적으로 실행할 수 있고, 순차적으로 실행할 수도 있으며, 또한 상이한 순서로 실행할 수도 있으며, 단지 본 개시에 따른 공개된 기술방안이 의도한 결과를 실현할 수만 있다면, 본문에서는 이에 대해 제한하지 않는다.
상술한 구체적인 실시방식은, 본 개시의 보호 범위의 제한을 구성하지 않는다. 해당 기술분야에서 통상의 지식을 가진 자들은 본 개시의 실시예에 대해 본 개시의 정신 및 특허청구범위를 일탈하지 않고, 설계 요구 및 기타 요소에 따라, 다양한 개변, 조합, 서브 조합 및 교체를 진행할 수 있음을 이해해야 할 것이다. 본 개시의 정신 및 특허청구범위를 일탈하지 않고, 이러한 개변 및 변형은 본 개시의 청구범위 및 그와 동등한 기술 범위 내에 속하며, 본 개시에서는 이러한 개변 및 변형을 청구범위 내에 귀속 시키고자 한다.

Claims (15)

  1. 이벤트 아규먼트 추출 방법에 있어서,
    상기 방법은:
    추출될 이벤트 내용을 획득하는 단계; 및
    훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계; 를 포함하며,
    그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득되는 것인;
    것을 특징으로 하는 이벤트 아규먼트 추출 방법.
  2. 제1 항에 있어서,
    상기 훈련된 이벤트 아규먼트 추출 모델은:
    상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및
    상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식;
    을 통해 획득되는 것인 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
  3. 제2 항에 있어서,
    상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:
    상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
    상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;
    상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
    상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것;
    을 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
  4. 제2 항에 있어서,
    상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
    상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
    상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것;
    을 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
  5. 제1 항에 있어서,
    상기 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계는:
    상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축하는 단계; 및
    상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계;
    를 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
  6. 제5 항에 있어서,
    상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계는:
    상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 단계;
    를 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
  7. 이벤트 아규먼트 추출 장치에 있어서,
    상기 장치는:
    추출될 이벤트 내용을 획득하기 위한 제1 획득 모듈; 및
    훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하기 위한 추출 모듈; 을 포함하며,
    그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된 것인;
    것을 특징으로 하는 장치.
  8. 제7 항에 있어서,
    상기 훈련된 이벤트 아규먼트 추출 모델은:
    상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및
    상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식;
    을 통해 획득되는 것인 것을 특징으로 하는 장치.
  9. 제8 항에 있어서,
    상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:
    상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
    상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;
    상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
    상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것;
    을 포함하는 것을 특징으로 하는 장치.
  10. 제8 항에 있어서,
    상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
    상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
    상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것;
    을 포함하는 것을 특징으로 하는 장치.
  11. 제7 항에 있어서,
    상기 추출 모듈은:
    상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 구축 모듈로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축 모듈; 및
    상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하기 위한 아규먼트 추출 모듈;
    을 포함하는 것을 특징으로 하는 장치.
  12. 제11 항에 있어서,
    상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 것은:
    상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 것;
    을 포함하는 것을 특징으로 하는 장치.
  13. 전자 기기에 있어서,
    상기 전자 기기는:
    적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신 연결되는 메모리; 를 포함하며,
    그 중, 상기 메모리에 상기 적어도 하나의 프로세서에 의해 실행가능한 명령이 저장되어 있으며, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서로 하여금 청구항 제1 항 내지 제6 항 중 어느 한 항에 따른 방법을 실행하도록 하는 것인;
    것을 특징으로 하는 전자 기기.
  14. 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 컴퓨터 명령은 상기 컴퓨터로 하여금 청구항 제1 항 내지 제6 항 중 어느 한 항에 따른 방법을 실행하도록 하는 것인,
    것을 특징으로 하는 비일시적 컴퓨터 판독 가능 저장 매체.
  15. 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램은 적어도 하나의 프로세서에 의해 실행될 경우, 청구항 제1항 내지 제6항 중 어느 한 항에 따른 상기 방법을 구현하는 것인,
    컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020210033440A 2020-03-20 2021-03-15 이벤트 아규먼트 추출 방법, 장치 및 전자 기기 KR102653312B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010202896.7 2020-03-20
CN202010202896.7A CN111325020B (zh) 2020-03-20 2020-03-20 一种事件论元抽取方法、装置以及电子设备

Publications (2)

Publication Number Publication Date
KR20210036318A true KR20210036318A (ko) 2021-04-02
KR102653312B1 KR102653312B1 (ko) 2024-03-29

Family

ID=71173270

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210033440A KR102653312B1 (ko) 2020-03-20 2021-03-15 이벤트 아규먼트 추출 방법, 장치 및 전자 기기

Country Status (5)

Country Link
US (1) US20210200947A1 (ko)
EP (1) EP3882784A1 (ko)
JP (1) JP2021099886A (ko)
KR (1) KR102653312B1 (ko)
CN (1) CN111325020B (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392213A (zh) * 2021-04-19 2021-09-14 合肥讯飞数码科技有限公司 事件抽取方法以及电子设备、存储装置
CN113792545A (zh) * 2021-11-16 2021-12-14 成都索贝数码科技股份有限公司 一种基于深度学习的新闻事件活动名称抽取方法
CN114741516A (zh) * 2021-12-08 2022-07-12 商汤国际私人有限公司 一种事件抽取方法和装置、电子设备及存储介质
CN115062146A (zh) * 2022-06-07 2022-09-16 重庆邮电大学 基于BiLSTM结合多头注意力的中文重叠事件抽取系统

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052681A (zh) * 2020-08-20 2020-12-08 中国建设银行股份有限公司 信息抽取模型训练方法、信息抽取方法、装置及电子设备
CN112507700A (zh) * 2020-11-26 2021-03-16 北京百度网讯科技有限公司 事件抽取方法、装置、电子设备及存储介质
CN112507059B (zh) * 2020-12-07 2022-05-24 宁波深擎信息科技有限公司 金融领域舆情监控中的事件抽取方法、装置和计算机设备
CN112612885A (zh) * 2020-12-18 2021-04-06 成都三零凯天通信实业有限公司 一种基于bert类模型的阅读理解式新闻文本事件抽取方法
CN112528676B (zh) * 2020-12-18 2022-07-08 南开大学 文档级别的事件论元抽取方法
CN113032520A (zh) * 2021-02-26 2021-06-25 北京金堤征信服务有限公司 信息分析方法及装置、电子设备和计算机可读存储介质
CN112905868B (zh) * 2021-03-22 2024-08-20 京东方科技集团股份有限公司 事件抽取方法、装置、设备及存储介质
CN114254028A (zh) * 2021-12-20 2022-03-29 北京百度网讯科技有限公司 事件属性抽取方法、装置、电子设备和存储介质
CN114519344B (zh) * 2022-01-25 2024-09-10 浙江大学 一种基于论元子图提示生成与引导的篇章级多事件抽取方法
CN114676271A (zh) * 2022-03-07 2022-06-28 上海安硕企业征信服务有限公司 事件抽取方法、装置、电子设备及存储介质
CN116049345B (zh) * 2023-03-31 2023-10-10 江西财经大学 基于双向事件完全图的文档级事件联合抽取方法及系统
CN117034943B (zh) * 2023-10-09 2024-02-06 华南师范大学 论证提取以及关系识别方法、装置、设备以及存储介质
CN117093728B (zh) * 2023-10-19 2024-02-02 杭州同花顺数据开发有限公司 一种金融领域事理图谱构建方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228993A (ja) * 2013-05-21 2014-12-08 日本電信電話株式会社 情報抽出方法、情報抽出装置及び情報抽出プログラム
US20160012040A1 (en) * 2013-02-28 2016-01-14 Kabushiki Kaisha Toshiba Data processing device and script model construction method
WO2016029124A1 (en) * 2014-08-21 2016-02-25 TruthMD, LLC. System and method of matching identities among disparate physician records
US20190266435A1 (en) * 2018-02-26 2019-08-29 Abc Fintech Co., Ltd. Method and device for extracting information in histogram

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298635B (zh) * 2011-09-13 2013-09-04 苏州大学 事件信息融合方法和系统
JP6411800B2 (ja) * 2014-07-17 2018-10-24 株式会社Nttドコモ 情報管理装置、情報管理システム、及び情報管理プログラム
CN104598535B (zh) * 2014-12-29 2018-03-16 中国科学院计算机网络信息中心 一种基于最大熵的事件抽取方法
CN104834718A (zh) * 2015-05-11 2015-08-12 苏州大学 基于最大熵模型的事件论元识别方法及系统
WO2017149559A1 (en) * 2016-02-29 2017-09-08 Nec Corporation An information processing system, an information processing method and a computer readable storage medium
US20180260474A1 (en) * 2017-03-13 2018-09-13 Arizona Board Of Regents On Behalf Of The University Of Arizona Methods for extracting and assessing information from literature documents
CN110633409B (zh) * 2018-06-20 2023-06-09 上海财经大学 一种融合规则与深度学习的汽车新闻事件抽取方法
CN109582949B (zh) * 2018-09-14 2022-11-22 创新先进技术有限公司 事件元素抽取方法、装置、计算设备及存储介质
CN109635280A (zh) * 2018-11-22 2019-04-16 园宝科技(武汉)有限公司 一种基于标注的事件抽取方法
CN110135457B (zh) * 2019-04-11 2021-04-06 中国科学院计算技术研究所 基于自编码器融合文档信息的事件触发词抽取方法及系统
CN110134757B (zh) * 2019-04-19 2020-04-07 杭州电子科技大学 一种基于多头注意力机制的事件论元角色抽取方法
US11227128B2 (en) * 2019-06-07 2022-01-18 Raytheon Bbn Technologies Corp. Linguistically rich cross-lingual text event embeddings
CN110489514B (zh) * 2019-07-23 2023-05-23 成都数联铭品科技有限公司 提升事件抽取标注效率的系统及方法、事件抽取方法及系统
CN110765265B (zh) * 2019-09-06 2023-04-11 平安科技(深圳)有限公司 信息分类抽取方法、装置、计算机设备和存储介质
CN110555440B (zh) * 2019-09-10 2022-03-22 杭州橙鹰数据技术有限公司 一种事件抽取方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160012040A1 (en) * 2013-02-28 2016-01-14 Kabushiki Kaisha Toshiba Data processing device and script model construction method
JP2014228993A (ja) * 2013-05-21 2014-12-08 日本電信電話株式会社 情報抽出方法、情報抽出装置及び情報抽出プログラム
WO2016029124A1 (en) * 2014-08-21 2016-02-25 TruthMD, LLC. System and method of matching identities among disparate physician records
US20190266435A1 (en) * 2018-02-26 2019-08-29 Abc Fintech Co., Ltd. Method and device for extracting information in histogram

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Xiaozhi Wang 외 8명, 'HMEAE: Hierarchical Modular Event Argument Extraction', Proceedings of the 2019 Conference on EMNLP-IJCNLP, 2019., pp. 5777-5783. 1부.* *
Ying Zeng 외 6명, 'Scale Up Event Extraction Learning via Automatic Training Data Generation', arXiv:1712.03665v1 [cs.CL], 2017.12., pp.1-8. 1부.* *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392213A (zh) * 2021-04-19 2021-09-14 合肥讯飞数码科技有限公司 事件抽取方法以及电子设备、存储装置
CN113392213B (zh) * 2021-04-19 2024-05-31 合肥讯飞数码科技有限公司 事件抽取方法以及电子设备、存储装置
CN113792545A (zh) * 2021-11-16 2021-12-14 成都索贝数码科技股份有限公司 一种基于深度学习的新闻事件活动名称抽取方法
CN113792545B (zh) * 2021-11-16 2022-03-04 成都索贝数码科技股份有限公司 一种基于深度学习的新闻事件活动名称抽取方法
CN114741516A (zh) * 2021-12-08 2022-07-12 商汤国际私人有限公司 一种事件抽取方法和装置、电子设备及存储介质
CN115062146A (zh) * 2022-06-07 2022-09-16 重庆邮电大学 基于BiLSTM结合多头注意力的中文重叠事件抽取系统

Also Published As

Publication number Publication date
JP2021099886A (ja) 2021-07-01
US20210200947A1 (en) 2021-07-01
KR102653312B1 (ko) 2024-03-29
CN111325020A (zh) 2020-06-23
EP3882784A1 (en) 2021-09-22
CN111325020B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
KR20210036318A (ko) 이벤트 아규먼트 추출 방법, 장치 및 전자 기기
KR102677454B1 (ko) 이벤트 아규먼트 추출 방법, 장치, 및 전자 기기
KR102484617B1 (ko) 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램
US9870346B2 (en) Clickable links within live collaborative web meetings
US11403468B2 (en) Method and apparatus for generating vector representation of text, and related computer device
KR20210037619A (ko) 멀티 모달 콘텐츠 처리 방법, 장치, 기기 및 저장 매체
KR102694584B1 (ko) 이벤트 추출 방법, 이벤트 추출 장치 및 전자 기기
KR20210151728A (ko) 검색어의 추천 방법, 타겟 모델의 트레이닝 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램
EP3937060A1 (en) Method and apparatus for training semantic representation model, device and computer storage medium
JP2022505015A (ja) 知識グラフのベクトル表現生成方法、装置及び電子機器
US11423907B2 (en) Virtual object image display method and apparatus, electronic device and storage medium
JP2021192290A (ja) 機械翻訳モデルのトレーニング方法、装置及び電子機器
JP7247442B2 (ja) ユーザ対話における情報処理方法、装置、電子デバイス及び記憶媒体
US20210390254A1 (en) Method, Apparatus and Device for Recognizing Word Slot, and Storage Medium
US20210312264A1 (en) Method and apparatus for model distillation
EP3901905B1 (en) Method and apparatus for processing image
JP2021192289A (ja) 機械学習モデルの敵対的訓練方法、装置、電子機器及び媒体
KR20210036875A (ko) 사전훈련된 시맨틱 모델에 기반하는 모델 개량 방법, 장치, 전자 기기, 저장 매체 및 프로그램
JP2022028889A (ja) 対話生成方法、装置、電子機器及び記憶媒体
JP7256857B2 (ja) 対話処理方法、装置、電子機器及び記憶媒体
US11966562B2 (en) Generating natural languages interface from graphic user interfaces
US20210382918A1 (en) Method and apparatus for labeling data
US20210336964A1 (en) Method for identifying user, storage medium, and electronic device
CN114490968B (zh) 对话状态跟踪方法、模型训练方法、装置以及电子设备
CN113113017B (zh) 音频的处理方法和装置

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant