KR20210036318A

KR20210036318A - 이벤트 아규먼트 추출 방법, 장치 및 전자 기기

Info

Publication number: KR20210036318A
Application number: KR1020210033440A
Authority: KR
Inventors: 바왠 리; 위광 첸; 루 판; 웬전 리위; 추이윈 한; 시 스; 쟈엔 황
Original assignee: 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date: 2020-03-20
Filing date: 2021-03-15
Publication date: 2021-04-02
Also published as: JP2021099886A; US20210200947A1; KR102653312B1; CN111325020A; EP3882784A1; CN111325020B

Abstract

본 개시는 지식 그래프 기술분야에 관한 것이며, 이벤트 아규먼트 추출 방법, 장치 및 전자 기기를 제공한다. 구체적인 구현 방안은: 추출될 이벤트 내용을 획득하는 단계; 및 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계; 를 포함하며, 그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.

Description

이벤트 아규먼트 추출 방법, 장치 및 전자 기기{Method and apparatus for extracting event argument, electronic device}

본 개시는 컴퓨터 기술중의 지식 그래프(Graph) 기술분야에 관한 것으로, 특히 이벤트 아규먼트(argument) 추출 방법, 장치 및 전자 기기에 관한 것이다.

이벤트 아규먼트 추출은 이벤트 설명으로부터 이벤트의 각각의 구성 요소(시간, 로케이션, 참여자, 이벤트에 의해 적절하게 배치된 관련 내용 등)를 추출하는 것을 의미하고, 요소는 아규먼트이며, 각각의 아규먼트에 대응하는 하나의 아규먼트 역할은, 최종적으로 구조화된 지식의 형태로 사용자에게 표시된다.

현재, 통상적으로 채용되는 이벤트 아규먼트 추출 모델은 분류 사로를 기초로 한 것인데, 그러나, 상이한 이벤트 타입의 이벤트 아규먼트 역할은 상이하며, 간단한 분류 모델은 유효하게 아규먼트 식별을 진행할 수 없으며, 즉 이벤트 아규먼트 추출 효과가 비교적 차하다.

본 개시는 이벤트 아규먼트 추출 방법, 장치 및 전자 기기를 제공하여, 이벤트 아규먼트 추출 효과가 비교적 차한 문제를 해결하려 한다.

제1 측면에 있어서, 본 개시의 실시예는 이벤트 아규먼트 추출 방법을 제공하며, 상기 방법은:

추출될 이벤트 내용을 획득하는 단계; 및

훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계; 를 포함하며,

그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.

본 개시의 실시예의 이벤트 아규먼트 추출 방법에서, 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하기 위한 훈련된 이벤트 아규먼트 추출 모델은, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 토대로 프리 트레이닝 모델에 대해 훈련하여 획득되며, 즉 훈련된 이벤트 아규먼트 추출 모델은 두번의 훈련을 통해 획득되며, 또한 두번의 훈련 과정에서 상이한 데이터를 통해 훈련을 진행하고, 즉 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련을 진행하여 중간 추출 모델을 획득하여, 중간 추출 모델로 하여금 이벤트 뉴스 샘플과 관련되는 분야의 지식을 학습하도록 하고, 및 독서 이해 데이터와 관련되는 지식을 학습하도록 하며, 그리고, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 다시 훈련을 진행하여 획득된다. 이로서, 획득한 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킬 수 있고, 따라서, 아규먼트 추출 효과를 향상시킬 수 있다.

선택적으로, 상기 훈련된 이벤트 아규먼트 추출 모델은:

상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및

상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식을 통해 획득된다.

상술한 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하고, 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하는 것을 통해, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시키고, 따라서 아규먼트 추출의 효과를 향상시킨다.

선택적으로, 상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:

상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;

상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;

상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및

상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것; 을 포함한다.

즉 본 개시의 실시예에서, 이벤트 뉴스 샘플을 통해 프리 트레이닝 모델에 입력하여, 연산하는 것은 적어도 하나의 제1 손실 함수의 제1 손실 값이고, 적어도 하나의 제1 손실 값을 획득하며, 독서 이해 데이터를 통해 프리 트레이닝 모델을 입력하여, 연산하는 것은 제2 손실 함수의 제2 손실 값이다. 그리고 총 손실 값을 획득하고, 총 손실 값을 통해 모델 훈련을 진행하여, 중간 추출 모델을 획득하며, 중간 추출 모델의 성능을 향상시킬 수 있다.

선택적으로, 상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:

상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및

상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것; 을 포함한다.

본 개시의 실시예에서, 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하는 기초상에서, 포맷 전환 후 획득된 뉴스 문답 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하고, 이로서, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시키고, 따라서 아규먼트 추출의 효과를 향상시킨다.

선택적으로, 상기 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계는:

상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축하는 단계; 및

상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계; 를 포함한다.

본 개시의 실시예에서, 이벤트 아규먼트 추출 모델을 입력하는 추출될 문답 데이터는 상기 추출될 이벤트 내용의 이벤트 묘사 문장, 상기 추출될 이벤트 내용의 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 포함하며, 포맷이 독서 이해 데이터의 포맷과 매칭되는 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하고, 이벤트 아규먼트 추출 모델은 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해 훈련을 진행하여 획득되며, 따라서 이벤트 아규먼트 추출 효과를 향상시킨다.

선택적으로, 상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계는:

상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 단계를 포함한다.

이로서, 아규먼트 추출 과정에서, 훈련된 이벤트 아규먼트 추출 모델을 통해 입력된 추출될 문답 데이터 중의 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 아규먼트를 추출하고, 추출될 이벤트 내용의 타겟 아규먼트를 획득할 수 있으며, 추출 효과를 향상시킨다.

제2 측면에 있어서, 본 개시의 실시예는 이벤트 아규먼트 추출 장치를 제공하며, 상기 장치는:

추출될 이벤트 내용을 획득하기 위한 제1 획득 모듈; 및

훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하기 위한 추출 모듈; 을 포함하며,

선택적으로, 상기 훈련된 이벤트 아규먼트 추출 모델은:

선택적으로, 상기 추출 모듈은:

상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 구축 모듈로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되고, 상기 추출될 문답 데이터는 상기 추출될 이벤트 내용의 이벤트 묘사 문장, 상기 추출될 이벤트 내용의 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 포함하는 것인, 구축 모듈; 및

상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하기 위한 아규먼트 추출 모듈; 을 포함한다.

선택적으로, 상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 것은:

상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 것; 을 포함한다.

제3 측면에 있어서, 본 개시의 실시예는 전자 기기를 더 제공하며, 상기 전자 기기는:

적어도 하나의 프로세서; 및

상기 적어도 하나의 프로세서와 통신 연결되는 메모리; 를 포함하며,

그 중, 상기 메모리에 상기 적어도 하나의 프로세서에 의해 실행가능한 명령이 저장되어 있으며, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서로 하여금 본 개시의 각 실시예에서 제공하는 방법을 실행할 수 있도록 한다.

제4 측면에 있어서, 본 개시의 실시예는 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체를 제공하고, 상기 컴퓨터 명령은 상기 컴퓨터로 하여금 본 개시의 각 실시예에서 제공하는 방법을 실행할 수 있도록 한다.

도면들은 해당 기술방안의 이해를 돕기 위한 것이지, 본 개시에 대한 한정을 구성하지 않는다.
도 1은 본 개시에서 제공하는 일 실시예에 따른 이벤트 아규먼트 추출 방법의 흐름 예시도이다.
도 2는 본 개시에서 제공하는 일 실시예에 따른 이벤트 아규먼트 추출 방법의 원리도이다.
도 3은 본 개시에서 제공하는 일 실시예에 따른 이벤트 아규먼트 추출 장치의 구조도이다.
도 4는 본 개시의 실시예에 따른 이벤트 아규먼트 추출 방법을 실현하는 전자 기기 블록도이다.

이하, 본 개시의 실시예에서의 도면을 결부시켜, 본 개시의 실시예에 따른 기술방안을 명확하고 완전하게 설명하기로 한다. 그 중에는 이해를 돕기 위한 본 개시의 실시예의 각종 디테일도 포함되어 있으며, 전술한 실시예들은 단지 예시적인 것이며, 해당 기술분야에서 통상의 지식을 가진 자들은 본 개시의 실시예에 대해 본 개시의 정신 및 특허청구범위를 일탈하지 않고 다양한 개변 및 변형을 진행할 수 있다. 간단 명료하게 설명하기 위해, 아래에서는 해당 기술분야에 공지된 기능 및 구조에 대해 진일보하여 기술하지 않기로 한다.

도 1에서 도시하다 시피, 본 개시의 실시예는 전자 기기에 응용될 수 있는 이벤트 아규먼트 추출 방법을 제공하며, 상기 방법은 하기의 단계를 포함한다.

단계 S101: 추출될 이벤트 내용을 획득한다.

이벤트 내용은 이벤트 뉴스(예컨대, 뉴스 타이틀, 뉴스 텍스트 등) 등을 포함할 수 있음을 이해할 수 있으며, 추출될 이벤트 내용은 즉 추출될 이벤트 뉴스를 포함하고, 후속으로 추출될 이벤트 내용에 대해 아규먼트 추출을 진행한다. 상기 추출될 이벤트 내용은 실제 애플리케이션 영역의 이벤트 중에서 획득할 수 있고, 추출될 이벤트 내용은 타겟 영역과 관련되며, 즉 추출될 내용은 타겟 영역에 대응되는 이벤트 내용이다. 예컨대, 금융 영역에 있어서, 금융 영역의 추출될 이벤트 내용에 대해 획득을 진행하고, 후속으로 아규먼트 추출을 진행한다. 예를 더 들면, 인터넷 기술 영역에 있어서, 인터넷 기술 영역의 이벤트 뉴스 중에서 추출될 이벤트 뉴스를 획득하고, 후속으로 아규먼트 추출을 진행한다.

단계 S102: 훈련된 이벤트 아규먼트 추출 모델을 토대로 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 추출될 이벤트 내용의 타겟 아규먼트를 획득하며;

그 중, 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된다.

미리 훈련을 통해 훈련된 이벤트 아규먼트 추출 모델을 획득하고, 추출될 이벤트 내용을 획득한 후, 훈련된 이벤트 아규먼트 추출 모델을 이용하여 추출될 이벤트 내용의 아규먼트를 추출하여, 타겟 아규먼트를 확정한다. 본 개시의 실시예에서, 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터, 이벤트 뉴스 샘플 및 독서 이해 데이터를 토대로 훈련하여 획득되고, 그 중, 이벤트 뉴스 라벨링 데이터는 이벤트 아규먼트 라벨링 데이터로 이해할 수 있으나, 이벤트 뉴스를 포함하지 않고, 또한 이벤트 뉴스 중 아규먼트는 이미 라벨링 되어 있으며, 아규먼트 라벨링 데이터를 더 포함하고, 이벤트 뉴스 샘플은 뉴스 텍스트로 이해할 수 있으며, 실제 애플리케이션 영역 중의 이벤트 뉴스 샘플일 수 있는바, 예컨대, 실제 애플리케이션 영역 중의 실시간 뉴스일 수 있고, 독서 이해 데이터의 포맷은 묘사 문장, 문답 및 물음에 대응되는 응답(즉 아규먼트) 이 세가지 요소로 구성되고, 즉 독서 이해 데이터는 독서 묘사 문장(묘사 문장 요소에 대응되는 내용은, 독서 이해 데이터의 독서 텍스트로 이해할 수 있음), 독서 물음(물음 요소에 대응되는 내용) 및 독서 물음에 대응되는 응답(독서 응답으로 이해할 수 있고, 대응되는 독서 묘사 문장 중에서, 응답 요소에 대응되는 내용임)으로 이해할 수 있으며, 문답식 데이터로 이해할 수 있다. 독서 이해 데이터 중의 독서 묘사 문장들은 현재 고유한 서적, 문헌 및 논문 등 데이터 중에서 획득할 수 있다. 본 개시의 실시예에서, 먼저 이벤트 뉴스 샘플(이벤트 뉴스 텍스트 샘플로 이해할 수 있음) 및 독서 이해 데이터를 이용하여 프리 트레이닝 모델에 대해 훈련을 진행하여 중간 추출 모델을 획득하고, 그 다음, 이벤트 뉴스 라벨링 데이터를 이용하여 중간 추출 모델에 대해 훈련을 진행하며, 이로서 훈련된 이벤트 아규먼트 추출 모델을 획득한다. 하나의 실시예에서, 상술한 프리 트레이닝 모델은 프리 트레이닝 언어 모델을 의미하고, 프리 트레이닝 언어 모델은 이미 데이터 세트(본 개시의 실시예에서 훈련에 사용되는 데이터와 상이함)를 이용하여 훈련된 언어 모델로 이해할 수 있다. 본 개시의 실시예에서, 이벤트 뉴스 라벨링 데이터, 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여, 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킨다.

본 개시의 실시예의 이벤트 아규먼트 추출 방법에서, 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하기 위한 훈련된 이벤트 아규먼트 추출 모델은, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득되며, 즉 훈련된 이벤트 아규먼트 추출 모델은 두번의 훈련을 통해 획득되고, 그리고, 두번의 훈련 과정에서 상이한 데이터를 통해 훈련을 진행하며, 즉 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 중간 추출 모델을 획득하여, 중간 추출 모델로 하여금 이벤트 뉴스 샘플과 관련되는 분야의 지식을 학습하도록 하고, 및 독서 이해 데이터와 관련되는 지식을 학습하도록 하며, 그리고, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 다시 훈련을 진행하여 획득된다. 이로서, 획득한 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킬 수 있고, 따라서, 아규먼트 추출 효과를 향상시킬 수 있다.

하나의 실시예에서, 훈련된 이벤트 아규먼트 추출 모델은:

이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하며;

이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식; 을 통해 획득된다.

프리 트레이닝 모델 훈련 과정에서, 복수 개의 손실 함수가 있는 것에 관련될 수 있으며, 상이한 프리 트레이닝 모델에 대응되는 손실 함수는 상이할 수 있고, 구체적으로 제1 손실 함수가 상이한 것일 수 있다. 본 개시의 실시예에서, 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수를 통해 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하고, 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수를 이용하여 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하며, 즉, 모델 훈련 과정에서, 세가지 타입의 손실 함수에 관한 것으로, 제1 손실 함수의 수량은 적어도 하나일 수 있고, 또한 복수 개일 수도 있다.

하나의 실시예에서, 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하는 방식은:

이벤트 뉴스 샘플을 상기 트레이닝 모델에 입력하고, 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;

독서 이해 데이터를 프리 트레이닝 모델에 입력하고, 제2 손실 함수의 제2 손실 값을 연산하는 것;

적어도 하나의 제1 손실 값과 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및

총 손실 값에 따라, 프리 트레이닝 모델에 대해 훈련을 진행하여, 중간 추출 모델을 획득하는 것; 을 포함한다.

즉 본 개시의 실시예에서, 이벤트 뉴스 샘플을 통해 프리 트레이닝 모델에 입력하여, 연산하는 것은 적어도 하나의 제1 손실 함수의 제1 손실 값이고, 적어도 하나의 제1 손실 값을 획득하며, 독서 이해 데이터를 통해 프리 트레이닝 모델을 입력하여, 연산하는 것은 제2 손실 함수의 제2 손실 값이다. 그리고 총 손실 값(적어도 하나의 제1 손실 값의 합과 제2 손실 값의 합)을 획득하고, 총 손실 값을 통해 모델 훈련을 진행하여, 중간 추출 모델을 획득하며, 중간 추출 모델의 성능을 향상시킬 수 있다. 이해할 수 있는 것은, 이벤트 뉴스 샘플 및 독서 이해 데이터의 끊임없는 입력에 따라, 제1 손실 값과 제2 손실 값은 끊임없이 업데이트되고, 총 손실 값도 끊임없이 업데이트되며, 이로서 총 손실 값에 따라, 그래디언트 하강 및 역방향 전파를 통해, 모델 파라미터를 반복적으로 업데이트하여, 수렴 모델, 즉 중간 추출 모델을 획득한다.

하나의 실시예에서, 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:

독서 이해 데이터의 포맷에 따라, 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및

뉴스 문답 데이터 및 제3 손실 함수에 따라, 중간 추출 모델에 대해 훈련을 진행하여, 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것; 을 포함한다.

위에서 기술된 바와 같이, 독서 이해 데이터의 포맷은 묘사 문장, 문답 및 응답 이 세가지 요소를 포함하고, 즉 문답 포맷이며, 독서 이해 데이터 중 독서 문답의 응답은 독서 물음에 따라 대응되는 묘사 문장에서 획득한다. 이벤트 뉴스 라벨링 데이터에 대해 독서 이해 데이터의 문답 포맷에 따라 포맷 전환을 진행할 수 있고, 즉 이벤트 뉴스 라벨링 데이터를 문답 포맷인 뉴스 문답 데이터로 전환하며, 뉴스 문답 데이터 중의 응답 요소의 내용은 이벤트 뉴스 라벨링 데이터 중 라벨링된 아규먼트이고, 이벤트 뉴스 라벨링 데이터 중 이벤트 뉴스는 묘사 문장 요소의 내용에 대응한다. 그리고, 이벤트 뉴스 라벨링 데이터 중 이벤트 타입 및 이벤트 타입의 각 아규먼트 역할에 따라 물음을 구축하며, 그 중, 각각의 이벤트 타입에 대응되는 아규먼트 역할은 미리 확정한 것이며, 이벤트 뉴스 라벨링 데이터의 이벤트 타입은 다양한 방식을 통해 확정할 수 있고, 본 개시의 실시예는 이에 대해 한정하지 않으며, 예컨대, 이미 존재하는 이벤트 타입 분류 모델을 통해 이벤트 뉴스 라벨링 데이터에 대해 이벤트 타입을 예측하여 획득할 수 있다.

하나의 실시예에서, 상기 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계는:

상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축하는 단계; 및 상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계; 를 포함한다.

추출될 이벤트 내용을 획득한 후, 독서 이해 데이터의 포맷에 따라 추출될 이벤트 뉴스의 포맷에 대해 전환을 진행하여, 상기 추출될 이벤트 뉴스의 추출될 문답 데이터를 획득하고, 추출될 문답 데이터의 포맷과 독서 이해 데이터의 포맷은 매칭된다. 그리고, 상기 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여 추출될 이벤트 내용의 타겟 아규먼트를 획득한다.

본 개시의 실시예에서, 포맷이 독서 이해 데이터의 포맷과 매칭되는 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하고, 이벤트 아규먼트 추출 모델은 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해 훈련을 진행하여 획득되며, 따라서 이벤트 아규먼트 추출 효과를 향상시킨다.

하나의 예시적인 실시예에서, 추출될 문답 데이터의 포맷은 상술한 독서 이해 데이터의 포맷 중 3개의 요소중의 2개의 요소를 포함하며, 즉 묘사 문장 및 물음 요소를 포함하며, 이로서, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭되는 것으로 알 수 있다.

하나의 실시예에서, 상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계는: 훈련된 이벤트 타입 분류 모델을 통해 추출될 이벤트 내용의 이벤트 타입을 예측하는 단계; 훈련된 이벤트 문장 판별 모델을 통해 추출될 이벤트 내용의 이벤트 묘사 문장을 예측하는 단계; 이벤트 타입, 이벤트 묘사 문장, 이벤트 타입에 대응되는 아규먼트 역할 및 독서 이해 데이터의 포맷을 토대로, 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계; 를 포함하며, 그 중, 추출될 문답 데이터는 추출될 이벤트 내용의 이벤트 묘사 문장, 추출될 이벤트 내용의 이벤트 타입 및 이벤트 타입에 대응되는 아규먼트 역할을 포함한다.

추출될 이벤트 내용을 획득한 후, 훈련된 이벤트 타입 분류 모델을 통해 이벤트 타입을 예측하여 획득하고, 및 훈련된 이벤트 문장 판별 모델을 통해 추출될 이벤트 뉴스의 이벤트 묘사 문장을 판별하여, 추출될 이벤트 뉴스의 이벤트 묘사 문장, 이벤트 타입 및 해당 이벤트 타입에 대응되는 아규먼트 역할을 사용하고, 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 뉴스의 추출될 문답 데이터를 구축하며, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭된다. 그리고, 상기 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여 추출될 이벤트 내용의 타겟 아규먼트를 획득한다.

본 개시의 실시예에서, 이벤트 아규먼트 추출 모델로 입력하는 추출될 문답 데이터는 상기 추출될 이벤트 내용의 이벤트 묘사 문장, 상기 추출될 이벤트 내용의 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 포함하며, 또한 포맷과 독서 이해 데이터의 포맷이 매칭되는 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하는데, 이벤트 아규먼트 추출 모델은 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해 훈련을 진행하여 획득되며, 따라서 이벤트 아규먼트 추출 효과를 향상시킨다.

위에서 기술한 바와 같이, 추출될 문답 데이터의 포맷은 상술한 독서 이해 데이터의 포맷 중 3개의 요소중의 2개의 요소를 포함하며, 즉 묘사 문장 및 물음 요소를 포함하며, 이로서, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭되는 것으로 알 수 있다. 하나의 예시적인 실시예에서, 추출될 이벤트 뉴스 중의 이벤트 묘사 문장은 묘사 문장 요소의 내용에 대응되고, 즉 추출될 문답 데이터는 추출될 이벤트 뉴스 중의 이벤트 묘사 문장 및 물음 요소(추출될 문답 데이터에서 물음 요소의 내용은 예측하여 획득한 추출될 이벤트 뉴스의 이벤트 타입 및 추출될 이벤트 뉴스의 이벤트 타입에 대응되는 아규먼트 역할을 포함함)의 내용을 포함한다.

하나의 실시예에서, 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 타겟 아규먼트를 획득하는 단계는: 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 훈련된 이벤트 아규먼트 추출 모델을 통해 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 타겟 아규먼트를 예측하여 획득하는 단계를 포함한다.

즉 상기 추출될 문답 데이터를 훈련된 이벤트 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델은 상기 추출될 문답 데이터의 이벤트 묘사 문장으로부터 상기 추출될 문답 데이터 중 물음의 응답을 예측하며, 즉 상기 추출될 문답 데이터의 이벤트 묘사 문장 중에서 상기 추출될 문답 데이터 중 물음 요소 내용에 대응되는 응답을 예측하여, 추출될 이벤트 내용의 타겟 아규먼트로한다. 이로서, 아규먼트 추출 과정에서, 훈련된 이벤트 아규먼트 추출 모델은 입력된 추출될 문답 데이터 중의 추출될 이벤트 내용의 이벤트 묘사 문장중에서 아규먼트를 추출하는 것을 통해, 추출될 이벤트 내용의 타겟 아규먼트를 획득할 수 있고, 추출 효과를 향상시킨다.

아래에서는, 하나의 구체적인 실시예로부터 상술한 이벤트 아규먼트 추출 방법의 과정에 대해 구체적으로 추가 설명하려 한다.

도 2에서 도시하다 시피, 도 2 는 상술한 이벤트 아규먼트 추출 방법을 구현하기 위한 시스템 원리도이고, 상기 시스템은 데이터 준비 모듈, 이벤트 아규먼트 추출 모델 오프라인 훈련 모듈 및 이벤트 아규먼트 추출 서비스 모듈을 포함한다.

먼저, 데이터 준비 모듈은, 이벤트 뉴스 샘플, 독서 이해 데이터 및 이벤트 뉴스 라벨링 데이터의 수집을 진행할 수 있다. 현재 이벤트 그래프 프로젝트에는 이벤트 검출 시스템이 있는데, 이는 컨텐츠 스트림으로부터 이벤트 뉴스 샘플을 마이닝하기 위한 것이다. 독서 이해 데이터는, 오픈 소스의 중문 독서 이해 데이터 세트 DuReader 및 영문 데이터 세트 SQUAD 중에서 획득할 수 있다. 독서 이해 데이터의 문답 포맷에 따라 이벤트 뉴스 아규먼트 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득한다. 뉴스 아규먼트 라벨링 데이터의 뉴스 내용은 뉴스 아규먼트 라벨링 데이터의 이벤트 묘사 문장이고, 즉 묘사 문장 요소의 내용이며, 이벤트 타입과 각 아규먼트 역할에 의해 각각 물음을 구축하고, 상기 아규먼트 역할에 대응되는 아규먼트는 응답이며, 독서 이해 데이터의 문답 포맷인 뉴스 문답 데이터를 형성한다. 예를 들면: 묘사 문장의 내용은 "웨윈펑은 엽기적인 큰 얼굴 사진을 올려 많은 눈길을 끌었는데, 와이프의 한마디에 현장은 아수라장"이라면, 물음의 내용은 "사진을 올려 사진 내용"이고, 응답의 내용은 "엽기적인 큰 얼굴 사진"이다. 그 중, "사진을 올려"는 이벤트 타입이고, "사진 내용"은 상기 이벤트 타입의 하나의 아규먼트 역할이며, 이벤트 타입에 대응되는 아규먼트 역할은 미리 확정된 것이고, 이벤트 타입을 확정한 후, 대응되는 아규먼트 역할을 확정할 수 있으며, 물음의 내용은 이벤트 타입 및 이벤트 타입에 대응되는 아규먼트 역할을 포함함을 이해할 수 있다.

그리고, 이벤트 아규먼트 추출 모델 오프라인 모델 훈련 모듈이다. 여기서 프리 트레이닝 모델은 딥(Deep) 프리 트레이닝 모델이며, 딥 프리 트레이닝 모델은 BERT인 것으로 예를 든다. 딥 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플을 사용하여 딥 프리 트레이닝 모델을 입력하여, 마스크 언어 모델（masked LM） 손실 함수 및 넥스트 문장 예측（Next Sentence Predicton） 손실 함수를 연산하고, 즉 적어도 하나의 제1 손실 함수는 마스크 언어 모델 손실 함수 값 및 넥스트 문장 예측 손실 함수를 포함하며, 마스크 언어 모델 손실 함수의 손실 값 및 넥스트 문장 예측 손실 함수의 손실 값을 획득하며, 즉 적어도 하나의 제1 손실 함수의 손실 값을 획득한 후, 마스크 언어 모델 손실 함수의 손실 값 및 넥스트 문장 예측 손실 함수의 손실 값의 총합을 구하여, Loss_KD 손실 값을 획득한다. 독서 이해 데이터（예컨대, DuReader）를 사용하여 딥 프리 트레이닝 모델에 입력하여, 모델이 독서 이해 데이터의 예측 응답과 독서 이해 데이터 중 표준 응답(즉 독서 데이터 중 독서 응답) 사이의 손실 값 Loss_MRC(즉 제2 손실 함수와 딥 프리 트레이닝 모델이 독서 이해 데이터에 대한 예측 응답과 독서 이해 데이터 중 표준 응답은 관련됨을 이해할 수 있음)을 연산하고, 즉 제2 손실 값이다. 총 손실은 Loss=Loss_KD+Loss_MRC이다. 총 손실 값을 이용하여, 그래디언트 하강 및 역방향 전파를 통해, 모델 파라미터를 반복적으로 업데이트하여, 수렴된 훈련 모델, 즉 중간 추출 모델을 획득한다. 이벤트 아규먼트 라벨링 데이터 포맷을 전환한 후의 뉴스 문답 데이터를 통해 중간 추출 모델에 대해 미세하게 조정하여, 훈련된 아규먼트 추출 모델을 획득하고, 모델 이벤트 아규먼트 추출 능력을 향상시킨다.

다음으로, 이벤트 아규먼트 추출 서비스 모듈이다.

추출될 이벤트 뉴스(예컨대, 뉴스 타이틀, 뉴스 텍스트)를 획득하고, 즉 상술한 추출될 이벤트 내용이며, 이미 고유한 이벤트 타입 분류 모델(즉 훈련된 이벤트 타입 분류 모델)을 통해 이벤트 타입을 예측하여 획득하고, 및 이미 고유한 이벤트 문장 판별 모델(즉 훈련된 이벤트 문장 판별 모델)을 통해 추출될 이벤트 뉴스의 이벤트 묘사 문장을 획득하며, 추출될 이벤트 뉴스의 이벤트 묘사 문장, 이벤트 타입 및 상기 이벤트 타입에 대응되는 아규먼트 역할을 사용하여, 또한 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 뉴스의 추출될 문답 데이터를 구축하고, 추출될 문답 데이터의 포맷과 독서 이해 데이터의 포맷은 매칭되며, 추출도리 문답 데이터의 포맷은 상술한 독서 이해 데이터의 포맷 중 3개의 요소중의 2개의 요소를 포함하며, 즉 묘사 문장 및 물음 요소를 포함하며, 이로서, 추출될 문답 데이터의 포맷은 독서 이해 데이터의 포맷과 매칭되는 것으로 알 수 있다. 그 중, 추출될 이벤트 뉴스 중의 이벤트 묘사 문장은 묘사 문장 요소의 내용에 대응되고, 즉 추출될 문답 데이터는 추출될 이벤트 뉴스 중의 이벤트 묘사 문장 및 물음 요소의 내용(추출될 문답 데이터에서 물음 요소의 내용은 예측하여 획득한 추출될 이벤트 뉴스의 이벤트 타입 및 추출될 이벤트 뉴스의 이벤트 타입에 대응되는 아규먼트 역할을 포함함)을 포함한다. 상기 추출될 문답 데이터를 훈련된 이벤트 아규먼트 추출 모델에 입력하고, 이벤트 아규먼트 추출 모델은 이벤트 묘사 문장에서 상기 추출될 문답 데이터 중 물음의 응답을 예측하여, 추출될 이벤트 뉴스의 타겟 아규먼트로 한다.

본 개시는 추출될 이벤트 뉴스의 문답 포맷인 추출될 문답 데이터를 채용하여 훈련된 아규먼트 추출 모델에 입력하여 이벤트 아규먼트 추출을 진행하며, 또한 딥 프리 트레이닝 모델의 기초상에서, 이벤트 뉴스 샘플 및 독서 이해 데이터를 도입하는 것을 통해, 따라서 이벤트 아규먼트 추출 효과를 향상시키고, 현실 시나리오에서 비교적 바람직한 추출 효과를 획득한다.

이벤트 아규먼트 추출은 이벤트 그래프 프로젝트에서 중요한 응용을 가지는데, 이벤트 아규먼트 추출을 통해, 구조화된 형태로 이벤트를 나 나타내고 표현함으로서, 빅 검색 및 Feed 이벤트 맥리어에서 이벤트를 디스플레이하여, 사용자의 신속한 이해를 돕는다. 그리고, 이벤트 아규먼트 추출은 각 분야에 응용될 수 있는바, 예컨대, 금융 분야, 회사의 이벤트를 통해 추출을 진행하여, 효율적인 위험 제어 등을 진행할 수 있다.

도 3 을 참조하면, 도 3은 본 개시의 실시예에서 제공하는 전자 기기에 응용되는 이벤트 아규먼트 추출 장치(300)이며, 상기 장치(300)는:

추출될 이벤트 내용을 획득하기 위한 제1 획득 모듈(301); 및

훈련된 이벤트 아규먼트 추출 모델을 토대로 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 추출될 이벤트 내용의 타겟 아규먼트를 획득하기 위한 추출 모듈(302); 을 포함하며,

하나의 실시예에서, 훈련된 이벤트 아규먼트 추출 모델은:

이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및

하나의 실시예에서, 상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:

하나의 실시예에서, 상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:

하나의 실시예에서, 추출 모듈은:

상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 구축 모듈로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축 모듈; 및

하나의 실시예에서, 구축 모듈은:

훈련된 이벤트 타입 분류 모델을 통해 추출될 이벤트 내용의 이벤트 타입을 예측하기 위한 제1 예측 모듈;

훈련된 이벤트 문장 판별 모듈을 통해 추출될 이벤트 내용의 이벤트 묘사 문장을 예측하기 위한 제2 예측 모듈;

이벤트 타입, 이벤트 묘사 문장, 이벤트 타입에 대응되는 아규먼트 역할 및 독서 이해 데이터의 포맷을 토대로, 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 제1 구축 서브 모듈; 을 포함하며, 그 중, 추출될 문답 데이터는 추출될 이벤트 내용의 이벤트 묘사 문장, 추출될 이벤트 내용의 이벤트 타입 및 이벤트 타입에 대응되는 아규먼트 역할을 포함한다.

하나의 실시예에서, 추출될 문답 데이터를 훈련된 아규먼트 추출 모델에 입력하고, 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 타겟 아규먼트를 획득하는 것은:

상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 것을 포함한다.

상술한 각 실시예의 이벤트 아규먼트 추출 장치는 상술한 각각의 실시예에 따른 이벤트 아규먼트 추출 방법을 구현하기 위한 장치이고, 기술 특징은 대응되고, 기술 효과는 대응되며, 여기서 더 이상 상세하게 기술하지 않기로 한다.

본 개시의 실시예에 있어서, 본 개시의 실시예는 전자 기기 및 판독 가능 저장 매체를 더 제공한다.

도 4에서 도시하다 시피, 도 4는 본 개시의 실시예에 따른 이벤트 아규먼트 추출 방법의 전자 기기의 블록도이다. 전자 기기는 예하면 랩탑 컴퓨터, 데스크톱 컴퓨터, 워킹 테이블, 개인용 디지털 보조기, 서버, 블레이드 서버, 대형 컴퓨터, 및 기타 적합한 컴퓨터와 같이 다양한 형태의 디지털 컴퓨터를 나타낸다. 전자 기기는 또한 다양한 형태의 이동 장치를 나타낼 수 있으며, 예컨대, 개인용 디지털 처리, 셀룰러 휴대폰, 스마트 휴대폰, 웨어러블 기기 및 기타 유사한 컴퓨팅 장치이다. 본문에서 나타내는 컴포넌트, 그들의 연결 및 관계, 및 그들의 기능은 단지 예시적인 것이지, 본 명세서에 설명된 및/또는 요구하는 본 개시의 구현을 제한하기 위함이 아님은 자명한 것이다.

도 4에서 도시하다 시피, 상기 전자 기기는: 하나 또는 복수 개의 프로세서(401), 메모리(402), 및 각 컴포넌트들을 연결하기 위한 인터페이스를 포함하고, 고속 인터페이스 및 저속 인터페이스를 포함한다. 각 컴포넌트들은 상이한 버스를 이용하여 서로 연결되고, 코먼 메인 플레이트 상에 설치되거나 또는 수요에 따라 기타 방식으로 설치될 수 있다. 프로세서는 전자 기기내에서 수행하는 명령에 대해 처리를 진행할 수 있으며, 메모리 또는 메모리상에 저장되어 외부 입력/출력 장치(예컨대, 인터페이스에 연결되는 표시 기기)상에서 GUI의 그래픽 정보를 나타내는 이미지 정보의 명령을 포함한다. 기타 실시방식에 있어서, 필요하다면, 복수 개의 프로세서 및/또는 복수 개의 버스를 복수 개의 메모리 및 복수 개의 메모리와 함께 사용할 수 있다. 동일하게, 복수 개의 전자 기기를 연결할 수 있으며, 각 기기들은 부분적으로 필요한 조작을 제공한다(예컨대, 서버 어레이, 블레이드 서버, 또는 멀티 프로세서 시스템). 도 4에서는 하나의 프로세서(401)를 예로 들었다.

메모리(402)는 본 개시에서 제공하는 비일시적 컴퓨터 판독 가능 저장 매체이다. 그 중, 상기 메모리에 적어도 하나의 프로세서에 의해 실행되는 명령이 저장되어 있으며, 상기 적어도 하나의 프로세서로 하여금 본 개시에서 제공하는 이벤트 아규먼트 추출 방법을 수행하도록 한다. 본 개시의 비일시적 컴퓨터 판독 가능 저장 매체에 컴퓨터 명령이 저장되어 있으며, 상기 컴퓨터 명령은 컴퓨터로 하여금 본 개시에서 제공하는 이벤트 아규먼트 추출 방법을 수행하도록 하기 위한 것이다.

메모리(402)는 하나의 비일시적 컴퓨터 판독 가능 저장 매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터가 실행가능한 프로그램 및 모듈을 저장하기 위한 것이며, 예하면 본 개시의 실시예에서의 더이벤트 아규먼트 추출 방법법에 대응되는 명령/모듈(예컨대, 도 3에서 도시된 제1 획득 모듈(301), 추출 모듈(302))이다. 프로세서(401)는 메모리(402)중의 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행하는 것을 통해, 따라서 서버의 각종 기능 애플리케이션 및 데이터 처리를 수행하여, 상술한 방법 실시예에서의 이벤트 아규먼트 추출 방법을 구현한다.

메모리(402)는 프로그램 저장 영역 및 데이터 저장 영역을 포함할 수 있으며, 그 중, 프로그램 저장 영역은 작업 시스템, 적어도 하나의 기능에 필요한 애플리케이션 등을 저장할 수 있으며; 데이터 저장 영역은 전자 기기의 사용에 따라 작성된 데이터 등을 저장할 수 있다. 또한, 메모리(402)는 고속 랜덤 액세스 메모리를 포함할 수도 있고, 비일시적 메모리를 포함할 수도 있으며, 예컨대 적어도 하나의 자기 디스크 저장 디바이스, 플래시 메모리 디바이스 또는 기타 비일시적 솔리드 스테이트 저장 디바이스를 더 포함할 수 있다. 일부 실시예에서, 메모리(402)는 선택적으로 프로세서(401)에 의해 원격으로 상대적으로 설치된 메모리를 포함할 수 있으며, 이러한 원격 메모리는 네트워크를 통해 키보드에 의해 표시되는 전자 기기에 연결될 수 있다. 상술한 네트워크의 실시예는 인터넷, 기업 내부 네트워크, 로컬 영역 네트워크, 이동 통신망 및 이들의 조합을 포함할 수 있으나 이에 한정되지 않는다.

이벤트 아규먼트 추출 방법에 따른 전자 기기는: 입력 장치(403) 및 출력 장치(404)를 더 포함할 수 있다. 프로세서(401), 메모리(402), 입력 장치(403) 및 출력 장치(404)는 버스 또는 기타 방식을 통해 연결될 수 있고, 도 4에서는 버스를 통해 연결된 것으로 예를 들었다.

입력 장치(403)는 입력된 숫자 또는 문자 부호 정보를 수신하고, 키보드에 의해 표시되는 전자 기기의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 산생시킬 수 있는바. 예컨대, 입력 장치(403)는 터치 패널, 기능키, 마우스, 트랙패널, 터치 패널, 표시 로드, 하나 또는 복수 개의 마우스 버튼, 트랙볼, 조이스틱 등 입력 장치이다. 출력 장치(404)는 표시 기기, 보조 조명 장치（예컨대, LED） 및 촉각 피드백 장치(예컨대, 진동 전기) 등을 포함할 수 있다. 상기 표시 기기는 액정 디스플레이(LCD), 유기 발광 다이오드(OLED) 디스플레이 및 플라즈마 디스플레이를 포함할 수 있으나, 이에 한정되지 않는다. 표시 기기는 터치 스크린일 수 있다.

여기서 설명되는 시스템 및 기술의 각종 실시방식들은 디지털 전기 회로 시스템, 집적 회로 시스템, 전용 ASIC(전용 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합에서 구현될 수 있다. 이러한 각종 실시방식은: 하나 또는 복수 개의 컴퓨터 프로그램에서 구현하는 방식을 포함할 수 있으며, 상기 하나 또는 복수 개의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능한 프로세서를 포함하는 프로그램 시스템에서 실행 및/또는 해석될 수 있으며, 상기 프로그램 가능한 프로세서는 전용 또는 범용으로 프로그램 가능한 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치, 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 데이터 및 명령을 상기 저장 시스템, 상기 적어도 하나의 입력 장치, 및 상기 적어도 하나의 출력 장치로 전송한다.

이러한 컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션, 또는 코드로도 칭할 수 있음)은 프로그램 가능한 프로세서의 기계 명령을 포함하며, 과정 및/또는 대상을 향한 프로그램 언어 및/또는 어셈블링/기계 언어를 이용하여 이러한 컴퓨팅 프로그램을 구현할 수 있다. 본문에서 사용되는 용어 “기계 판독 가능 매체” 및 “컴퓨터 판독 가능 매체”는 기계 판독 가능 신호로서 기계 명령을 수신하는 기계 판독 가능한 매체를 포함하는, 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기, 및/또는 장치(예컨대, 자기 디스크, 광 디스크, 메모리, 프로그램 가능한 로직 장치（PLD）)를 의미한다. 용어 “기계 판독 가능 신호”는 기계 명령 및/또는 데이터를 프로그램 가능한 프로세서에 제공하기 위한 임의의 신호를 의미한다.

사용자와의 인터렉션을 제공하기 위해, 본 명세서에서 설명된 시스템 및 기술을 컴퓨터에서 구현할 수 있으며, 상기 컴퓨터는: 사용자에게 정보를 디스플레이하기 위한 디스플레이 장치(예컨대, CRT (칼라 음극선관) 또는 LCD(액정 디스플레이) 모니터); 및 키보드 및 포인팅 장치(예컨대, 마우스 또는 트랙볼)를 구비하고, 사용자는 상기 키보드 및 포인팅 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 기타 타입의 장치는 사용자와의 인터렉션을 제공할 수 있으며; 예컨대, 사용자에게 제공된 피드백은 임의의 형태의 센싱 피드백(예컨대, 시각적 피드백, 청각적 피드백, 또는 촉각 피드백)일 수 있으며; 그리고 임의의 형태(소리 입력, 음성 입력, 또는 촉각 입력)를 사용하여 사용자로부터의 입력을 수신할 수 있다.

여기서 설명한 시스템 및 기술을 백스테이지 컴포넌트를 포함하는 컴퓨팅 시스템(예컨대, 데이터 서버), 또는 중간 컴포넌트를 포함하는 컴퓨팅 시스템(예컨대, 애플리케이션 서버), 또는 전방 컴포넌트를 포함하는 컴퓨팅 시스템(예컨대, 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비한 사용자 컴퓨터, 사용자는 상기 그래픽 사용자 인터페이스 또는 상기 네트워크 브라우저를 통해 여기에서 설명된 시스템 및 기술의 실시방식을 인터렉션할 수 있음), 또는 이런 백스테이지 컴포넌트, 중간 컴포넌트, 또는 전방 컴포넌트의 임의의 조합을 포함하는 컴퓨팅 시스템에서 구현될 수 있다. 시스템의 컴포넌트들은 임의의 형태 또는 매체의 디지털 데이터 통신(예컨대, 통신 네트워크)에 의해 서로 연결될 수 있다. 통신 네트워크의 예는 로컬 네트워크（LAN）, 광역 네트워크（WAN） 및 인터넷을 포함한다.

컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트 및 서버는 일반적으로 서로 멀리 떨어져 있고, 통상적으로 통신 네트워크를 통해 서로 인터렉션을 진행한다. 상응한 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 구비한 컴퓨터 프로그램을 통해 클라이언트와 서버의 관계가 생성된다.

본 개시의 실시예의 기술방안에 있어서, 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하기 위한 훈련된 이벤트 아규먼트 추출 모델은, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 훈련하여 획득되고, 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득되며, 즉 훈련된 이벤트 아규먼트 추출 모델은 두번의 훈련을 통해 획득되며, 또한 두번의 훈련 과정에서 상이한 데이터를 통해 훈련을 진행하고, 즉 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련을 진행하여 중간 추출 모델을 획득하여, 중간 추출 모델로 하여금 이벤트 뉴스 샘플과 관련되는 지식을 학습하도록 하고, 및 독서 이해 데이터와 관련되는 지식을 학습하도록 하며, 그리고, 이벤트 뉴스 라벨링 데이터를 토대로 중간 추출 모델에 대해 다시 훈련을 진행하여 획득된다. 이로서, 획득한 훈련된 이벤트 아규먼트 추출 모델의 성능을 향상시킬 수 있고, 따라서, 아규먼트 추출 효과를 향상시킬 수 있다.

위에서 나타내는 다양한 형태의 절차를 사용하여, 단계를 재 정렬, 추가 또는 삭제할 수 있다는 것을 이해할 수 있다. 예컨대, 본 개시에서 기재된 각 단계는 병렬적으로 실행할 수 있고, 순차적으로 실행할 수도 있으며, 또한 상이한 순서로 실행할 수도 있으며, 단지 본 개시에 따른 공개된 기술방안이 의도한 결과를 실현할 수만 있다면, 본문에서는 이에 대해 제한하지 않는다.

상술한 구체적인 실시방식은, 본 개시의 보호 범위의 제한을 구성하지 않는다. 해당 기술분야에서 통상의 지식을 가진 자들은 본 개시의 실시예에 대해 본 개시의 정신 및 특허청구범위를 일탈하지 않고, 설계 요구 및 기타 요소에 따라, 다양한 개변, 조합, 서브 조합 및 교체를 진행할 수 있음을 이해해야 할 것이다. 본 개시의 정신 및 특허청구범위를 일탈하지 않고, 이러한 개변 및 변형은 본 개시의 청구범위 및 그와 동등한 기술 범위 내에 속하며, 본 개시에서는 이러한 개변 및 변형을 청구범위 내에 귀속 시키고자 한다.

Claims

이벤트 아규먼트 추출 방법에 있어서,
상기 방법은:
추출될 이벤트 내용을 획득하는 단계; 및
훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계; 를 포함하며,
그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득되는 것인;
것을 특징으로 하는 이벤트 아규먼트 추출 방법.
제1 항에 있어서,
상기 훈련된 이벤트 아규먼트 추출 모델은:
상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및
상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식;
을 통해 획득되는 것인 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
제2 항에 있어서,
상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:
상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;
상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것;
을 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
제2 항에 있어서,
상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것;
을 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
제1 항에 있어서,
상기 훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하는 단계는:
상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하는 단계로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축하는 단계; 및
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계;
를 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
제5 항에 있어서,
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 단계는:
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 단계;
를 포함하는 것을 특징으로 하는 이벤트 아규먼트 추출 방법.
이벤트 아규먼트 추출 장치에 있어서,
상기 장치는:
추출될 이벤트 내용을 획득하기 위한 제1 획득 모듈; 및
훈련된 이벤트 아규먼트 추출 모델을 토대로 상기 추출될 이벤트 내용에 대해 아규먼트 추출을 진행하여, 상기 추출될 이벤트 내용의 타겟 아규먼트를 획득하기 위한 추출 모듈; 을 포함하며,
그 중, 상기 훈련된 이벤트 아규먼트 추출 모델은 이벤트 뉴스 라벨링 데이터를 통해 중간 추출 모델에 대해 훈련하여 획득되고, 상기 중간 추출 모델은 이벤트 뉴스 샘플 및 독서 이해 데이터를 통해 프리 트레이닝 모델에 대해 훈련하여 획득된 것인;
것을 특징으로 하는 장치.
제7 항에 있어서,
상기 훈련된 이벤트 아규먼트 추출 모델은:
상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식; 및
상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식;
을 통해 획득되는 것인 것을 특징으로 하는 장치.
제8 항에 있어서,
상기 이벤트 뉴스 샘플, 적어도 하나의 제1 손실 함수, 상기 독서 이해 데이터 및 제2 손실 함수에 따라 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 방식은:
상기 이벤트 뉴스 샘플을 상기 프리 트레이닝 모델에 입력하고, 상기 적어도 하나의 제1 손실 함수의 제1 손실 값을 연산하여, 적어도 하나의 제1 손실 값을 획득하는 것;
상기 독서 이해 데이터를 상기 프리 트레이닝 모델에 입력하고, 상기 제2 손실 함수의 제2 손실 값을 연산하는 것;
상기 적어도 하나의 제1 손실 값과 상기 제2 손실 값의 합을 연산하여, 총 손실 값을 획득하는 것; 및
상기 총 손실 값에 따라, 상기 프리 트레이닝 모델에 대해 훈련을 진행하여, 상기 중간 추출 모델을 획득하는 것;
을 포함하는 것을 특징으로 하는 장치.
제8 항에 있어서,
상기 이벤트 뉴스 라벨링 데이터 및 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 방식은:
상기 독서 이해 데이터의 포맷에 따라, 상기 이벤트 뉴스 라벨링 데이터에 대해 포맷 전환을 진행하여, 뉴스 문답 데이터를 획득하는 것; 및
상기 뉴스 문답 데이터 및 상기 제3 손실 함수에 따라, 상기 중간 추출 모델에 대해 훈련을 진행하여, 상기 훈련된 이벤트 아규먼트 추출 모델을 획득하는 것;
을 포함하는 것을 특징으로 하는 장치.
제7 항에 있어서,
상기 추출 모듈은:
상기 독서 이해 데이터의 포맷에 따라, 상기 추출될 이벤트 내용에 대응되는 추출될 문답 데이터를 구축하기 위한 구축 모듈로서, 그 중, 상기 추출될 문답 데이터의 포맷과 상기 독서 이해 데이터의 포맷은 매칭되는 것인, 구축 모듈; 및
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하기 위한 아규먼트 추출 모듈;
을 포함하는 것을 특징으로 하는 장치.
제11 항에 있어서,
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 아규먼트 추출을 진행하여, 상기 타겟 아규먼트를 획득하는 것은:
상기 추출될 문답 데이터를 상기 훈련된 아규먼트 추출 모델에 입력하고, 상기 훈련된 이벤트 아규먼트 추출 모델을 통해 상기 추출될 이벤트 내용의 이벤트 묘사 문장 중에서 상기 타겟 아규먼트를 예측하여 획득하는 것;
을 포함하는 것을 특징으로 하는 장치.
전자 기기에 있어서,
상기 전자 기기는:
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 연결되는 메모리; 를 포함하며,
그 중, 상기 메모리에 상기 적어도 하나의 프로세서에 의해 실행가능한 명령이 저장되어 있으며, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서로 하여금 청구항 제1 항 내지 제6 항 중 어느 한 항에 따른 방법을 실행하도록 하는 것인;
것을 특징으로 하는 전자 기기.
컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
상기 컴퓨터 명령은 상기 컴퓨터로 하여금 청구항 제1 항 내지 제6 항 중 어느 한 항에 따른 방법을 실행하도록 하는 것인,
것을 특징으로 하는 비일시적 컴퓨터 판독 가능 저장 매체.
컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서,
상기 컴퓨터 프로그램은 적어도 하나의 프로세서에 의해 실행될 경우, 청구항 제1항 내지 제6항 중 어느 한 항에 따른 상기 방법을 구현하는 것인,
컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.