KR20200007969A

KR20200007969A - 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체

Info

Publication number: KR20200007969A
Application number: KR1020197037609A
Authority: KR
Inventors: 준첸 리; 펜 린
Original assignee: 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date: 2017-10-31
Filing date: 2017-10-31
Publication date: 2020-01-22
Also published as: US11645517B2; US20200050940A1; JP6894534B2; KR102288249B1; CN110168535A; US20230237328A1; CN110168535B; JP2020521210A; WO2019084810A1

Abstract

정보 처리 방법, 단말기, 및 컴퓨터 저장 매체가 제공된다. 상기 정보 처리 방법은 단말기에 의해 수행된다. 단말기는 하나 이상의 프로세서와 메모리 장치, 및 하나 이상의 컴퓨터 프로그램을 포함한다. 하나 이상의 프로세서는 컴퓨터 프로그램을 실행하도록 구성된다. 상기 정보 처리 방법은, 제1 정보를 획득하는 단계(101); 제1 정보에 기초하여 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하고, 의도 식별 처리 결과에 따라 슬롯 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하는 단계(102); 및 슬롯 식별 처리 결과에 따라 목표 결과를 출력하는 단계(103)를 포함한다.

Description

정보 처리 방법, 단말기, 및 컴퓨터 저장 매체

본 발명은 인간-컴퓨터 상호작용 처리 기술에 관한 것으로, 상세하게는 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체에 관한 것이다.

사용자가 단말기와 인간-컴퓨터 상호작용을 수행하는 과정에서, 단말기는 사용자가 요청한 질의(query)에 대해 정확한 피드백을 제공할 필요가 있다. 예를 들어, 단말기가 휴대폰이고 또한 사용자가 "금요일의 영화는 뭐지?"라는 음성 형태로 질의하는 경우, 휴대폰은 음성 형태의 입력된 질의를 먼저 파싱하여 텍스트 형태의 질의 내용을 획득할 수 있고, 그런 다음 질의에 대응하는 답변을 로컬 데이터베이스 또는 웹 서버에서 검색한다.

인간-컴퓨터 상호작용 중에, 단말기가 휴대폰 외에 스마트 스피커 또는 스마트 TV와 같은 전자 장치일 수 있다. 스마트 스피커가 예로 사용된다. 사용자가 "주걸륜(중국 팝 가수)의 노래 A를 듣고 싶다"라는 질의를 제시하면, 이 질의에 포함된 특정 키워드가 "주걸륜 "과 "노래 A"이다. 이 경우, 이 질의에 대한 답변을 찾는 방법은? 관련 기술에서는 로컬 데이터베이스 또는 웹 서버에서 많은 양의 정보를 검색한 후에만 가까운 답변이 주어질 수 있다. 이 관련 기술의 단점은, 검색 범위가 크고 시간이 많은 걸린다는 것; 그리고 검색된 답변이 사용자 요구사항을 가장 만족하면서 가능성이 가장 높은 피드백 정보가 아니기 때문에, 정확도가 높지 아서 인간-컴퓨터 상호작용의 전반적인 효과에 영향을 줄 수 있다는 것이다.

하지만, 종래 기술의 이러한 단점에 대한 효과적인 해결책이 없다.

이를 고려하여, 본 발명의 실시예는 적어도 관련 기술에 존재하는 문제를 해결하기 위한 정보 처리 방법, 단말기 및 컴퓨터 저장 매체를 제공한다.

본 발명의 실시예는 정보 처리 방법을 제공한다. 상기 정보 처리 방법은 상기 단말기에 의해 수행되고, 상기 단말기는 하나 이상의 프로세서와 메모리 및 하나 이상의 컴퓨터 프로그램을 포함하며, 상기 하나 이상의 프로세서는 상기 컴퓨터 프로그램을 실행하도록 구성되고; 상기 정보 처리 방법은,

제1 정보를 수집하는 단계;

상기 제1 정보에 대해 의도 식별 태스크(intent identification task)를 실행하여 의도 식별 처리 결과를 획득하는 단계;

상기 의도 식별 처리 결과에 따라 슬롯 식별 태스크(slot identification task)를 실행하여 슬롯 식별 처리 결과를 획득하는 단계; 및

상기 슬롯 식별 처리 결과에 따라 목표 결과를 출력하는 단계를 포함한다.

본 발명의 실시예는 정보 처리 방법을 제공한다. 상기 정보 처리 방법은 단말기에 의해 수행되고, 상기 단말기는 하나 이상의 프로세서와 메모리 및 하나 이상의 컴퓨터 프로그램을 포함하며, 상기 하나 이상의 프로세서는 상기 컴퓨터 프로그램을 실행하도록 구성되고; 상기 정보 처리 방법은,

제1 정보를 수집하는 단계;

상기 제1 정보에 대해 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하는 단계;

상기 제1 정보에 대해 의도 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하는 단계;

상기 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하는 단계;

상기 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하는 단계;

상기 의도 식별 파라미터와 상기 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델(first combined model)을 생성하는 단계;

상기 제1 정보로부터 제1 특징을 추출하는 단계;

상기 제1 정보로부터 제2 특징을 추출하는 단계;

의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 상기 제1 특징과 상기 제2 특징에 따라 상기 제1 결합 모델을 훈련시키고, 상기 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하는 단계; 및

상기 제1 목표 파라미터와 상기 제2 목표 파라미터에 따라 제2 결합 모델을 구축하는 단계를 포함한다.

본 발명의 실시예는 단말기를 제공한다. 상기 단말기는,

제1 정보를 수집하도록 구성된 수집 유닛;

의도 식별 처리 결과를 획득하기 위해 상기 제1 정보에 대해 의도 식별 태스크를 실행도록 구성된 제1 태스크 실행 유닛;;

상기 의도 식별 처리 결과에 따라 슬롯 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하도록 구성된 제2 태스크 실행 유닛; 및

상기 슬롯 식별 처리 결과에 따라 목표 결과를 출력하도록 구성된 출력 유닛을 포함한다.

본 발명의 실시예는 단말기를 제공한다. 상기 단말기는,

제1 정보를 수집하도록 구성된 수집 유닛;

상기 제1 정보에 대해 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하도록 구성된 제1 태스크 실행 유닛;

상기 제1 정보에 대해 의도 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하도록 구성된 제2 태스크 실행 유닛;

상기 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하도록 구성된 제1 파싱 유닛;

상기 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하도록 구성된 제2 파싱 유닛;

상기 의도 식별 파라미터와 상기 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델을 생성하도록 구성된 제1 모델 구축 유닛;

상기 제1 정보로부터 제1 특징을 추출하도록 구성된 제1 추출 유닛;

상기 제1 정보로부터 제2 특징을 추출하도록 구성된 제2 추출 유닛;

의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 상기 제1 특징과 상기 제2 특징에 따라 상기 제1 결합 모델을 훈련시키고, 상기 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하도록 구성된 제3 추출 유닛; 및

상기 제1 목표 파라미터와 상기 제2 목표 파라미터에 따라 제2 결합 모델을 구축하도록 구성된 제2 모델 구축 유닛을 포함한다.

본 발명의 실시예는 단말기를 제공한다. 상기 단말기는,

프로세서 상에서 실행될 수 있는 컴퓨터 프로그램을 저장하도록 구성된 메모리; 및

프로세서를 포함한다. 상기 프로세서는,

상기 컴퓨터 프로그램이 실행될 때 전술한 실시예에 따른 정보 처리 방법의 단계를 수행하도록 구성된다.

본 발명의 실시예는 컴퓨터 판독가능 저장 매체를 제공한다. 상기 컴퓨터 판독가능 저장 매체는 컴퓨터 프로그램을 저장하고 있으며, 상기 컴퓨터 프로그램은 프로세서에 의해 실행될 때 전술한 실시예에 따른 정보 처리 방법의 단계를 구현한다.

본 발명의 실시예에 따르면, 제1 정보가 수집되고, 제1 정보에 대해 의도 식별 태스크가 실행되어 의도 식별 처리 결과를 획득하고, 그런 다음 의도 식별 처리 결과에 따라 슬롯 식별 태스크가 실행되어 슬롯 식별 처리 결과를 획득한다. 이 직렬 처리 메커니즘에서, 슬롯 식별 처리 결과에 따라 목표 결과를 출력하기 위해 의도 식별 태스크와 슬롯 식별 태스크의 2개의 처리 결과의 특징 속성들 간의 연관관계가 활용될 수 있다. 직렬 처리 메커니즘이 연관관계 효과를 얻을 수 있기 때문에, 검색 범위가 좁아질 수 있고 또한 과도한 시간 낭비가 방지된다. 사용자에게는 처리가 투명하고, 사용자는 질의를 입력한 후에만 원하는 답변을 빠르게 얻을 수 있다. 또한, 사람-컴퓨터 상호작용의 전체적인 효과가 향상될 수 있도록, 이 답변은 정확도가 높고, 사용자 요구사항을 가장 많이 만족하면서 가장 가능성이 높은 피드백 정보이다.

도 1은 본 발명의 일 실시예에 따른 데이터 교환을 수행하는 하드웨어 엔티티를 개략적으로 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 방법을 정보 교환 시나리오에 적용하는 것을 개략적으로 나타낸 도면이다.
도 3은 본 발명의 일 실시예에 따른 방법의 구현을 개략적으로 나타낸 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 질의를 위한 데이터 수집과 레이블링(labeling)을 나타낸 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 태그 레이블링(tag labeling)을 개략적으로 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 질의에 대한 보조 특징 추출을 나타낸 흐름도이다.
도 7은 본 발명의 일 실시예에 따라 심층 특징이 추출되는 동안 보조 특징이 벡터에 매핑되고 모델에 통합되는 모델 프레임워크를 개략적으로 나타낸 도면이다.
도 8은 본 발명의 일 실시예가 적용되는 정보 처리 시스템을 개략적으로 나타낸 도면이다.
도 9는 본 발명의 일 실시예에 따른 단말기의 하드웨어 구성 요소를 개략적으로 나타낸 도면이다.

이하, 기술적 해결책의 구현에 대해 첨부 도면을 참조하여 더 상세하게 설명한다.

다음의 상세한 설명에서, 본 발명의 완전한 이해를 제공하기 위해 다수의 구체적인 세부 사항이 설명된다. 하지만, 당업자에게는 이러한 구체적인 세부사항 없이 본 발명이 실시될 수 있다는 것이 명백하다.

또한, "제1", 및 "제2" 등의 용어가 다양한 요소(또는 다양한 임계값 또는 다양한 애플리케이션 또는 다양한 명령 또는 다양한 동작) 등을 설명하기 위해 본 명세서에서 여러 번 사용되지만, 이러한 요소(또는 임계값 또는 애플리케이션 또는 명령 또는 동작)이 이러한 용어에 의해 제한되어서는 안 된다. 이러한 용어는 하나의 요소(또는 임계값 또는 애플리케이션 또는 명령 또는 동작)와 다른 요소(또는 임계값 또는 애플리케이션 또는 명령 또는 동작)을 구별하는 데 사용될 뿐이다.

본 발명의 실시예의 단계들이 설명된 단계의 순서로 반드시 처리될 필요는 없으며, 이러한 단계들이 요구사항에 따라 재정렬되도록 선택적으로 배열될 수 있거나, 또는 실시예의 단계들이 삭제되거나, 또는 실시예의 단계들이 추가될 수 있다. 본 발명의 실시예의 단계들은 순서의 선택적 조합으로 설명될 뿐이며, 본 발명의 실시예의 모든 단계 순서 조합을 나타내지는 않는다. 이러한 실시예의 단계들의 순서가 본 발명에 대한 제한으로 간주될 수 없다.

본 발명의 실시예에서 "및/또는"이라는 용어가 하나 이상의 관련된, 열거된 항목을 포함하는 임의의 가능한 모든 조합을 지칭한다. 본 명세서에서 사용될 때, "포함(include/comprise)"이라는 용어는 설명된 특징, 정수, 단계, 동작, 요소 및/또는 구성 요소의 존재를 나타내지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소 및/또는 구성 요소 및/또는 이들의 그룹의 존재하 또는 추가를 배제하지 않는다는 것을 유의해야 한다.

본 발명의 실시예에서의 지능형 단말기가 다양한 형태로 구현될 수 있다. 예를 들어, 본 발명의 실시예에서 설명된 모바일 단말기, 예를 들어 스마트 스피커, 스마트 TV, 휴대폰, 스마트폰, 노트북 컴퓨터, 숫자 방송 수신기(numerical broadcast receiver), 개인용 정보 단말기(personal digital assistant, PDA), 태블릿 컴퓨터(PAD), 휴대용 멀티미디어 플레이어(portable multimedia player, PMP) 또는 내비게이션 기기를 포함할 수 있다.

도 1은 본 발명의 일 실시예에 따른 데이터 교환을 수행하는 하드웨어 엔티티를 개략적으로 나타낸 도면이다. 도 1은 네트워크 측의 서버(11-1n)와 단말기(21-25)을 포함한다. 단말기(21-25)는 무선 또는 유선으로 네트워크 측의 서버(11-1n)와 정보 교환을 수행한다. 도 1의 서버의 개수와 단말기의 개수는 예시적인 것에 불과하며, 서버와 단말기의 구체적인 개수를 제한하지 않는다.

도 2는 본 발명의 일 실시예에 따른 정보 처리 방법을 단말기(31-34)와 서버 (41)를 포함하는 정보 교환 시나리오에 적용하는 것을 개략적으로 나타낸 도면이다. 이 개략도에서, 구체적인 처리 로직이 단말기 측에서 실행될 수 있고, 서버 측이 정보 소스의 역할을 한다. 단말기는 네트워크 측의 서버로부터 구체적인 처리 로직을 실행하기 위한 정보를 획득하는 것 외에, 구체적인 처리 로직을 실행하기 위한 정보를 로컬에서 추가로 획득할 수 있다. 지능형 단말기가 스마트 스피커인 경우, 단말기의 처리 로직(10)은 다음의 단계를 포함한다. S1. 제1 정보(로컬에서 수집된 정보와 서버 측으로부터의 정보를 포함하는 정보)를 수집한다(여기서의 정보는 실시간으로 획득되고 또한 피드백이 필요한 정보 대신 결합 모델(combined model)을 구축하기 위한 분석 정보로, 예를 들어 기존의 정보(A-C)가 분석을 위해 수집되어 결합 모델을 구축하고, 그 후에 결합 모델이 훈련되며, 그런 다음 실시간으로 획득된 정보(F)가 피드백된다). S2. 제1 정보에 대해 의도 식별 태스크(intent identification task)를 실행하여 의도 식별 처리 결과를 획득하고, 의도 식별 처리 결과에 따라 슬롯 식별 태스크(slot identification task)를 실행하여 슬롯 식별 처리 결과를 획득한다. 직렬 메커니즘에서(의도 식별 태스크가 먼저 실행되어 의도 식별 처리 결과를 획득하고, 그런 다음 의도 식별 처리 결과에 따라 슬롯 식별 태스크가 실행되어 슬롯 식별 처리 결과를 획득하는 메커니즘에서), 2개의 태스크의 특징 속성들 사이의 연관관계가 활용될 수 있다. S3. 제1 정보로부터 결합 모델의 심층 학습(in-depth learning)에 사용되는 제1 특징(예를 들어, 인공적으로 구축된 보조 특징)과 제2 특징(예를 들어, 신경망에 기초하여 획득되는 심층 특징)을 추출한다. S4. 제2 특징에 기초하여 그리고 제1 특징을 이용하여 결합 모델을 훈련시키고, 결합 모델이 지정된 목표에 도달하면 훈련시키는 것을 중지하며, 상수로 간주되는 의도 식별 파라미터와 상수(constant)로 간주되는 슬롯 식별 파라미터를 추출한다. 의도 식별 파라미터와 슬롯 식별 파라미터는 조합 모델의 훈련 중에 끊임없이 바뀌는 변수로, 지정된 목표에 도달할 때 상수로 간주될 수 있다는 것을 유의해야 한다. 여기서의 "상수"는 지정된 목표에 도달하는 의도 식별 파라미터와 슬롯 식별 파라미터로 구성된 새로운 결합 모델이 제2 정보에 대한 피드백 응답을 제공하는 데 사용될 수 있다는 것을 의미한다. S5. 피드백 정보를 획득하기 위해, 지정된 목표에 도달하는 의도 식별 파라미터와 슬롯 식별 파라미터로 구성된 새로운 결합 모델에 기초하여 제2 정보에 대한 피드백 응답을 제공한다. 여기서, 제2 정보는 전술한 제1 정보와 다르고, 제2 정보는 사용자에 의해 실시간으로 제시된 질의(query)이다. 제1 정보는 수많은 질의의 데이터를 포함하고, 모델링에 사용된다.

도 2의 전술한 예는 본 발명의 일 실시예를 구현하기 위한 시스템 아키텍처의 예일 뿐이며, 본 발명의 실시예는 도 2의 시스템 아키텍처에 한정되지 않는다. 도 2의 시스템 아키텍처에 기초하여, 본 발명의 다양한 실시예 방법이 제안된다.

본 발명의 본 실시예에서의 정보 처리 방법은 단말기에 의해 수행될 수 있다. 단말기는 하나 이상의 프로세서와 메모리 및 하나 이상의 컴퓨터 프로그램을 포함하고, 하나 이상의 프로세서는 컴퓨터 프로그램을 실행하도록 구성된다. 도 3에 도시된 바와 같이, 정보 처리 방법은 아래의 단계를 포함한다. 제1 정보가 수집된다(101). 예를 들어 인간-컴퓨터 상호작용 중에 사용자에 의해 제시된 수많은 질의가 수집된다. 이러한 질의는 서버에 의해 제공되는 데이터 소스로부터 획득될 수 있다. 사용자와의 인간-컴퓨터 상호작용에 있는 단말기는 고객 서비스 및 컨설팅에 사용되는 채팅 로봇, 또는 스마트 스피커, 또는 스마트 텔레비전과 같은 다양한 인공지능 단말기일 수 있다. AI는 컴퓨터 과학의 한 분야이다. 지능의 본질에 기초하여, 인간 지능과 유사한 방식으로 반응하는 새로운 지능형 기계가 생산된다. AI는 AI 로봇 공학, 언어 인식, 이미지 인식, 자연어 처리, 및 전문가 시스템을 포함한다. AI의 응용 분야가 점점 더 커지고 있으며, 이 텍스트에서 언급되는 지능형 단말기(예컨대, 스마트 스피커)에 한정되지 않는다. 제1 정보에 대해 의도 식별 태스크가 실행되어 의도 식별 처리 결과를 획득하고, 의도 식별 처리 결과에 따라 슬롯 식별 태스크가 실행되어 슬롯 식별 처리 결과를 획득한다(102). 의도 식별 태스크를 분류 태스크라고 할 수 있고, 슬롯 식별 태스크를 시퀀스 레이블링 태스크(sequence labeling task)라고 할 수 있다. 의도 식별 태스크과 슬롯 식별을 실행하는 구체적인 과정은 하나의 실행 모듈에서 2개의 태스크를 처리하는 것이다. 의도 식별 태스크가 제1 정보에 대해 먼저 실행되어 의도 식별 처리 결과를 획득하고, 그런 다음 의도 식별 처리 결과에 따라 슬롯 식별 태스크가 실행됨으로써, 2개의 태스크의 처리 결과에서의 특징 속성들 간의 연관관계가 활용될 수 있다. 따라서, 이 직렬 메커니즘에서, 즉 제1 정보에 대해 의도 식별 태스크가 먼저 실행되고, 의도 식별 처리 결과가 획득된 후에 의도 식별 처리 결과에 따라 슬롯 식별 태스크가 실행됨으로써, 정확한 슬롯 식별 처리 결과가 획득될 수 있다. 그런 다음, 슬롯 식별 처리 결과에 따라 정확한 목표 결과가 획득될 수 있으며, 목표 결과가 출력된다. 슬롯 식별 처리 결과에 따라 목표 결과가 출력된다(103).

일 실시예에서, 결합 모델이 의도 식별 파라미터와 슬롯 식별 파라미터에 기초하여 구축될 수 있다. 의도 식별 파라미터와 슬롯 식별 파라미터는 조합 모델의 훈련 중에 끊임없이 바뀌는 변수이다. 초기 상태의 의도 식별 파라미터와 슬롯 식별 파라미터에 따라 구축된 조합 모델을 제1 조합 모델이라고 한다. 지정된 목표에 도달할 때까지 결합 모델이 훈련된다. 이때, 의도 식별 파라미터와 슬롯 식별 파라미터는 상수로 간주될 수 있다. 여기서, "상수"는 지정된 목표에 도달하는 의도 식별 파라미터와 슬롯 식별 파라미터에 따라 새로운 결합 모델이 구축될 수 있다는 것을 의미한다. 새로운 결합 모델은 제1 결합 모델과 다르며, 제2 결합 모델이라고 할 수 있다.

의도 식별과 슬롯 식별의 2개의 태스크가 결합되고, 의도 식별 파라미터와 슬롯 식별 파라미터에 따라 결합 모델을 구축하는 과정에서, 동일한 모듈에서 머신 러닝의 결합 학습이 수행됨으로써, 직렬 메커니즘을 이용하여 획득된 의도 식별과 슬롯 식별의 연관관계 효과에 기초하여 구축되는 연관관계의 결합 모듈이 획득된다. 결합 모델의 효과(모델의 정확도)가 2개의 개별 모듈을 이용하여 획득된 것보다 훨씬 낫다(예를 들어, 의도 식별 태스크와 슬롯 식별 태스크가 다른 모듈에서 실행된다).

본 발명의 본 실시예에서의 정보 처리 방법은 다음의 단계를 더 포함한다. 결합 모델의 심층 학습에 사용되는 제1 특징(104)이 제1 정보로부터 추출된다. 제1 특징을 보조 특징(auxiliary feature)이라고 하며, 보조 특징을 인공적으로 구성된 어떤 특징이라고 한다. 제1 정보로부터 결합 모델의 심층 학습에 사용되는 제2 특징이 추출된다(105). 제2 특징을 심층 특징이라고 하며, 심층 특징은 시퀀스 레이블링 모델에 기초하여 획득되는 특징이다. 음악 유형의 키워드를 검색하는 스마트 스피커가 예로 사용되며, 시퀀스 레이블링 모델은 순환 신경망(cyclic neural network, RNN)일 수 있다. 다른 기술 분야에서, 음악이 아닌 유형의 검색인 경우, 기술 분야에서 최상의 키워드 매칭이 달성될 수 있는 한, 시퀀스 레이블링 모델은 다른 비-RNN 모델일 수 있다. 다시 말해, 본 실시예는 RNN에 한정되지 않으며, 머신 러닝을 위한 신경망 모델과 시퀀스 레이블링을 위한 모델은 모두 본 발명의 본 실시예에 적용 가능하다.

본 발명의 본 실시예의 정보 처리 방법은 다음 단계를 더 포함한다. 제2 특징과 제1 특징에 따라 결합 모델이 학습된다(106). 예를 들어, 결합 모델은 RNN 모델과 보조 특징을 이용하여 훈련된다. 결합 모델이 지정된 목표에 도달할 때(지정된 목표의 목표 함수가 사용자 요구사항을 가장 많이 만족하고 또한 가능성이 가장 높은 함수일 때), 훈련이 중지되고, 제1 목표 파라미터와 제2 목표 파라미터가 추출된다(107). 예를 들어, 제1 목표 파라미터가 제1 파라미터에 대응하는 목표 파라미터이고, 제2 목표 파라미터가 제2 파라미터에 대응하는 목표 파라미터이며, 이들은 결합 학습을 통해 획득된다. 실제 적용에 있어서, 결합 모델의 제1 파라미터(예컨대, 의도 식별 파라미터)과 제2 파라미터(예컨대, 슬롯 식별 파라미터)가 초기에는 변수이다. 결합 모델에 대응하는 목표 함수의 값이 결합 모델에 대한 머신 러닝 훈련을 통해 최대 가능성에 도달할 때, 훈련이 중지되고, 현재의 제1 파라미터(예컨대, 의도 식별 파라미터)과 제2 파라미터(예컨대, 슬롯 식별 파라미터 등)가 상수로 간주된다. 상수에 기초하여, 사용자에 의해 제시된 질의에 대한 원하는 피드백 정보(질의에 대한 답변)가 얻어질 수 있고, 피드백 정보는 사용자 요구사항을 가장 많이 만족하고 또한 가능성이 가장 높은 정보이다. 제1 파라미터(예컨대, 의도 식별 파라미터)와 제2 파라미터(슬롯 식별 파라미터)의 목표 함수가 사용자 장비를 가장 많이 만족하고 또한 가장 가능성이 높을 때, 훈련이 중지되고, 제1 목표 파라미터(결합 학습을 통해 획득된 제1 파라미터에 대응하는 목표 파라미터)와 제2 목표 파라미터(결합 학습을 통해 획득된 제2 파라미터에 대응하는 목표 파라미터)가 추출된다. 제2 정보가 획득된다(108). 일 예에서, 제2 정보가 획득되기 전의 모든 처리가 제1 정보에 기초하여, 즉 다수의 질의를 포함하는 데이터, 예를 들어 RNN 모델과 보조 특징을 이용하여 결합 모델을 훈련시켜서 획득된 목표 파라미터에 기초하여 획득된다. 목표 파라미터는 의도 식별을 위한 목표 파라미터와 슬롯 식별을 위한 목표 파라미터를 포함한다. 여기서, 제2 정보는 전술한 제2 정보와 다르며, 사용자에 의해 실시간으로 제시되는 질의이다. 획득된 목표 파라미터를 이용하여 제2 정보에 대한 정확한 피드백 정보를 검색할 수 있다. 피드백 정보를 획득하기 위해, 제1 목표 파라미터와 제2 목표 파라미터에 따라 제2 정보에 대한 피드백 응답이 제공된다(109).

일 실시예에서, 제1 정보와 제2 정보는 질의, 즉 사용자의 입력일 수 있다. 하지만, 제2 정보는 실시간으로 입력된다. 슬롯은 질의에서 특정 속성을 가진 실제 단어를 의미한다. 예를 들어, 질의가 "주걸륜의 노래를 듣고 싶다"이다. 슬롯이 "가수=주걸륜"이다. 결합 모델은 의도 식별과 슬롯 식별의 결합 학습을 수행하는 것을 의미한다. 사용자가 질의를 입력할 때, 이 질의에서 원하는 의도 정보와 슬롯 정보는 단말기에 의해 실행되는 작업 로직을 이용하여 획득된다. 작업 논리는 블랙 박스와 유사하며, 사용자는 질의를 입력할 필요가 있을 뿐이다. 이해 가능한 예는 다음과 같다. 예를 들어 질의의 의도가 분명히 슬롯을 갖는 의도에 있기 때문에, 이 질의가 "주걸륜의 노래를 듣고 싶다"이다. 동일한 모듈에서 의도 식별과 슬롯 식별의 2개의 태스크가 구현되고, 머신 러닝이 2개의 태스크 사이의 강한 연관관계를 이용하여 수행된다. 1). "주걸륜의 노래를 듣고 싶다"라는 질의에 대해 슬롯 식별이 수행된 후, 파싱을 통해 슬롯("가수 = 주걸륜")이 획득될 수 있으며, 이때 질의 의도는 아마도 음악일 수 있다. 2). "주걸륜의 노래를 듣고 싶다"라는 질의에 대해 의도 식별을 수행한 후에는, 질의 의도가 음악이라고 결정될 수 있으며, 이때 슬롯 식별 동안 음악에 특화된 슬롯에서만 구문 분석이 수행될 필요가 있다. 슬롯에 대한 후보 범위가 효과적으로 좁아짐으로써 정확도와 효율성이 향상된다는 장점이 있다.

의도와 슬롯의 측면에서, AI의 자연어 이해는 화자의 의도를 식별하고 자연어 질의로부터 의미 구조를 추출하는 것을 포함한다. 2개의 태스크를 일반적으로 의도 식별과 슬롯 채움(slot filling)이라고 한다. 의도 식별(또는 의도 추론)이 의미 표현의 분류의 쟁점이라고 이해할 수 있다. 예를 들어, 분류 방법이 SVM(support vector machine)과 심층 신경망을 포함한다. 슬롯 채움이 시퀀스 레이블링 작업이라고 이해할 수 있다. 시퀀스 레이블링을 위한 방법이 최대 엔트로피 마르코프 모델(maximum entropy Markov model, MEMM), 조건부 랜덤 필드(conditional random field, CRF), 및 순환 신경망(recurrent neural network, RNN) 등을 포함한다.

일 예에서, 단말기의 동작 로직은 일반적으로 정보를 수집하는 것; 레이블링하는 것(의도 레이블링과 슬롯 레이블링 포함하고 있음); 보조 특징을 추출하는 것(사전은 인위적으로 구축됨); 자동으로 특징것(바람직하게는 RNN 모델 알고리즘)을 추출하는 것; 결합 모델의 목표 함수를 획득하기 위해, RNN 모델과 보조 특징을 이용하여 결합 모델을 훈련시키는 것을 포함한다. 목표 함수는 가능성을 계산하는 데 사용되고, 목표 함수는 무지향성(non-directional) 파라미터(의도 식별을 나타내는 파라미터와 슬롯 식별을 나타내는 파라미터)를 포함한다. 이러한 파라미터는 학습되고 테스트되며, 가장 큰 가능성에 도달할 때, 현재의 파라미터가 상수(상수라고 함)로 간주될 수 있다. 그 후, 입력된 질의(예를 들어, X로 표시됨)가 연산 로직에서 변수로 사용되고, 이 질의에서 만료된 의도 정보와 슬롯 정보가 상수 1(예를 들어, 파라미터 A로 표시된 의도 식별을 나타내는 파라미터) 및/또는 상수 2(예를 들어, 파라미터 B로 표시된 슬롯 식별을 나타내는 파라미터)를 이용하여 획득될 수 있다. 따라서, 사용자에 의해 입력된 질의에 따라, 전술한 처리 로직에 기초하여, 사용자가 중간 처리에 관여할 필요가 없고, 구축된 결합 모델과 구축된 결합 모델의 훈련 결과에 따라 최종 출력 결과("이 질의에서 만료된 의도 정보와 슬롯 정보")가 획득된다. 정보 모델이 구성되어 검색 범위를 좁힐 수 있으며 또한 과도한 시간 낭비가 방지될 수 있다. 사용자에게는 구성된 정보 모델이 투명하고, 사용자가 질의를 입력한 후에만 원하는 답변을 빠르게 얻을 수 있다. 또한, 이 답변은 정확도가 높고, 사용자 요구사항을 가장 많이 만족하고 또한 가능성이 가장 높은 피드백 정보이므로 사람-컴퓨터 상호작용의 전체적인 효과가 향상될 수 있다.

일 실시예에서, 제1 정보를 수집하는 단계는, 1) 제1 정보를 로컬에서 수집하는 단계 - 제1 정보는 실제의 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용으로부터 유래한 것임 -; 및 2) 네트워크 측으로부터 제1 정보를 수집하고, 제1 정보를 선별(screen)하여 목표 정보를 획득하는 단계 - 목표 정보는 거의 실제 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용을 나타내는 데 사용됨 - 를 포함한다. 2가지 방법 중 하나 또는 둘 다가 사용될 수 있다. 제1 정보가 수집된 후에, 제1 정보 및/또는 목표 정보로 구성된 제1 정보 소스가 생성된다. 여기서, 결합 모델을 생성하는 것과 결합 모델을 훈련시키는 것은 모두 제1 소스에서의 많은 정보를 필요로 한다.

결합된 모델을 생성하는 이유는? 이를 위해, 다음의 설명을 위한 예로 스마트 스피커 시스템이 사용된다.

스마트 스피커 시스템이 질의에서 의도를 정확하게 식별할 수 있는 것이 질의 분석의 핵심이고, 스마트 스피커 시스템이 전체 시스템 중 핵심 모듈이다. 별도의 모듈에서 의도 식별과 슬롯 식별이 처리되는 경우, 즉 2개의 다른 모듈에서 의도 식별 태스크와 슬롯 식별 태스크가 개별적으로 처리되는 경우, 의도 식별과 슬롯 식별의 가능한 연관관계가 무시된다. 하지만, 실제 적용에 있어서, 의도 식별과 슬롯 식별 사이에는 강한 연관관계가 있다. 의도 식별과 슬롯 식별의 2개의 태스크가 많은 기능을 공유하고, 하나의 태스크의 결과가 또한 다른 작업에 대한 강한 보조 특징이다. 슬롯 식별을 통해 질의가 슬롯을 가지고 있다고 결정되면, 질의의 의도가 명확히 슬롯을 가진 의도이다. 예를 들어, 질의가 "왕페이의 노래 A를 듣고 싶다"이다. 슬롯 식별 후에, 파싱을 통해 슬롯("가수 = 왕페이")과 슬롯("노래 = A")를 얻을 수 있다. 이때, 질의의 의도가 아마도 음악일 것이다. 또한, "왕페이의 노래 A를 듣고 싶다"에 대해 의도 식별이 수행된 후에, 질의의 의도가 음악이라고 결정될 수 있으며, 이때, 슬롯에 대한 후보 범위가 효과적으로 줄어들 수 있도록, 슬롯 식별 중에 음악에 특화된 슬롯에서 파싱이 수행될 필요가 있다. 따라서, 의도 식별과 슬롯 식별 사이의 강한 연관관계로 인해, 본 실시예에서, 2개의 태스크가 2개의 다른 모듈에서 개별적으로 실행되는 대신 동일한 모듈에서 실행될 수 있다. 의도 식별과 슬롯 식별의 결합 학습은 구축된 결합 모델을 이용하여 달성된다. 의도 식별과 슬롯 식별 사이의 강한 연관관계가 완전히 활용되기 때문에, 스마트 스피커 시스템 의도에 의한 의도 식별과 슬롯 식별의 정확도가 향상되어 인간-컴퓨터 상호작용의 전체적인 효과를 개선한다.

정보 수집의 예에서, 단말기가 스마트 스피커라는 것이 예로서 사용되며, 수집된 제1 정보가 구체적으로 질의이다. 이 질의는 스마트 스피커 제품에 출현할 수 있는 질의와 가능한 한 일관성이 있어야 한다. 질의는 주로 2개의 소스가 있다. 1) 제1 유형의 데이터가 스피커 로그에 있는 질의다. 실제 시나리오에서 이 질의 부분이 사용자와 스피커 사이의 대화 중 하나이다. 따라서, 이 질의 부분이 스피커의 실제 시나리오를 가장 잘 반영하는 부분이다. 이 질의 부분이 사용자 요구사항을 가장 많이 만족한다. 하지만, 사용자 수가 상대적으로 적으면, 사용자가 실제 인간-컴퓨터 상호작용 환경에서 비교적 적은 대화 내용을 획득한다. 이 경우, 이 질의 부분이 의도 식별과 슬롯 식별 모델의 훈련 요구사항을 만족할 수 없다. 2) 로컬 스피커 로그의 질의와는 달리, 제2 유형의 데이터가 네트워크 측으로부터 수집되고, 네트워크 서버가 제2 유형의 데이터의 데이터 제공자 역할을 한다. 예를 들어, 일부 공식 계정에 있는 로그의 질의가 사용된다. 많은 공식 계정이 있으며, 대부분의 공식 계정이 운용 시간이 길다. 따라서, 데이터량에 있어서 의도 식별과 슬롯 식별 모델의 훈련 요건이 만족될 수 있도록, 데이터량이 꽤 많다. 따라서, 많은 질의가 공식 계정으로부터 추출되어 제1 데이터를 보완할 수 있다. 공식 계정에 있는 질의가 스마트 스피커의 기술 분야에서 비교적 넓은 범위를 다루고 있으므로, 공식 계정에 있는 모든 질의가 스피커의 질의로 사용하기에 적합하지는 않다. 즉, 데이터량이 보장되기는 하지만, 정확도(사용자 요구사항을 만족하는지 여부)가 보장될 수 없으며, 공식 계정의 질의가 추가로 선별될 필요가 있다.

공식 계정의 질의를 선별하는 예에서, 질의가 문장의 길이(문장에 포함된 문자 수) 및 문장에 한자가 포함되는지 여부와 같은 정보에 따라 먼저 사전 필터링되고, 문장 길이가 3보다 작은 질의 또는 문장 길이가 30보다 큰 질의가 제거되고, 한자가 없는 문장이 제거된다. 그런 다음, 기존 분류자를 이용하여 이러한 질의에 대해 의도 분류가 수행된다. 마지막으로, 음악, 날씨, 및 리마인더와 같은 스피커의 기능의 범주와 일치하는 질의가 선별된다.

일 실시예에서, 제1 데이터와 제2 데이터를 선별하여 획득되는 데이터가 획득된 후에, 혼합 모델을 훈련시키기 위한 후속 실시예에서 사용되는 질의 데이터 세트, 즉 전술한 실시예에서 언급된 "제1 정보 소스"를 형성하기 위해 2개의 데이터 부분에 있는 질의가 혼합된다.

의도 식별 태스크와 슬롯 태스크는 직렬 처리 메커니즘의 태스크 실행 정책에 따라, 즉 태스크에 대한 직렬 처리 정책에 따라, 제1 정보에 대해 의도 식별 태스크가 먼저 실행되고, 그런 다음 슬롯 식별 태스크가 실행된다. 또한, 이러한 태스크가 태스크에 대한 병렬 처리 정책에 따라 추가로 실행될 수 있다. 즉, 슬롯 식별 태스크가 제1 정보에 대해 병렬 방식으로 실행되고, 의도 식별이 제1 정보에 대해 수행된다.

본 발명의 실시예는 정보 처리 방법을 제공한다. 병렬 처리 메커니즘을 이용하여 처리를 수행하는 적용 시나리오에서, 단말기에 의해 정보 처리 방법이 수행되고, 단말기는 하나 이상의 프로세서와 메모리, 및 하나 이상의 컴퓨터 프로그램을 포함하며, 하나 이상의 프로세서는 컴퓨터 프로그램을 실행하도록 구성되고; 정보 처리 방법은, 제1 정보를 수집하는 단계; 제1 정보에 대해 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하는 단계; 제1 정보에 대해 의도 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하는 단계; 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하는 단계; 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하는 단계; 의도 식별 파라미터와 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델을 생성하는 단계; 제1 정보로부터 제1 특징을 추출하는 단계; 제1 정보로부터 제2 특징을 추출하는 단계; 의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 제1 특징과 제2 특징에 따라 제1 결합 모델을 훈련시키고, 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하는 단계; 및 제1 목표 파라미터와 제2 목표 파라미터에 따라 제2 결합 모델을 구축하는 단계를 포함한다.

일 실시예에서, 의도 식별 태스크가 실행될 때, 처리될 대상(예를 들어, 질의)이 제1 정보 소스로부터 추출될 수 있고, 의도 식별을 위해 처리될 대상에 대해 제1 데이터 레이블링이 수행될 수 있다. 제1 데이터 레이블링의 결과에 대해 샘플링 검출이 수행되고, 검출 결과의 정확도가 제1 임계값보다 크면 제1 레이블링 결과가 목표 요구사항을 만족한다고 결정한다. 특히, 질의 데이터 세트를 형성하기 위해 2개의 질의 부분이 혼합될 수 있다. 질의 데이터 세트가 추출된 후에, 데이터 레이블링 작업이 시작된다. 데이터 레이블링 작업은 2단계로 수행된다. 먼저, 아웃소싱 담당자에게 질의의 레이블링 의도를 질문하거나, 또는 단말기가 레이블링을 로컬에서 수행한다. 레이블링된 데이터는 배치(batch)로 분산된다. 각각의 배치의 데이터가 반환된 후에, 샘플링 검사가 수행된다. 레이블링 결과를 테스트하기 위해 이들 중 200개가 무작위로 선택된다. 200개의 레이블링된 데이터의 레이블링 정확도가 95%보다 크면, 데이터가 자격을 갖추었다고 결정되고, 다음 배치의 데이터가 제공된다. 그렇지 않으면, 데이터가 자격을 갖추지 못하면, 아웃소싱 담당자는 데이터의 정확도가 95%를 초과할 때까지 데이터를 다시 레이블링하도록 요청된다.

일 실시예에서, 슬롯 식별 태스크가 실행될 때, 처리될 대상(예를 들어, 질의)이 제1 정보 소스로부터 추출될 수 있고, 의도 식별을 위해, 처리될 대상에 대해 제1 데이터 레이블링이 수행될 수 있다. 이 레이블링은 샘플링 테스트가 없는 레이블링 결과 및/또는 레이블링 결과 후에 획득되고 또한 목표 요구사항을 만족하는 레이블링 결과를 포함한다. 처리될 대상이 제1 레이블링에 따라 분류된 후에, 상이한 의도를 나타내는 적어도 하나의 분류 결과가 존재한다. 대응하는 슬롯 식별을 위한 적어도 하나의 분류 결과에 따라 제2 데이터 레이블링이 수행된다. 예를 들어, 질의 의도 분류의 결과에 따라, 상이한 의도의 질의가 상이한 슬롯 표준에 따라 마킹(mark)된다. 제2 데이터 레이블링의 결과에 대해 샘플링 검출이 수행되고, 검출 결과의 정확도가 제2 임계값보다 크면 제2 레이블링 결과가 목표 요구사항을 만족한다고 결정된다.

슬롯 레이블링의 예에서, 질의의 의도 레이블링이 완료된 후에 질의에 대해 슬롯 레이블링이 수행된다. 서로 다른 의도를 가진 질의의 슬롯들도 서로 다르다. 예를 들어, 음악 의도를 가진 질의에는 "가수 이름"과 "노래 이름"과 같은 슬롯이 있지만 "시간" 또는 "장소"와 같은 슬롯은 없다. 리마인더(reminder) 의도를 가진 질의에는 "시간" 및 "위치"와 같은 슬롯이 있지만 "가수 이름"과 "노래 이름"과 같은 슬롯은 없다. 따라서, 슬롯 레이블링의 경우, 상이한 슬롯 표준에 기반한 질의 분류의 결과에 따라 상이한 의도를 가진 질의에 대해 레이블링이 수행된다. 슬롯 레이블링이 여전히 배치(batch)로 수행된다. 아웃소싱 담당자에게 질의의 슬롯을 마킹하도록 요청하거나, 또는 단말기가 레이블링을 로컬에서 수행합니다. 각각의 배치의 질의에 대해, 레이블링 품질도 샘플링 검출을 통해 검출된다. 자격 비율이 90%일 수 있고, 자격이 없는 레이블 데이터가 다시 레이블링될 필요가 있다.

일 실시예에서, 질의의 데이터 수집 및 레이블링의 흐름도가 도 4에 도시되어 있고, 다음의 단계를 포함한다.

단계 301. 오디오 로그로부터 질의를 추출한다.

단계 302. 공식 계정의 로그로부터 질의를 추출한다.

단계 303. 질의를 선별한다.

단계 302와 단계 303과 단계 301의 순서를 바꿔도 무관하다.

단계 304. 데이터를 결합한다.

단계 305. 의도를 레이블링한다.

단계 306. 슬롯을 레이블링한다.

이 실시예에서, 동일한 모듈에서 의도 식별과 슬롯 식별이 처리되고, 2개의 태스크에 대해 결합 학습 및 훈련이 수행됨으로써, 2개의 태스크의 특징 속성들 사이의 연관관계에 기초하여 얻어지는 결합 모델을 획득한다. 결합 학습 및 훈련의 과정에서, 이 해결책은 질의 분석, 특히 질의의 의도 식별과 슬롯 식별을 크게 촉진하여 의도 식별과 슬롯 식별의 정확도를 개선한다. 이 해결책의 작업이 매우 단순하다. 이 해결책은 블랙 박스로 간주될 수 있다. 질의가 입력되는 한, 이 방법은 질의의 의도 정보와 슬롯 정보를 제공할 수 있다.

일 실시예에서, 의도 식별 과정이 분류 태스크로 간주될 수 있고, 슬롯 식별 태스크는 시퀀스 레이블링 태스크로 간주될 수 있다. 결합 학습을 위한 심층 학습 기술을 이용하여 2개의 태스크가 결합된다. 의도 모듈의 태스크와 슬롯 모듈의 태스크가 다르기 때문에 목표 기능도 다르다. 따라서, 2개의 모듈이 직접 결합될 수 없다. 이 실시예에서, 2개의 모듈이 효과적으로 결합될 수 있고, 개별 모듈에서 의도 식별과 슬롯 식별이 처리되면 결합 모델의 효과(모델의 정확도)가 2개의 개별 모듈의 효과보다 훨씬 우수하다. 의도 식별이 질의 분류로 간주될 수 있다. 현재, 대부분의 슬롯 분석 기술은 직렬 레이블링을 사용하는 것이다. 이 방식에서, 문장의 각각의 단어가 레이블링되고, 이 레이블은 단어가 슬롯에 있는지 여부를 나타내고, 그런 다음 단어의 레이블을 이용하여 질의의 슬롯이 검색될 수 있다. 레이블링 방식의 개략도가 도 5에 도시되어 있다. 개별 모듈에서 의도 식별과 슬롯 식별을 처리하는 것과 비교하여, 본 실시예에서, 의도 식별과 슬롯 식별 사이의 연관관계가 완전히 활용되어 최종적으로 의도 식별과 슬롯 식별의 정확도가 크게 개선된다는 것을 알 수 있다.

일 실시예에서, 결합 모델의 심층 학습을 위한 제1 특징을 제1 정보로부터 추출하는 것은, 처리될 대상(예를 들어, 질의)를 제1 정보 소스로부터 추출하고, 처리될 대상에 대한 슬롯 특징 단어 데이터베이스(예를 들어, 슬롯 특징 단어표)를 구축하는 단계; 및 처리될 대상 내의 지정된 대상(예를 들어, 가수 이름 또는 노래 이름과 같은 특정한 질의)를 슬롯 특징 단어 데이터베이스와 어휘 일치 방식(lexicon matching manner)으로 비교하고, 지정된 대상 내의 가능한 모든 슬롯 정보를 검색하는 단계를 포함한다. 슬롯 정보는 제1 특징을 나타내는 데 사용된다. 또한, 제1 정보로부터 결합 모델의 심층 학습을 위한 제2 특징을 추출하는 것은, 검색된 슬롯 정보를 슬롯 벡터로서 표현하는 단계; 및 슬롯 벡터를 변종 RNN(LSTM)에 매핑하고, LSTM과의 융합 후에, 처리될 대상의 심층 특징을 추출하여 제2 특징을 획득하는 것을 포함한다.

특징 추출의 예에서, 질의의 보조 특징이 추출된다. 보조 특징은 인공적으로 구성된 일부 특징을 지칭한다. 질의의 의도와 슬롯을 식별하는 방법은 심층 학습 기술을 이용하여 질의의 심층 특징을 자동으로 추출하고, 그런 다음 의도 식별과 슬롯 식별을 수행하는 것일 수 있다. 하지만, 인위적으로 추출된 일부 보조 특징은 질의의 의도 식별과 슬롯 식별에 중요한 역할을 할 수 있다. 보조 특징 추출은 3개의 단계를 포함한다. 먼저, 슬롯 특징 단어표가 구축된다. 본 명세서에서, 슬롯 특징 단어표는 슬롯에 대응하는 단어의 세트를 지칭한다. 예를 들어, 슬롯("노래 이름")의 특징 단어표가 모든 노래 이름의 목록이다. 단어표를 구축하는 2가지 방법이 있다. 첫 번째 방식에서, 로컬 내부 자원을 이용하여 단어표가 구축된다. 예를 들어, 노래 이름, 가수 이름, 및 노래 유형과 같은 슬롯에 대한 단어표가 내부 음악 애플리케이션 데이터베이스로부터 획득된다. 두 번째 방식에서, 네트워크 데이터를 이용하여 단어표가 구축된다. 예를 들어, 장소 이름, 및 기관 이름 등이 인터넷에서 수집(crawl)되어 슬롯에 대한 대응하는 단어표를 구축한다. 둘째, 특정한 질의에 대해, 질의에 포함된 가능한 모든 슬롯 정보가 사전 일치(dictionary matching)를 통해 검색된다. 마지막으로, 슬롯 정보가 표현된다. 슬롯 정보의 표현을 위해, 벡터를 이용하여 슬롯 정보가 표현될 수 있다. 특히, 슬롯 정보가 슬롯 벡터로서 표현된다. 각각의 문자는 자체의 슬롯 벡터를 가지고 있다. 벡터의 길이가 슬롯 개수의 합이다. 질의에 있는 문자가 슬롯 특징 표에 있는 단어의 문자이면, 문자의 슬롯 벡터에 있는 슬롯의 값이 1이고, 그렇지 않으면 0이다. 예를 들어 2개의 슬롯("가수 이름"과 "노래 이름")이 있다고 가정한다. 표 1은 가수 이름과 노래 이름의 특징 단어 표를 나타낸다.

(표 1)

"주걸륜의 도향을 듣고 싶다"라는 질의의 경우, 표 2는 각각의 문자에 대한 슬롯 벡터를 나타낸다.

(표 2)

도 6은 질의에 대한 보조 특징 추출의 흐름도를 도시하고 있다. 이 흐름도는 다음 단계를 포함한다.

단계 401. 슬롯 특징 단어표를 구축한다.

단계 402. 사전 매칭을 수행한다.

단계 403. 슬롯 특징을 표현한다

RNN 모델과 보조 특징을 이용하여 결합 모델이 훈련된다. 공식 (1)은 결합 모델의 목표 함수를 나타낸다.

L은 가능성이 가장 큰 작업을 설명하는 데 사용되는 목표 함수를 나타내고, x는 입력된 질의 나타내며, y는 질의의 의도를 나타내고, I는 질의의 슬롯 시퀀스를 나타내며,

는 의도 식별의 중요도 계수를 나타낸다.

가 크다는 것은 시스템 내에서 의도 식별의 중요도가 높다는 것을 나타낸다. 반대로,

가 작다는 것은 슬롯 식별이 더 중요하다는 것을 나타낸다. 이 질의의 심층 특징 추출 부분에는 LSTM이 적용될 수 있다. 심층 특징이 추출되는 동안, 보조 특징이 벡터에 매핑되어 모델에 통합된다. 구체적인 모델 프레임이 도 7에 도시되어 있다. 도 7에 도시된 바와 같이, 질의에 있는 각각의 단어가 먼저 단어 벡터에 매핑된다(Embedding). 그런 다음, 변종 RNN(Bi-LSTM)을 이용하여 문장의 심층 특징(Hidden Vector)이 추출된다. 그런 다음, 보조 특징과 심층 특징이 결합된다. 결합 특징을 이용하여 다음의 분류가 수행될 수 있다. 먼저, 슬롯 식별을 위해, 직렬화된 레이블링 방식이 사용될 수 있다. 즉, 각각의 범주가 범주 레이블로 표시된다. 둘째, 의도 식별을 위해, 분류 방식이 사용될 수 있다. 즉, 전체 문장이 범주 레이블로 표시된다. 여기서, 전체 문장이 레이블링될 때, 단어의 결합된 특징 벡터들이 합의 평균화를 통해 문장의 결합된 특징 벡터에 결합되고, 그런 다음 결합된 특징 벡터를 이용하여 분류가 수행된다. 그 후, 레이블링된 데이터를 이용하여 모델이 학습될 수 있다. 훈련 과정에서, 전술한 목표 함수가 극대화되고, 의도 식별과 슬롯 식별의 정확도가 높아지며, 처리 효율이 빨라질 수 있도록, 모델 파라미터들이 주로 기울기 하강 방식(gradient descent manner)으로 갱신된다.

특징 추출이 수행되고, 특징 추출에 따라 조합 모델이 훈련된 후, 훈련된 모델 파라미터가 획득된다. 모델 파라미터가 훈련된 후에, 이 모델이 질의에 대해 의도 식별과 슬롯 식별을 수행하는 데 사용될 수 있다. 먼저, 구축된 슬롯 특징 단어표를 이용하여 질의에 대해 보조 특징 추출이 수행될 필요가 있고, 그런 다음 문장의 의도의 확률 분포와 각각의 워드의 슬롯 라벨의 확률 분포가 획득될 수 있도록 보조 특징과 질의가 미리 훈련된 모델에 함께 입력된다. 문장의 의도 정보와 슬롯 정보를 얻기 위해 최대 확률이 선택된다.

본 실시예에서, 의도와 슬롯의 결합된 학습을 통해, 의도와 슬롯의 존재를 결정하는 데 있어서의 높은 정확도가 달성될 수 있다. 실제 적용에서, 의도와 슬롯의 정확도가 85% 이상에 도달할 수 있다. 본 실시예는 스마트 스피커 시스템의 시스템에 잘 통합되어 스마트 스피커의 응답의 전반적인 효과를 효과적으로 개선할 수 있다. 본 실시예에서, 스피커가 더 짧은 시간 내에 응답할 수 있도록 시스템의 실행 시간도 효과적으로 줄어듬으로써, 인간-컴퓨터 상호작용의 전반적인 처리 효율이 개선될 수 있다.

스마트 단말기가 스마트 스피커인 시나리오에 적용되는 것 외에, 본 실시예가 인간-컴퓨터 상호작용을 위한 다른 AI 분야에 추가로 적용될 수 있다. 스마트 스피커의 경우, RNN을 이용해서만 문장과 단어의 심층 기능이 추출된다. 다른 AI 분야에서, 다른 방식이 사용될 수 있다. 예를 들어, 컨볼루션 신경망(convolutional neural network, CNN)과 같은 다른 심층 신경망을 이용하여 문장과 단어의 심층 특징이 추출될 수 있다.

본 발명의 구현예에서, 다른 AI 분야에서, 모델 훈련에 사용되는 공식 (2)와 같은 다른 목표 함수가 사용될 수도 있다. 이 방식은 의도를 먼저 예측하고 나서 슬롯을 예측하는 것으로 간주될 수 있지만, 의도의 예측 구조가 슬롯을 예측하는 데 사용된다. 이와 같이, 의도와 슬롯 사이의 연관관계가 사용될 수도 있다. 구체적인 목표 함수가 다음과 같다.

L은 가장 가능성이 큰 작업을 설명하는 데 사용되는 목표 함수를 나타내고, x는 입력된 질의를 나타내며, y는 질의의 의도를 나타내고, I는 질의의 슬롯 시퀀스를 나타낸다.

도 8에 도시된 바와 같이, 본 발명의 일 실시예는 정보 처리 시스템을 제공한다. 정보 처리 시스템은 단말기(51)와 서버(52)를 포함하고, 서버(52)는 단말기에 정보를 제공하기 위한 정보 소스의 역할을 한다. 처리 로직이 단말기(51) 상에서 수행되며, 단말기는 제1 정보를 수집하도록 구성된 수집 유닛(511); 제1 정보에 대해 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하도록 구성된 제1 태스크 실행 유닛(512); 의도 식별 처리 결과에 따라 슬롯 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하도록 구성된 제2 태스크 실행 유닛(513); 및 슬롯 식별 처리 결과에 따라 목표 결과를 출력하도록 구성된 출력 유닛(514)을 포함한다.

일 구현예에서, 단말기는, 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하도록 구성된 제1 파싱 유닛; 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하도록 구성된 제2 파싱 유닛; 의도 식별 파라미터와 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델을 생성하도록 구성된 제1 모델 구축 유닛; 제1 정보로부터 제1 특징(예를 들어, 보조 특징)을 추출하도록 구성된 제1 추출 유닛; 제1 정보로부터 제2 특징(예를 들어, RNN을 이용하여 획득된 심층 특징)을 추출하도록 구성된 제2 추출 유닛; 의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 제1 특징과 제2 특징에 따라 제1 결합 모델을 훈련시키고, 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하도록 구성된 제3 추출 유닛 - 이때, 결합 학습을 통해 획득되는, 제1 파라미터에 대응하는 제1 목표 파라미터와 제2 파라미터에 대응하는 제2 목표 파라미터는 상수로 간주될 수 있음 -; 및 제1 목표 파라미터와 제2 목표 파라미터에 따라 제2 결합 모델을 구축하도록 구성된 제2 모델 구축 유닛을 더 포함한다.

일 구현예에서, 단말기는 제2 정보를 획득하도록 구성된 획득 유닛; 및 피드백 정보를 획득하기 위해, 제2 결합 모델에 따라 제2 정보에 대한 피드백 응답을 제공하도록 구성된 피드백 유닛을 포함한다. 제2 정보는 전술한 제1 정보와 다르고, 제2 정보는 사용자에 의해 실시간으로 제시되는 질의이다. 제1 정보는 수많은 질의 데이터를 포함하고, 모델링에 사용된다.

일 구현예에서, 수집 유닛은 추가적으로, 제1 정보를 로컬에서 수집하거나 - 여기서, 제1 정보는 실제 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용으로부터 유래한 것임 -; 및/또는 네트워크 측으로부터 제1 정보를 수집하고, 제1 정보를 선별하여 목표 정보를 획득하도록 구성된다. 여기서, 목표 정보는 거의 실제 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용을 나타내는 데 사용된다.

일 구현예에서, 단말기는 생성 유닛을 더 포함하고, 상기 생성 유닛은 제1 정보가 수집된 후에 제1 정보 및/또는 목표 정보로 구성된 제1 정보 소스를 생성하도록 구성된다.

일 구현예에서, 제1 태스크 실행 유닛은 추가적으로, 처리될 대상을 제1 정보 소스로부터 추출하고; 처리될 대상에 대해, 의도 식별을 위한 제1 데이터 레이블링을 수행하며; 제1 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하고, 검출 결과의 정확도가 제1 임계값보다 크면, 제1 레이블링 결과가 목표 요구 사항을 만족한다고 결정하며; 상이한 의도를 나타내는 적어도 하나의 분류 결과를 획득하기 위해, 제1 레이블링 결과에 따라 처리될 대상을 분류하고, 적어도 하나의 분류 결과를 의도 식별 처리 결과로 결정하도록 구성된다.

일 구현예에서, 제2 태스크 실행 유닛은, 적어도 하나의 분류 결과에 따라, 대응하는 슬롯 식별을 위한 제2 데이터 레이블링을 수행하고; 제2 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하며, 검출 결과의 정확도가 제2 임계값보다 크면 제2 레이블링 결과가 목표 요구사항을 만족한다고 결정하고; 제2 레이블링 결과를 슬롯 식별 처리 결과로 결정하도록 구성된다.

일 구현예에서, 제1 추출 유닛은 추가적으로, 처리될 대상을 제1 정보 소스로부터 추출하고, 처리될 대상에 대한 슬롯 특징 단어 데이터베이스를 구성하고; 처리될 대상 내의 지정된 대상을 슬롯 특징 단어 데이터베이스와 어휘 일치 방식으로 비교하고, 지정된 대상에 포함된 가능한 모든 슬롯 정보를 검색하도록 구성된다. 슬롯 정보는 제 1 특징을 나타내는 데 사용된다.

일 구현예에서, 제2 추출 유닛은 추가적으로, 검색된 슬롯 정보를 슬롯 벡터로서 표현하고; 슬롯 벡터를 LSTM에 매핑하고, LSTM과의 융합 후에, 처리될 대상의 심층적 특징을 추출하여 제2 특징을 획득하도록 구성된다.

본 발명의 실시예는 정보 처리 시스템을 제공하며, 정보 처리 시스템 내의 단말기가, 제1 정보를 수집하도록 구성된 수집 유닛; 제1 정보에 대해 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하도록 구성된 제1 태스크 실행 유닛; 의도 식별 처리 결과에 따라 슬롯 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하도록 구성된 제2 태스크 실행 유닛; 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하도록 구성된 제1 파싱 유닛; 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하도록 구성된 제2 파싱 유닛; 의도 식별 파라미터와 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델을 생성하도록 구성된 제1 모델 구축 유닛; 제1 정보로부터 제1 특징을 추출하도록 구성된 제1 추출 유닛; 제1 정보로부터 제2 특징을 추출하도록 구성된 제2 추출 유닛; 의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 제1 특징과 제2 특징에 따라 제1 결합 모델을 훈련시키고, 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하도록 구성된 제3 추출 유닛; 및 제1 목표 파라미터와 제2 목표 파라미터에 따라 제2 결합 모델을 구축하도록 구성된 제2 모델 구축 유닛을 포함한다.

본 발명의 실시예는 단말기를 제공한다. 단말기는 프로세서 상에서 실행될 수 있는 컴퓨터 프로그램을 저장하도록 구성된 메모리, 및 프로세서를 포함한다. 컴퓨터 프로그램이 실행될 때 프로세서는,

제1 정보를 수집하는 단계;

제1 정보에 대해 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하는 단계;

의도 식별 처리 결과에 따라 슬롯 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하는 단계; 및

슬롯 식별 처리 결과에 따라 목표 결과를 출력하는 단계를 수행하도록 구성된다.

일 실시예에서, 컴퓨터 프로그램이 실행될 때, 프로세서는 추가적으로,

의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하는 단계;

슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하는 단계;

의도 식별 파라미터와 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델을 생성하는 단계;

제1 정보로부터 제1 특징을 추출하는 단계;

제1 정보로부터 제2 특징을 추출하는 단계;

의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 제1 특징과 제2 특징에 따라 제1 결합 모델을 훈련시키고, 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하는 단계; 및

제1 목표 파라미터와 제2 목표 파라미터에 따라 제2 결합 모델을 구축하는 단계를 수행하도록 구성된다.

제2 정보를 획득하는 단계; 및

피드백 정보를 획득하기 위해, 제2 결합 모델에 따라 제2 정보에 대한 피드백 응답을 제공하는 단계를 수행하도록 구성된다.

제1 정보를 로컬에서 수집하는 단계 - 제1 정보는 실제의 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용에서 유래한 정보임 -; 및/또는

네트워크 측으로부터 제1 정보를 수집하고, 제1 정보를 선별하여 목표 정보를 획득하는 단계를 수행하도록 구성된다. 목표 정보는 거의 실제 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용을 나타내는 데 사용된다.

제1 정보가 수집된 후에, 제1 정보 및/또는 목표 정보로 구성된 제1 정보 소스를 생성하는 단계를 수행하도록 구성된다.

처리될 대상을 제1 정보 소스로부터 추출하는 단계;

처리될 대상에 대해, 의도 식별을 위한 제1 데이터 레이블링을 수행하는 단계;

제1 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하고, 검출 결과의 정확도가 제1 임계값보다 크면 제1 레이블링 결과가 목표 요구사항을 만족한다고 결정하는 단계; 및

제1 레이블링 결과에 따라 처리될 대상을 분류하여 상이한 의도를 나타내는 적어도 하나의 분류 결과를 획득하고, 적어도 하나의 분류 결과를 의도 식별 처리 결과로 결정하는 단계를 수행하도록 구성된다.

적어도 하나의 분류 결과에 따라, 대응하는 슬롯 식별을 위한 제2 데이터 레이블링을 수행하는 단계;

제2 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하고, 검출 결과의 정확도가 제2 임계값보다 크면 제2 레이블링 결과가 목표 요구사항을 만족한다고 결정하는 단계; 및

제2 레이블링 결과를 슬롯 식별 처리 결과로 결정하는 단계를 수행하도록 구성된다.

처리될 대상을 제1 정보 소스로부터 추출하고, 처리될 대상에 대한 슬롯 특징 단어 데이터베이스를 구축하는 단계; 및

처리될 대상 내의 지정된 객체를 슬롯 특징 단어 데이터베이스와 어휘 일치 방식으로 비교하고, 지정된 객체에 포함된 가능한 모든 슬롯 정보를 검색하는 단계를 수행하도록 구성된다. 슬롯 정보는 제1 특징을 나타내는 데 사용된다.

검색된 슬롯 정보를 슬롯 벡터로서 표현하는 단계; 및

슬롯 벡터를 LSTM에 매핑하고, 제2 특징을 획득하기 위해, LSTM과의 융합 후에, 처리될 대상의 심층 특징을 추출하는 단계를 수행하도록 구성된다.

제1 정보를 수집하는 단계;

제1 정보에 대해 의도 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하는 단계;

제1 정보로부터 제1 특징을 추출하는 단계;

제1 정보로부터 제2 특징을 추출하는 단계;

본 발명의 실시예는 단말기를 제공한다. 도 9에 도시된 바와 같이, 단말기는 프로세서 상에서 실행될 수 있는 컴퓨터 프로그램을 저장하도록 구성된 메모리(61), 및 컴퓨터 프로그램이 실행될 때 전술한 실시예의 정보 처리 방법의 단계를 수행하도록 구성된 프로세서(62)를 포함한다. 단말기는 외부 통신 인터페이스(63)를 더 포함할 수 있으며, 주변장치 통신 인터페이스(peripheral communications interface)(63)는 단말기와 같은 주변 장치와 서버 간의 정보 교환에 사용된다. 특히, 예를 들어, 단말기는 태스크 실행 정책(직렬 처리 또는 병렬 처리)에 따라 제1 정보에 대해 제1 태스크(예컨대, 의도 식별 태스크)와 제2 태스크(예컨대, 슬롯 식별 태스크)를 실행하고, 제1 파라미터(예컨대, 의도 식별 파라미터)와 제2 파라미터(예컨대, 슬롯 식별 파라미터)를 이용하여 제1 결합 모델을 구축하며, 제1 정보로부터, 결합 모델의 심층 학습을 위한 제1 특징(예컨대, 보조 특징)을 추출하고, 제1 정보로부터 결합 모델의 심층 학습을 위한 제2 특징(예컨대, 심층 특징)을 추출하며, 제2 특징과 제1 특징에 따라 제1 결합 모델을 훈련시키고, 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하며, 제1 목표 파라미터와 제2 목표 파라미터로 구성된 새로운 결합 모델(새로운 결합 모델을 제2 결합 모델이라고 함)을 추출하고, 제2 정보를 획득하며, 피드백 정보를 획득하기 위해 제1 목표 파라미터와 제2 목표 파라미터에 따라 제2 정보에 대한 피드백 응답을 제공한다. 단말기는 내부 통신 인터페이스(64)를 더 포함할 수 있고, 내부 통신 인터페이스(64)는 구체적으로 PCI 버스와 같은 버스 인터페이스일 수 있다.

본 명세서에서 단말기와 서버에 대한 전술한 설명은 전술한 정보 처리 방법의 설명과 유사하며, 정보 처리 방법의 유리한 효과와 동일한 유리한 효과에 대해 다시 설명하지 않는다는 것을 유의해야 한다. 본 발명의 단말기 실시예와 서버 실시예에서 개시되지 않은 기술적 세부사항에 대해서는 본 발명의 정보 처리 방법의 과정에서 설명된 실시예의 설명을 참조하라.

본 발명의 실시예는 컴퓨터 판독가능 저장 매체를 제공한다. 컴퓨터 저장 매체는 컴퓨터 프로그램을 저장하고, 컴퓨터 프로그램은 컴퓨터 프로그램이 프로세서에 의해 실행될 때,

제1 정보를 수집하는 단계;

일 실시예에서, 컴퓨터 프로그램은 프로세서에 의해 실행될 때,

제1 정보로부터 제1 특징을 추출하는 단계;

제1 정보로부터 제2 특징을 추출하는 단계;

제2 정보를 획득하는 단계; 및

처리될 대상을 제1 정보 소스로부터 추출하는 단계;

제1 레이블링 결과에 따라, 처리될 대상을 분류하여 상이한 의도를 나타내는 적어도 하나의 분류 결과를 획득하고, 적어도 하나의 분류 결과를 의도 식별 처리 결과로 결정하는 단계를 수행하도록 구성된다.

검색된 슬롯 정보를 슬롯 벡터로서 표현하는 단계; 및

슬롯 벡터를 LSTM에 매핑하고, 제2 특징을 획득하기 위해 LSTM과의 융합 후에 처리될 대상의 심층 특징을 추출하는 단계를 수행하도록 구성된다.

본 발명의 실시예는 컴퓨터 판독가능 저장 매체를 제공한다. 컴퓨터 저장 매체는 컴퓨터 프로그램을 저장하고, 컴퓨터 프로그램이 프로세서에 의해 실행될 때 컴퓨터 프로그램은,

제1 정보를 수집하는 단계;

제1 정보로부터 제1 특징을 추출하는 단계;

제1 정보로부터 제2 특징을 추출하는 단계;

본 출원에서 제공된 여러 실시예에서, 개시된 장치와 방법이 다른 방식으로 구현될 수 있다고 이해해야 한다. 설명된 장치 실시예는 예시적인 것일 뿐이다. 예를 들어, 유닛 분할은 논리적 기능 분할일 뿐이며, 실제 구현 중에 다르게 분할될 수 있다. 예를 들어, 복수의 유닛 또는 구성 요소가 다른 시스템에 결합되거나 또는 통합될 수 있거나, 또는 일부 특징이 무시되거나 또는 수행되지 않을 수 있다. 또한, 구성 요소들 사이에서 표시되거나 논의된 상호 결합 또는 직접 결합 또는 통신 연결은 일부 인터페이스들, 장치들, 또는 유닛들 간의 간접 연결이나 통신 연결을 통해 구현되거나, 또는 전기적 연결, 기계적 연결, 또는 다른 형태의 연결을 통해 구현될 수 있다.

별도의 부분으로 설명된 유닛들이 물리적으로 분리되어 있거나 또는 분리되지 않을 수 있거나, 유닛으로 표시된 부분이 물리적 유닛일 수 있거나 또는 물리적 유닛이 아닐 수 있거나, 또는 하나의 위치에 위치할 수 있거나, 또는 복수의 네트워크 유닛 상에 분산되어 있을 수 있다. 이러한 유닛 중 일부 또는 전부가 실제 필요에 따라 선택되어 실시예의 해결책의 목적을 달성할 수 있다.

또한, 본 발명의 실시예의 기능 유닛들이 모두 하나의 처리 유닛에 통합될 수 있거나, 또는 각각의 유닛이 개별적으로 존재할 수 있거나, 또는 2개 이상의 유닛이 하나의 유닛에 통합될 수 있고, 통합 유닛은 하드웨어 형태일 수 있거나, 또는 소프트웨어 기능 유닛 외에 하드웨어의 형태로 구현될 수 있다.

당업자는 전술한 방법 실시예의 단계 중 전부 또는 일부가 관련 하드웨어에 지시하는 프로그램에 의해 구현될 수 있다고 이해할 수 있을 것이다. 전술한 프로그램은 컴퓨터 판독가능 저장 매체에 저장될 수 있다. 프로그램이 실행될 때, 방법 실시예의 전술한 단계가 수행된다. 전술한 저장 매체는 ROM, RAM, 자기 디스크, 또는 광 디스크와 같은 프로그램 코드를 저장할 수 있는 다양한 매체를 포함한다.

대안적으로, 본 발명의 통합 모듈이 소프트웨어 기능 모듈의 형태로 구현되고 독립적인 제품으로 판매되거나 사용되는 경우, 통합 모듈은 컴퓨터 판독가능 저장 매체에 저장될 수 있다. 이러한 이해에 기초하여, 본 발명의 실시예의 기술적 해결책은 본질적으로, 또는 관련 기술에 기여하는 부분은 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체에 저장되고, 본 발명의 실시예에서 설명된 방법의 전부 또는 일부를 수행하도록 컴퓨터 장치(개인용 컴퓨터, 서버, 또는 네트워크 장치일 수 있음)에 지시하기 위한 여러 명령을 포함한다. 전술한 저장 매체는 프로그램 코드를 저장할 수 있는 임의의 저장 매체, 예를 들어 휴대용 저장 장치, ROM, RAM, 자기 디스크, 또는 광 디스크를 포함한다.

전술한 설명은 본 발명의 구체적인 구현예일 뿐이며, 현재 발명의 보호 범위를 제한하려는 것이 아니다. 당업자가 본 발명에서 개시된 기술적인 보호범위 내에서 즉시 파악할 수 있는 어떠한 변경이나 대체도 본 발명의 보호 범위에 속할 것이다. 따라서, 본 발명의 보호 범위는 청구 범위의 보호 범위에 따른다.

산업상 이용 가능성

본 발명의 실시예에 따르면, 제1 정보가 수집되고, 의도 식별 태스크가 제1 정보에 대해 실행되어 의도 식별 처리 결과를 획득하고, 그런 다음 슬롯 식별 태스크가 의도 식별 처리 결과에 따라 실행되어 슬롯 식별 처리 결과를 획득한다. 이 직렬 처리 메커니즘에서, 의도 식별 태스크와 슬롯 식별 태스크의 2개의 처리 결과의 특징 속성들 간의 연관관계가 활용되어, 슬롯 식별 처리 결과에 따라 목표 결과를 출력할 수 있다. 직렬 처리 메커니즘이 연관관계 효과를 달성할 수 있으므로,검색 범위가 좁아질 수 있고 또한 과도한 시간 낭비가 방지된다. 사용자에게는 처리가 투명하며, 사용자가 질의를 입력한 후에만 원하는 답변을 빠르게 얻을 수 있다. 또한, 사람-컴퓨터 상호작용의 전체적인 효과가 향상될 수 있도록, 이 응답은 정확도가 높고, 사용자 요구사항을 가장 많이 만족하고 또한 가능성이 가장 높은 피드백 정보이다.

Claims

단말기에 의해 수행되는 정보 처리 방법으로서,
상기 정보 처리 방법은 단말기에 의해 수행되고, 상기 단말기는 메모리와 하나 이상의 프로세서, 및 하나 이상의 컴퓨터 프로그램을 포함하고, 상기 하나 이상의 프로세서는 상기 컴퓨터 프로그램을 실행하도록 구성되며;
상기 정보 처리 방법은,
제1 정보를 수집하는 단계;
상기 제1 정보에 대해 의도 식별 태스크(intent identification task)를 실행하여 의도 식별 처리 결과를 획득하는 단계;
상기 의도 식별 처리 결과에 따라 슬롯 식별 태스크(slot identification task)를 실행하여 슬롯 식별 처리 결과를 획득하는 단계; 및
상기 슬롯 식별 처리 결과에 따라 목표 결과를 출력하는 단계
를 포함하는 정보 처리 방법.
제1항에 있어서,
상기 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하는 단계;
상기 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하는 단계;
상기 의도 식별 파라미터와 상기 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델(first combined model)을 생성하는 단계;
상기 제1 정보로부터 제1 특징을 추출하는 단계;
상기 제1 정보로부터 제2 특징을 추출하는 단계;
의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 상기 제1 특징과 상기 제2 특징에 따라 상기 제1 결합 모델을 훈련시키고, 상기 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하는 단계; 및
상기 제1 목표 파라미터와 상기 제2 목표 파라미터에 따라 제2 결합 모델을 구축하는 단계
를 더 포함하는 정보 처리 방법.
제2항에 있어서,
제2 정보를 획득하는 단계; 및
피드백 정보를 획득하기 위해 상기 제2 결합 모델에 따라 상기 제2 정보에 대한 피드백 응답을 제공하는 단계
를 더 포함하는 정보 처리 방법.
제2항 또는 제3항에 있어서,
상기 제1 정보를 수집하는 단계는,
상기 제1 정보를 로컬에서 수집하는 단계 - 상기 제1 정보는 실제 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용으로부터 유래한 것임 -; 및/또는
네트워크 측으로부터 상기 제1 정보를 수집하고, 상기 제1 정보를 선별(screen)하여 목표 정보를 획득하는 단계 - 상기 목표 정보는 거의 실제 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용을 나타내는 데 사용됨 -
를 포함하는, 정보 처리 방법.
제4항에 있어서,
상기 제1 정보가 수집된 후에, 상기 제1 정보 및/또는 상기 목표 정보로 구성된 제1 정보 소스를 생성하는 단계
를 더 포함하는 정보 처리 방법.
제5항에 있어서,
상기 제1 정보에 대해 의도 식별 태스크를 실행하여 의도 식별 처리 결과를 획득하는 단계는,
상기 제1 정보 소스로부터 처리될 대상을 추출하는 단계;
상기 처리될 대상에 대해, 의도 식별을 위한 제1 데이터 레이블링(data labeling)을 수행하는 단계;
상기 제1 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하고, 검출 결과의 정확도가 제1 임계값보다 크면 상기 제1 레이블링 결과가 목표 요구사항을 만족한다고 결정하는 단계; 및
상이한 의도를 나타내는 적어도 하나의 분류 결과를 얻기 위해 상기 제1 레이블링 결과에 따라 상기 처리될 대상을 분류하고, 상기 적어도 하나의 분류 결과를 상기 의도 식별 처리 결과로 결정하는 단계
를 포함하는, 정보 처리 방법.
제6항에 있어서,
상기 의도 식별 처리 결과에 따라 슬롯 식별 태스크를 실행하여 슬롯 식별 처리 결과를 획득하는 단계는,
상기 적어도 하나의 분류 결과에 따라, 대응하는 슬롯 식별을 위한 제2 데이터 레이블링을 수행하는 단계;
상기 제2 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하고, 검출 결과의 정확도가 제2 임계값보다 크면 상기 제2 레이블링 결과가 목표 요구사항을 만족한다고 결정하는 단계; 및
상기 제2 레이블링 결과를 상기 슬롯 식별 처리 결과로 결정하는 단계
를 포함하는, 정보 처리 방법.
제5항에 있어서,
상기 제1 정보로부터 제1 특징을 추출하는 단계는,
상기 제1 정보 소스로부터 처리될 대상을 추출하고, 상기 처리될 대상에 대한 슬롯 특징 단어 데이터베이스(slot feature word database)를 구축하는 단계; 및
상기 처리될 대상 내의 지정된 대상을 상기 슬롯 특징 단어 데이터베이스와 어휘 일치 방식(lexicon matching manner)으로 비교하고, 상기 지정된 대상에 포함된 가능한 모든 슬롯 정보를 검색하는 단계 - 상기 슬롯 정보는 상기 제1 특징을 나타내는 데 사용됨 -
를 포함하는, 정보 처리 방법.
제8항에 있어서,
상기 제1 정보로부터 제2 특징을 추출하는 단계는,
상기 검색된 슬롯 정보를 슬롯 벡터로서 표현하는 단계; 및
상기 제2 특징을 획득하기 위해, 상기 슬롯 벡터를 변종 순환 신경망(recurrent neural network, RNN)에 매핑하고, 상기 변종 RNN과의 융합 후에 상기 처리될 대상의 심층 특징(in-depth feature)을 추출하는 단계
를 포함하는, 정보 처리 방법.
정보 처리 방법으로서,
상기 정보 처리 방법은 단말기에 의해 수행되고, 상기 단말기는 메모리와 하나 이상의 프로세서, 및 하나 이상의 컴퓨터 프로그램을 포함하고, 상기 하나 이상의 프로세서는 상기 컴퓨터 프로그램을 실행하도록 구성되며;
상기 정보 처리 방법은,
제1 정보를 수집하는 단계;
상기 제1 정보에 대해 의도 식별 태스크(intent identification task)를 실행하여 의도 식별 처리 결과를 획득하는 단계;
상기 제1 정보에 대해 의도 식별 태스크를 실행하여 슬롯 식별 처리 결과(slot identification processing result)를 획득하는 단계;
상기 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하는 단계;
상기 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하는 단계;
상기 의도 식별 파라미터와 상기 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델(first combined model)을 생성하는 단계;
상기 제1 정보로부터 제1 특징을 추출하는 단계;
상기 제1 정보로부터 제2 특징을 추출하는 단계;
의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 상기 제1 특징과 상기 제2 특징에 따라 상기 제1 결합 모델을 훈련시키고, 상기 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하는 단계; 및
상기 제1 목표 파라미터와 상기 제2 목표 파라미터에 따라 제2 결합 모델을 구축하는 단계
를 포함하는 정보 처리 방법.
단말기로서,
제1 정보를 수집하도록 구성된 수집 유닛;
상기 제1 정보에 대해 의도 식별 태스크(intent identification task)를 실행하여 의도 식별 처리 결과를 획득하도록 구성된 제1 태스크 실행 유닛;
상기 의도 식별 처리 결과에 따라 슬롯 식별 태스크(slot identification task)를 실행하여 슬롯 식별 처리 결과를 획득하도록 구성된 제2 태스크 실행 유닛; 및
상기 슬롯 식별 처리 결과에 따라 목표 결과를 출력하도록 구성된 출력 유닛
을 포함하는 단말기.
제11항에 있어서,
상기 단말기는,
상기 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하도록 구성된 제1 파싱 유닛;
상기 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하도록 구성된 제2 파싱 유닛;
상기 의도 식별 파라미터와 상기 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델(first combined model)을 생성하도록 구성된 제1 모델 구축 유닛;
상기 제1 정보로부터 제1 특징을 추출하도록 구성된 제1 추출 유닛;
상기 제1 정보로부터 제2 특징을 추출하도록 구성된 제2 추출 유닛;
의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 상기 제1 특징과 상기 제2 특징에 따라 상기 제1 결합 모델을 훈련시키고, 상기 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하도록 구성된 제3 추출 유닛; 및
상기 제1 목표 파라미터와 상기 제2 목표 파라미터에 따라 제2 결합 모델을 구축하도록 구성된 제2 모델 구축 유닛
을 더 포함하는 단말기.
제12항에 있어서,
상기 정보 처리 방법이,
제2 정보를 획득하도록 구성된 획득 유닛; 및
상기 제2 결합 모델에 따라 상기 제2 정보에 대한 피드백 응답을 제공하여 피드백 정보를 획득하도록 구성된 피드백 유닛
을 더 포함하는 단말기.
제12항 또는 제13항에 있어서,
상기 수집 유닛은 추가적으로,
상기 제1 정보를 로컬에서 수집하거나 - 여기서, 상기 제1 정보는 실제의 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용으로부터 유래함 -; 및/또는
네트워크 측으로부터 상기 제1 정보를 수집하고, 상기 제1 정보를 선별(screen)하여 목표 정보를 획득하도록 구성되고, 상기 목표 정보는 거의 실제 인간-컴퓨터 상호작용 환경으로부터 획득되는 대화 내용을 나타내는 데 사용되는, 단말기.
제14항에 있어서,
상기 단말기는,
상기 제1 정보가 수집된 후에, 상기 제1 정보 및/또는 상기 목표 정보로 구성된 제1 정보 소스를 생성하도록 구성된 생성 유닛
을 더 포함하는 단말기.
제15항에 있어서,
상기 제1 태스크 실행 유닛은 추가적으로,
상기 제1 정보 소스로부터 처리될 대상을 추출하고;
상기 처리될 대상에 대해, 의도 식별을 위한 제1 데이터 레이블링(data labeling)을 수행하며;
상기 제1 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하고, 검출 결과의 정확도가 제1 임계값보다 크면 상기 제1 레이블링 결과가 목표 요구사항을 만족한다고 결정하고;
상이한 의도를 나타내는 적어도 하나의 분류 결과를 얻기 위해 상기 제1 레이블링 결과에 따라 상기 처리될 대상을 분류하고, 상기 적어도 하나의 분류 결과를 상기 의도 식별 처리 결과로 결정하도록 구성된, 단말기.
제16항에 있어서,
상기 제2 태스크 실행 유닛은 추가적으로,
상기 적어도 하나의 분류 결과에 따라, 대응하는 슬롯 식별을 위한 제2 데이터 레이블링을 수행하고;
검출 결과의 정확도가 제2 임계값보다 크면 상기 제2 데이터 레이블링의 결과에 대해 샘플링 검출을 수행하고, 상기 제2 레이블링 결과가 목표 요구사항을 만족한다고 결정하며;
상기 제2 레이블링 결과를 상기 슬롯 식별 처리 결과로 결정하도록 구성된, 단말기.
제15항에 있어서,
상기 제1 추출 유닛은 추가적으로,
상기 제1 정보 소스로부터 처리될 대상을 추출하고, 상기 처리될 대상에 대한 슬롯 특징 단어 데이터베이스(slot feature word database)를 구축하며;
상기 처리될 대상 내의 지정된 객체를 상기 슬롯 특징 단어 데이터베이스와 어휘 일치 방식(lexicon matching manner)으로 비교하고, 상기 지정된 대상에 포함된 가능한 모든 슬롯 정보를 검색하도록 구성되고, 상기 슬롯 정보는 상기 제1 특징을 나타내는 데 사용되는, 단말기.
제18항에 있어서,
상기 제2 추출 유닛은 추가적으로,
상기 검색된 슬롯 정보를 슬롯 벡터로서 표현하고;
상기 제2 특징을 획득하기 위해, 상기 슬롯 벡터를 변종 순환 신경망(recurrent neural network, RNN)에 매핑하고, 상기 변종 RNN과의 융합 후에 상기 처리될 대상의 심층 특징(in-depth feature)을 추출하도록 구성된, 단말기.
단말기로서,
제1 정보를 수집하도록 구성된 수집 유닛;
상기 제1 정보에 대해 의도 식별 태스크(intent identification task)를 실행하여 의도 식별 처리 결과를 획득하도록 구성된 제1 태스크 실행 유닛;
상기 제1 정보에 대해 의도 식별 태스크를 실행하여 슬롯 식별 처리 결과(slot identification processing result)를 획득하도록 구성된 제2 태스크 실행 유닛;
상기 의도 식별 처리 결과로부터 의도 식별 파라미터를 파싱하도록 구성된 제1 파싱 유닛;
상기 슬롯 식별 처리 결과로부터 슬롯 식별 파라미터를 파싱하도록 구성된 제2 파싱 유닛;
상기 의도 식별 파라미터와 상기 슬롯 식별 파라미터에 따라, 의도 식별과 슬롯 식별 사이의 특징 연관관계를 나타내는 제1 결합 모델(first combined model)을 생성하도록 구성된 제1 모델 구축 유닛;
상기 제1 정보로부터 제1 특징을 추출하도록 구성된 제1 추출 유닛;
상기 제1 정보로부터 제2 특징을 추출하도록 구성된 제2 추출 유닛;
의도 식별을 나타내는 제1 목표 파라미터와 슬롯 식별을 나타내는 제2 목표 파라미터를 획득하기 위해, 상기 제1 특징과 상기 제2 특징에 따라 상기 제1 결합 모델을 훈련시키고, 상기 제1 결합 모델이 지정된 목표에 도달할 때 훈련시키는 것을 중단하도록 구성된 제3 추출 유닛; 및
상기 제1 목표 파라미터와 상기 제2 목표 파라미터에 따라 제2 결합 모델을 구축하도록 구성된 제2 모델 구축 유닛
을 포함하는 단말기.
단말기로서,
프로세서 상에서 실행될 수 있는 컴퓨터 프로그램을 저장하도록 구성된 메모리; 및
프로세서
를 포함하고,
상기 프로세서는,
상기 컴퓨터 프로그램이 실행될 때, 제1항 내지 제9항 중 어느 한 항의 정보 처리 방법 또는 제10항의 정보 처리 방법의 단계를 수행하도록 구성된, 단말기.
컴퓨터 판독가능 저장 매체로서,
상기 컴퓨터 판독가능 저장 매체는 컴퓨터 프로그램을 저장하고, 상기 컴퓨터 프로그램은 프로세서에 의해 실행될 때 제1항 내지 제9항 중 어느 한 항의 정보 처리 방법 또는 제10항의 정보 처리 방법의 단계를 구현하는, 컴퓨터 판독가능 저장 매체.