KR102170563B1 - 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치 - Google Patents

인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치 Download PDF

Info

Publication number
KR102170563B1
KR102170563B1 KR1020197004771A KR20197004771A KR102170563B1 KR 102170563 B1 KR102170563 B1 KR 102170563B1 KR 1020197004771 A KR1020197004771 A KR 1020197004771A KR 20197004771 A KR20197004771 A KR 20197004771A KR 102170563 B1 KR102170563 B1 KR 102170563B1
Authority
KR
South Korea
Prior art keywords
model
human
keyword
response
machine interactive
Prior art date
Application number
KR1020197004771A
Other languages
English (en)
Other versions
KR20190028793A (ko
Inventor
하오 티안
스치 자오
조우 신
콴 웬
웬타오 마
텅 수
신누오 수
하이송 장
샹양 주오
루이 얀
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20190028793A publication Critical patent/KR20190028793A/ko
Application granted granted Critical
Publication of KR102170563B1 publication Critical patent/KR102170563B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

본 출원은 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치를 제공하고, 당해 인공 지능에 기반한 휴먼 머신 인터랙티브 방법은 사용자에 의해 입력되는 문제를 수신하는 단계, 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하는 단계 - 상기 모델은 인간 대화 코퍼스에 따라 생성됨 -, 상기 응답을 사용자에게 피드백하는 단계를 포함한다. 당해 방법은 휴먼 머신 인터랙티브가 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구비할 수 있도록 한다.

Description

인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치
본 출원은 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드가 2016년 9월 5일 제출한 발명의 명칭이 "인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치”이고, 중국 특허 출원 번호가 "201610803645.8"인 우선권을 요구한다.
본 출원은 인공 지능 기술 분야에 관한 것으로, 특히 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치에 관한 것이다.
인공 지능(Artificial Intelligence, AI)은 사람의 지능을 시뮬레이션, 연장 및 확장하기 위한 이론, 방법, 기술 및 응용 시스템을 연구하고 개발하는 하나의 새로운 기술 과학이다. 인공 지능은 컴퓨터 과학의 한 갈래로서, 지능의 본질을 이해하고, 인간의 지능과 비슷한 방식으로 반응할 수 있는 새로운 지능 로봇을 제조하하는 의도하고 있다. 당해 분야의 연구에는 지능형 주문 로봇, 음성 인식, 이미지 인식, 자연 언어 처리 및 전문가 시스템 등을 포함한다.
인공 지능 등 기술의 발전에 따라, 휴먼 머신 인터랙티브 시스템은 이미 다양한 형식으로 사람들의 생활에 나타난다. 예를 들어 자연 대화 분야에서, 기계는 사람과 대화할 수 있고, 지능형 고객 서비스 분야에서, 고객 서비스 시스템은 사람에게 서비스를 제공할 수 있다. 그러나, 현재의 휴먼 머신 인터랙티브 시스템의 흐름은 통상적으로 기계가 사람의 문제(query)를 수신한 후, 데이터베이스가 관련된 응답(reply)을 찾아 사용자에게 보여준다. 이런 방식은 본질적으로 검색이고, 인간 사이의 대화할 때의 로직이 없으며, 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구현할 수 없다.
본 출원은 적어도 일정한 정도에서 관련 기술에서의 기술적 과제 중의 하나를 해결하는 것을 목적으로 한다.
이를 위해, 본 출원의 하나의 목적은 인공 지능에 기반한 휴먼 머신 인터랙티브 방법을 제공하는데 있고, 당해 방법은 기계가 인간이 대화하는 스타일로 인간과 인터랙티브 대화할 수 있도록 하여, 휴먼 머신 인터랙티브가 진정으로 인간 사이의 로 대화하는 효과를 구비하도록 한다.
본 출원의 다른 하나의 목적은 인공 지능에 기반한 휴먼 머신 인터랙티브 장치를 제공하는데 있다.
상술한 목적을 달성하기 위해, 본 출원의 제1 측면의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법은, 사용자에 의해 입력되는 문제를 수신하는 단계, 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하는 단계 - 상기 모델은 인간 대화 코퍼스에 따라 생성됨 -, 상기 응답을 사용자에게 피드백하는 단계,를 포함한다.
본 출원의 제1 측면의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법은 미리 생성된 모델을 통하여 사용자에 의해 입력되는 문제에 대응되는 응답을 취득하고, 당해 모델은 인간 대화 코퍼스에 따라 생성하며, 당해 응답은 인간 대화의 스타일을 구비하며, 따라서, 기계가 인간 대화의 스타일로 인간과 인터랙티브 대화할 수 있어, 휴먼 머신 인터랙티브가 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구비하도록 한다.
상술한 목적을 달성하기 위해, 본 출원의 제2 측면의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치는, 사용자에 의해 입력되는 문제를 수신하기 위한 수신 모듈, 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하기 위한 획득 모듈, 상기 응답을 사용자에게 피드백하기 위한 피드백 모듈,을 포함하고, 상기 모델은 인간 대화 코퍼스에 따라 생성한다.
본 출원의 제2 측면의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치는, 미리 생성된 모델을 통하여 사용자에 의해 입력되는 문제에 대응되는 응답을 취득하고, 당해 모델은 인간 대화 코퍼스에 따라 생성하며, 당해 응답은 인간 대화의 스타일을 구비하며, 따라서, 기계가 인간 대화의 스타일로 인간과 인터랙티브 대화할 수 있어, 휴먼 머신 인터랙티브가 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구비하도록 한다.
본 출원의 실시예는 디바이스를 제공하고, 프로세서, 프로세서에 의해 수행 가능한 명령을 저장하기 위한 메모리,를 포함하되, 여기서, 상기 프로세서는 본 출원의 제1 측면의 실시예 중 어는 한 항의 방법을 수행하도록 구성된다.
본 출원의 실시예는 비일시적 컴퓨터 판독 가능 저장 매체를 제공하고, 상기 저장 매체에서의 명령이 프로세서에 의해 수행될 경우, 프로세서가 본 출원의 제1 측면의 실시예 중 어는 한 항의 방법을 수행하도록 구성된다.
본 출원의 실시예는 머신 프로그램 제품을 제공하고, 상기 머신 프로그램 제품에서의 명령이 프로세서에 의해 수행될 경우, 프로세서가 본 출원의 제1 측면의 실시예 중 어는 한 항의 방법을 수행하도록 구성된다.
본 출원의 추가적인 측면과 장점은 이하 설명에서 일부 제기되고 다른 일부는 이하 설명에서 더욱 명확해지거나 또는 본 출원의 실천을 통하여 이해될 것이다.
본 출원의 상기 및/또는 추가적인 측면과 장점은 이하 첨부된 도면을 결합하여 행한 실시예에 대한 설명으로부터 더욱 명확해지고 용이하게 이해될 것이며, 여기서,
도 1은 본 출원의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법의 흐름도이다.
도 2는 본 출원의 실시예에서 훈련 과정에서 모델을 생성하는 흐름도이다.
도 3은 본 출원의 실시예에서 코퍼스 소스의 분류 개략도이다.
도 4는 본 출원의 실시예에서 예측 모델의 개략도이다
도 5는 본 출원의 실시예에서 다른 하나의 예측 모델의 개략도이다
도 6은 본 출원의 실시예에서 다른 하나의 예측 모델의 개략도이다
도 7은 본 출원의 실시예에 대응되는 전체 아키텍처이다.
도 8은 본 출원의 다른 하나의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법의 흐름도이다.
도 9는 본 출원의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치의 구조 개략도이다.
도 10은 본 출원의 다른 하나의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치의 구조 개략도이다.
아래에 본 출원의 실시예를 상세하게 설명하고자 한다. 상기 실시예의 예시는 도면에 도시되었는 바, 그중 동일하거나 유사한 도면부호는 시종일관하게 동일하거나 유사한 소자 또는 동일하거나 유사한 기능을 구비한 모듈을 가리킨다. 아래 첨부도면을 참조하여 설명된 실시예는 예시적인 것으로, 본 출원을 해석하기 위한 것일 뿐이며, 본 출원을 제한하는 것으로 이해하여서는 안된다. 반대로, 본 출원의 실시예는 추가된 청구 범위에 들어가는 정신과 내포된 범위 내의 모든 변화, 수정 및 균등물을 포함한다.
도 1은 본 출원의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법의 흐름도이다.
도 1에 도시된 바와 같이, 본 실시예는 하기의 단계를 포함한다.
S11단계에서 사용자에 의해 입력되는 문제(query)를 수신한다.
여기서, 사용자는 텍스트, 음성 또는 이미지 등 형식으로 문제를 입력할 수 있다. 문제가 텍스트 형식이 아닌 경우, 먼저 비텍스트 형식의 문제를 전환하여, 이를 텍스트로 전환할 수 있다. 구체적으로 이용되는 기술은 예를 들어 음성 인식, 이미지 내용 인식 등 전환 기술을 포함하고, 이런 전환 기술은 기존 기술이나 미래에 나타나는 기술을 이용하여 구현할 수 있으며, 여기서 상세히 설명하지 않는다.
S12단계에서 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하고, 상기 모델은 인간 대화 코퍼스에 따라 생성된다.
여기서, 훈련 단계에서 상술한 모델을 생성할 수 있다. 훈련 단계에서, 먼저 대량의 인간 대화 코퍼스를 수집하고, 인간 대화 코퍼스는 그룹(pair)을 단위로, 각 그룹은 문제(query)와 응답(answer)을 포함하고, 훈련할 때, 코퍼스에서의 query를 입력으로 하여 모델을 훈련하여, 출력이 가능한 코퍼스에 대응되는 answer와 일치하도록 한다. 당해 모델은 인간 대화 코퍼스에 따라 생성된 것이므로, 당해 모델에 따라 현재의 문제를 처리한 후, 취득한 출력은 또한 인간 대화의 스타일을 구비한 answer이다.
나아가, 상술한 모델이 구체적으로 구현될 경우 하나에 한정되지 않고, 다수개일 수 있으며, 각각 서로 다른 기능을 완성하여, 사용자에 의해 입력되는 문제로부터 인간 대화의 스타일을 구비한 응답을 획득한다.
S13단계에서 상기 응답을 사용자에게 피드백한다.
응답을 획득한 후, 응답을 음성 형식으로 사용자에게 플레이할 수 있다.
이 외에, 만약 획득한 응답이 텍스트 형식이면, 음성 합성 등 기술을 통하여 이를 음성으로 전환할 수 있다.
본 실시예에서, 미리 생성된 모델을 통하여 사용자에 의해 입력되는 문제에 대응되는 응답을 취득하고, 당해 모델은 인간 대화 코퍼스에 따라 생성하며, 당해 응답은 인간 대화의 스타일을 구비하며, 따라서, 기계가 인간 대화의 스타일로 인간과 인터랙티브 대화할 수 있어, 휴먼 머신 인터랙티브가 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구비하도록 한다.
위의 실시예는 대화 과정을 설명하였는 바, 대화 과정에서 모델이 사용될 수 있으며, 당해 모델은 훈련 과정에서 생성될 수 있고, 아래에 훈련 과정에서 모델을 생성하는 흐름에 대하여 설명한다.
도 2는 본 출원의 실시예에서 훈련 과정에서 모델을 생성하는 흐름도이다.
본 실시예에서, 모델이 매핑 관계, 예측 모델 및 문법 모델을 포함하는 것을 예로 한다. 여기서, 매핑 관계는 문제 중의 키워드와 응답 중의 키워드 사이의 매핑 관계를 나타내기 위한 것이고, 예측 모델은 문맥 정보에 따라 복수의 매핑 관계에서 최적화한 매핑 관계를 결정하고, 결정된 매핑 관계에서의 키워드와 매칭되는 조합단어를 생성하기 위한 것이며, 문법 모델은 용어의 순서를 조정하고, 조정 후의 용어에 따라 문법 구조에 부합되는 문장을 생성하기 위한 것이다.
도 2에 도시된 바와 같이, 본 실시예는 하기의 단계를 포함한다.
S21에서는 인간 대화 코퍼스를 수집한다.
코퍼스의 선택은 동영상(영화, 텔레비전 드라마, 애니메이션 등)에서의 대화, 문학 작품(역사 명작, 추리 소설, 연애 소설, 인터넷 소설 등)에서의 대화, 소셜 플랫폼(웨이보, 인터넷 게시판, douban(중국의 소셜 커뮤니티 사이트 문화 컨텐츠에 대한 의견을 서로 공유하는 소셜 커뮤니티 사이트) 등)에서의 대화, 지방 언어(둥베이 방언, 베이징 방언, 광둥 방언 등)대화를 포함하는 사람들의 대화를 갖고 있는 모든 곳을 기반으로 할 수 있다.
도 3에 도시된 바와 같이, 코퍼스 소스의 분류를 제시하며, 따라서 다양한 코퍼스 소스로부터 서로 다른 스타일의 코퍼스를 수집할 수 있고, 또한 동일한 코퍼스 소스는 하나 또는 다양한 대화 스타일을 갖고 있을 수 있다. 동영상에서의 대화는 동영상의 종류의 변화에 따라 대화 스타일의 차이가 아주 크고, 희극 영화에서의 대화는 일반적으로 유머러스하고, 애정 영화에서의 대화는 일반적으로 정의가 매우 깊고 두터우며, 전쟁 영화에서의 대화는 일반적으로 긴장하고 격렬하는 등, 문학 작품에서의 대화 스타일은 또한 종류가 서로 다름에 따라 서로 다르고, 역사 명작에서의 대화는 일반적으로 모종의 역사 배경의 특색을 갖고 있으며, 추리 소설의 대화는 로직이 치밀하고, 연애 소설의 대화는 감정이 풍부하는 등, 네트위크 소셜 플랫폼에서의 대화는 매우 많은 인터넷 용어를 갖고 있으나, 그 자체가 사람들의 일상 대화의 전반적인 스타일이 사람들의 일상 대화에 가장 가까우며, 지방 언어의 대화는 각종 지방 방언을 포함하여, 각종 지방 특색을 갖고 있다.
S22에서는 인간 대화 코퍼스에 있어서 문제 중의 키워드 및 대응되는 응답 중의 키워드를 추출하고, 추출된 키워드에 따라 문제 중의 키워드와 응답 중의 키워드 사이의 매핑 관계를 생성한다.
여기서, 한 그룹의 인간 대화 코퍼스에 대응하여, 그 중의 문제(문제라고 약칭함)와 응답(응답이라고 약칭함)에 대하여 단어 분리(words segmentation)를 하고, 문제 중의 용어(term)와 응답 중의 용어를 취득하고, 다시 용어에서 키워드를 결정하며(예를 들어 나타나는 확률에 따라), 또한 대량의 코퍼스에 대한 학습을 통하여 매핑 관계를 취득할 수 있다.
예를 들어, 한 그룹의 문답은 하기와 같다.
문제: 하루 동안 바빴고, 마침내 퇴근하였어요.
응답: 수고하셨어요, 지금 귀가하는가요?
문답에 대하여 각각 단어 분리를 하고 그 중의 키워드를 추출하는 것을 통하여, 문제 중의 바쁘다, 퇴근을 포함하는 키워드를 취득할 수 있고, 응답 중의 수고, 귀가를 포함하는 키워드를 취득할 수 있으며, 따라서, "바쁜 것”과 "수고” 사이의 매핑 관계, "퇴근”과 "귀가” 사이의 매핑 관계를 구축할 수 있다.
상술한 매핑 관계는 일대다일 수 있고, 예를 들어, 다른 한 그룹의 코퍼스는 하기와 같다.
문제: 하루 동안 바빴고, 마침내 퇴근하였어요.
응답: 휴식을 하고, 일은 완성되었어요?
상술한 처리와 유사하게, "바쁜 것”과 "휴식” 사이의 매핑 관계, "퇴근”과 "일” 사이의 매핑 관계를 구축할 수 있다.
따라서 다양한 코퍼스를 종합하여, "바쁜 것”과 "수고”, "휴식” 사이의 매핑 관계, "퇴근”과 "귀가”, "일” 사이의 매핑 관계를 구축할 수 있다.
상술한 매핑 관계를 취득한 후, 키값 페어(key, value)의 방식으로 저장할 수 있다. 예를 들어 key는 "바쁘다”이고, value는 "수고”, "휴식”을 포함한다.
코퍼스는 서로 다른 코퍼스 소스에서 올 수 있기에, 서로 다른 코퍼스 소스는 서로 다른 스타일을 구비할 수 있으며, 따라서 서로 다른 스타일의 매핑 관계를 형성할 수 있다.
예를 들어, 하나의 텔레비전 드라마 중의 한 그룹의 대화는 하기의 내용을 포함한다.
문제: 나는 시험에 관한 사항을 생각하고 있어요.
응답: 그러면 어떻게 컨닝을 할 것인가를 생각하는 가요?
문제: 당신은 어째서 나를 자꾸 나쁜 쪽으로 생각하는 가요?
응답: 나보고 좋은 쪽으로 생각하게 하려도 나에게 기회를 줘야 하지요!
상술한 코퍼스에 따라, 예를 들어“생각”과 "생각” 사이의 매핑 관계, "시험”과 "어떻게 컨닝을 하는 것” 사이의 매핑 관계와 같은 한 그룹의 유머러스한 스타일을 구비한 매핑 관계를 구축할 수 있다.
또 예를 들어, 하나의 연애 소설 중의 한 그룹의 대화는 하기를 포함한다.
문제: 나는 시험을 생각하고 있어요.
응답: 자기야, 하지만 나는 당신을 생각하고 있어요.
상술한 코퍼스에 따라, 예를 들어 "나”와 "자기야”, "나는” 사이의 매핑 관계, "생각”과 "생각” 사이의 매핑 관계, "시험”과 "당신” 사이의 매핑 관계와 같은 한 그룹의 감성으로 가득 찬 스타일을 구비한 매핑 관계를 구축할 수 있다.
또 예를 들어, 일반적인 소셜 플랫폼에서, 한 그룹의 대화는 하기를 포함한다.
문제: 나는 시험을 생각하고 있어요.
응답: 시험의 무슨 일인가요?
상술한 코퍼스에 따라, 예를 들어 "생각”과 "생각” 사이의 매핑 관계, "시험”과 "무슨” 사이의 매핑 관계와 같은 한 그룹의 일상적인 생활 스타일을 구비한 매핑 관계를 구축할 수 있다.
또 예를 들어, 둥베이 방언 중의 한 그룹의 대화는 하기를 포함한다.
문제: 나는 시험을 생각하고 있어요.
응답: 무슨 생각(璣思)을 하는 가요, 시험에 가서 당황(麻爪)하여 어찌할 바를 모르는 것을 생각하는 가요?
상술한 코퍼스에 따라, 예를 들어 "생각”과 "생각(璣思)"사이의 매핑 관계, "시험”과 "당황(麻爪)"사이의 매핑 관계와 같은 한 그룹의 둥베이 방언의 스타일을 구비한 매핑 관계를 구축할 수 있다.
S23에서는 인간 대화 코퍼스로부터 문제 중의 키워드와 응답 중의 키워드, 및 문맥 정보를 획득하고, 획득된 키워드 및 문맥 정보에 따라 예측 모델을 생성한다.
예를 들어, 문제 중의 키워드가 "바쁜 것”과 "퇴근”을 포함하고, 코퍼스에서의 문맥 정보가 "시간이 늦었음”, "귀가하고 싶음” 등이며, 상응한 응답에 "수고”, "귀가”가 항상 나타날 수 있으면, 예측 모델에는 도 4에 도시된 바와 같은 문제, 문맥 정보, 응답 사이의 대응 관계를 포함한다. 또 예를 들어, 문제 중의 키워드가 "바쁜 것”과 "퇴근”을 포함하고, 다른 하나의 코퍼스에서의 문맥 정보가 "일이 많음”, "지도자가 재촉함” 등이며, 상응한 응답에 "휴식”, "일”, "완성”이 항상 나타날 수 있으면, 예측 모델에는 도 5에 도시된 바와 같은 문제, 문맥 정보, 응답 사이의 대응 관계를 포함한다.
도 4 내지 도 5는 로직에서의 관계로 설명하지만, 예측 모델에서의 상술한 관계는 로직에 한정되지 않으며, 스타일일 수도 있다. 예를 들어, 같은 문제 "생각”, "시험”에 대응하여, 도 6을 참조하면, 서로 다른 스타일에서, 서로 다른 응답에 대응될 수 있다.
나아가, 예측 모델은 단지 문제, 문맥 정보와 응답 사이의 대응 관계를 표시하기 위한 것 일뿐만 아니라, 배합을 학습하기 위한 것이며, 응답 중의 키워드에 따라 이에 대하여 보충하여, 문장이 배합된다. 예를 들어 문제와 문맥 정보에 따라 취득한 응답은 "생각, 컨닝” 이런 키워드를 포함하고, 그리고 나서 유머러스한 대화의 코퍼스에 따라 상응한 스타일 중의 일상적인 배합“생각하고, 어떻게 컨닝을 함”을 학습할 수 있으며, 연애 소설에서, 마찬가지로 "나, 생각”의 키워드를 뽑아낼 수 있고, 그리고 나서 대응되는 감성이 많은 배합 "자기야, 너를 생각함”을 배울 수 있으며, 최후에 감성이 포함된 이런 배합 방식을 배울 수 있다.
S24에서는 인간 대화 코퍼스의 문법 구조를 분석하여, 문법 모델을 생성한다.
문법 모델의 본질은 언어 모델이고, 당해 모델은 코퍼스에서의 대화에 따라 인간이 말하는 중의 일상적인 문법 구조를 학습할 수 있고, 이의 주요 원리는 코퍼스 중 대화 pair전처리 후의 품사(part of speech)에 대하여 표기하고 시퀀스의 순서에 따라 인간의 대화 중의 습관적인 표현 방식을 학습하며, 일부 접속사와 조사의 추가와 보충을 포함한다. 예를 들어 위에서 "생각함, 어떻게 컨닝을 함”을 학습 한후, 문법 모델은 이 2개의 구절을 통하여 하나의 응답을 세우는 문법 구조를 학습함으로써, "그것은”과 같은 접속사를 추가하는 것을 학습하며, 또 예를 들어 위에서 연애 소설에서의 대화는, reply에서 위에 대응되어 생성되는 "자기야, 나, 생각, 당신”을 뽑아낸 후, 문법 모델은 이런 term으로부터 최종 reply"자기야, 하지만 나는 당신을 생각하고 있어요."의 표현 방식을 돌아가서 학습하며, 따라서 "하지만, 어요”의 이런 어기 조사의 사용을 배우고, 동시에 또한 이런 감성이 많은 표현 방식을 학습한다. 훈련 단계에서, 문법 모델은 코퍼스에서 언어의 구조 순서와 표현 방식을 주로 학습하고, 구조 순서의 학습은 문장이 기본적으로 논리적이고 문법적인 것을 확보할 수 있고, 표현 방식 상의 학습은 코퍼스 스타일이 서로 다름에 따라 변화할 수도 있다.
상술한 바와 같이, 본 실시예에서 매핑 관계, 예측 모델 및 문법 모델을 생성할 수 있고, 그 후에 이런 모델은 대화 단계에 사용된다.
본 실시예에서, 인간 대화 코퍼스를 수집하는 것을 통하여, 인간 대화 코퍼스에 기반하여 생성 모델을 훈련할 수 있음으로써, 기계가 인간 대화의 스타일을 학습하도록 하고, 모델을 대화 과정에 응용한 후, 기계가 인간 대화의 스타일로 인간과 인터랙티브 대화할 수 있어, 휴먼 머신 인터랙티브가 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구비하도록 한다.
상술한 대화 과정과 훈련 과정을 결합하여, 도 7에 도시된 바와 같이, 전체 아키텍처를 제시한다.
아래에 도 7에 도시된 아키텍처를 결합하여, 훈련 과정과 대화 과정을 포함하는 전체 흐름을 설명한다.
도 8은 본 출원의 다른 하나의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법의 흐름도이다.
도 8에 도시된 바와 같이, 본 실시예는 하기의 단계를 포함한다.
S801에서는 인간 대화 코퍼스를 수집한다.
S802에서는 인간 대화 코퍼스에 대하여 전처리를 한다.
전처리는, 인간 대화 코퍼스에서의 문제와 답안에 대하여 각각 단어 분리를 하여, 키워드를 선택하고 각 키워드에 대응되는 식별자(id)를 결정함으로써, 단어 시퀀스를 id시퀀스로 전환하는 것을 포함할 수 있다.
여기서, 단어와 식별자 사이의 대응 관계를 포함하는 사전을 획득할 수 있고, 당해 사전에 따라 단어 시퀀스를 대응되는 id시퀀스롤 전환할 수 있다.
당해 단계는 도 7에 도시된 전처리 모듈에 의해 수행될 수 있다.
S803에서는 전처리 후의 인간 대화 코퍼스에 따라, 문제 중의 키워드와 응답 중의 키워드 사이의 매핑 관계를 생성하고, 당해 매핑 관계를 저장한다.
당해 단계는 도 7에 도시된 매핑 학습과 저장 모듈에 의해 수행될 수 있다.
구체적으로 매핑 관계의 생성되는 흐름은 위의 실시예를 참조할 수 있고, 여기서 상세히 설명하지 않는다.
이 외에, 이해 가능한 바로는, 훈련 단계에 상술한 전처리를 하기에, 상술한 매핑 관계는 id 사이의 매핑 관계일 수 있다.
S804에서는 전처리 후의 인간 대화 코퍼스에 따라 예측 모델을 생성한다.
당해 단계는 도 7에 도시된 예측 모듈에 의해 수행될 수 있다.
구체적으로 예측 모델을 생성하는 흐름은 위의 실시예를 참조할 수 있고, 여기서 상세히 설명하지 않는다.
S805에서는 전처리 후의 인간 대화 코퍼스에 따라 문법 모델을 생성한다.
당해 단계는 도 7에 도시된 문법 학습과 제어 모듈에 의해 수행될 수 있다.
구체적으로 생성 문법 모델의 흐름은 위의 실시예를 참조할 수 있고, 여기서 상세히 설명하지 않는다.
S801-S805는 훈련 단계에서 수행될 수 있다.
이 외에, 각 모듈 사이의 인터랙티브는 도 7에 도시된 마스터 제어 시스템에 의해 수행될 수 있다.
S806에서는 사용자에 의해 입력되는 문제를 수신한다.
S807에서는 사용자에 의해 입력되는 문제를 전처리한다.
전처리는 전처리 모듈에 의해 수행될 수 있다. 구체적으로 전처리의 흐름은 상술한 훈련 단계의 상응한 흐름을 참조할 수 있다.
S808에서는 매핑 관계에 따라, 사용자에 의해 입력되는 문제 중의 키워드에 대응되는 응답 중의 키워드를 결정한다.
여기서, 마스터 제어 시스템은 전처리 후의 문제를 매핑 학습과 저장 모듈에 전송하고, 매핑 학습과 저장 모듈에 의해 자체에 저장된 매핑 관계에 따라 전처리 후의 문제에 대응되는 응답 중의 키워드를 결정한다.
S809에서는 예측 모델에 따라, 결정된 키워드에서 최적화한 한 그룹의 키워드를 선택하고, 선택된 한 그룹의 키워드에 따라 조합단어를 생성한다.
여기서, 마스터 제어 시스템은 매핑 학습과 저장 모듈로부터 여러 그룹의 키워드를 획득할 수 있고, 그 후 마스터 제어 시스템은 여러 그룹의 키워드를 예측 모듈에 전송할 수 있으며, 또한 문맥 기억 모듈로부터 현재의 문맥 정보를 획득하고, 예측 모듈은 이미 생성된 예측 모델 및 현재의 문맥 정보에 따라 여러 그룹의 키워드에서 한 그룹의 키워드를 선택할 수 있다.
예를 들어, 매핑 관계에 따라 여러 그룹의 키워드를 결정할 수 있고, 예를 들어, 문제 중의 키워드가 "바쁜 것”과 "퇴근”을 포함할 경우, 매핑 관계에 따라 결정된 키워드는 "휴식, 일, 완성”과 "수고, 귀가”를 포함할 수 있고, 당해 단계에서, 예측 모델 및 현재의 문맥 정보에 따라 여러 그룹의 키워드에서 최적화한 한 그룹의 키워드를 선택하도록 결정할 수 있으며, 예를 들어, 만약 현재의 문맥 정보가 "일이 많음, 지도자가 재촉함”이면, 선택된 한 그룹의 키워드는 "휴식, 일, 완성”이고, 또는, 만약 현재의 문맥 정보가 "시간이 늦었음, 귀가하고 싶음”이면, 선택된 한 그룹의 키워드는 "수고, 귀가”이다.
이 외에, 예측 모델은 또한 문맥 정보에 따라 현재의 스타일을 결정할 수 있고, 다시 스타일에 따라 상응한 조합단어를 결정할 수 있으며, 예를 들어 선택된 한 그룹의 키워드가 "에, 생각”이고, 만약 현재 스타일이 유머러스하면, "생각함, 어떻게 컨닝을 함”과 같은 유형의 조합단어를 결정할 수 있고, 또는, 만약 현재 스타일이 감성으로 가득 차면, "자기야, 당신을 생각함”과 같은 유형의 조합단어를 결정할 수 있다.
S810에서는 문법 모델에 따라 선택된 한 그룹의 키워드 및 생성된 조합단어에 대하여 문법 구조의 조정을 하여, 문법 구조를 만족하는 문장을 취득한다.
여기서, 마스터 제어 시스템은 예측 모듈로부터 키워드 및 조합단어를 획득할 수 있고, 그 후 이를 문법 학습과 제어 모듈에 전송하며, 문법 학습과 제어 모듈에 의해 문법 모델에 따라 각 단어의 순서를 조정하여, 문법 구조를 만족하는 문장을 생성한다. 문법 학습과 제어 모듈이 이용하는 문법 모델은 훈련 단계에서 인간 대화 코퍼스에 따라 생성된 것, 또는, 개방형 인터페이스에 따라 제3자로부터 획득한 문법 모델일 수도 있다.
S811에서는 문법 구조를 만족하는 문장을 응답으로 사용자에게 피드백한다.
예를 들어, 마스터 제어 시스템은 문법 학습과 제어 모듈로부터 문법 구조를 만족하는 문장을 획득하고, 그 후 당해 문장에 대하여 음성 합성을 하며, 출력 인터페이스를 통하여 사용자에게 플레이한다.
나아가, 당해 방법은 하기의 단계를 더 포함할 수 있다.
S812에서는 사용자와의 인터랙티브 대화에 따라, 온라인 학습을 한다.
사용자와 대화를 할 경우, 시스템은 일부 대화의 코퍼스를 실시간으로 생성할 수 있고, 이런 코퍼스는 현재 사용자의 표현 습관과 스타일을 포함하며, 따라서, 일정한 시간 내의 사용자와 대화하는 채팅 기록을 코퍼스로 사용자의 표현 습관을 학습할 수 있다. 당해 모듈은 주로 대화 기록를 정기적으로 수집하는 것을 코퍼스로 시스템의 각 모듈에 대하여 실시간으로 다시 훈련을 하고, 채팅 기록을 사용하는 중, 사용자의 매번의 입력이 상대적인 기계로부터의 한마디의 응답에 있어서는 또한 하나의 query이며, 따라서 기계에서 생성된 응답을 query로 하고, 사용자의 입력을 answer로하여, 하나하나의 pair로 다시 훈련하며, 시스템이 사용자와 대화하는 과정에서 사용자의 대화 스타일을 학습하게 한다. 당해 모듈은 플러그 가능한 모듈이고, 당해 모듈을 연결할 경우 모듈은 부단히 일지 중의 사용자와 기계의 대화를 통하여 학습하며, 당해 모듈을 분해할 경우에 전체 시스템은 또한 정상적으로 작동할 수 있다.
나아가, 당해 방법은 하기의 단계를 더 포함할 수 있다.
S813에서는 개방형 인터페이스를 통하여 기타 시스템을 호출하거나 기타 시스템에 의해 호출된다.
도 7에 도시된 바와 같이, 당해 시스템은 또한 일부 개방형 인터페이스를 제공할 수 있고, 이런 개방형 인터페이스는 외부에 개방된 호출 인터페이스와 확장 인터페이스이며, 호출 인터페이스는 기타 시스템이 당해 인터페이스를 통하여 본 시스템을 직접 호출할 수 있도록 할 수 있고, 확장 인터페이스는 기타 관련된 모델 또는 시스템을 액세스하여 기능 강화를 할 수 있다. 예를 들어 문법 학습 모듈은 기타 일부 성숙된 언어 모델을 호출하여 시스템에서의 문법을 학습하고 조정하는 기능을 강화할 수 있다.
본 실시예에서, 인간 대화 코퍼스를 수집하여, 인간 대화 코퍼스에 기반하여 생성 모델을 훈련할 수 있으며, 따라서 기계가 인간 대화의 스타일을 학습하도록 하고, 모델을 대화 과정에 응용한 후, 기계가 인간 대화의 스타일로 인간과 인터랙티브 대화할 수 있어, 휴먼 머신 인터랙티브가 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구비하도록 한다. 나아가, 온라인 학습을 통하여 새로운 데이터를 실시간으로 학습하여, 휴먼 머신 인터랙티브의 효과를 향상할 수 있다. 나아가, 개방형 인터페이스를 통하여 기타 시스템에 의해 호출될 수 있거나 기타 시스템을 호출할 수 있어, 휴먼 머신 인터랙티브 서비스를 더 좋게 제공할 수 있다.
도 9는 본 출원의 실시예에서 제공되는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치의 구조 개략도이다.
도 9에 도시된 바와 같이, 당해 장치(90)는 수신 모듈(91), 획득 모듈(92) 및 피드백 모듈(93)을 포함한다.
수신 모듈(91)은 사용자에 의해 입력되는 문제를 수신하기 위한 것이고,
획득 모듈(92)은 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하기 위한 것이고, 상기 모델은 인간 대화 코퍼스에 따라 생성하며,
피드백 모듈(93)은 상기 응답을 사용자에게 피드백하기 위한 것이다.
일부 실시예에서, 상기 모델은 매핑 관계, 예측 모델 및 문법 모델을 포함하고, 상기 매핑 관계는 문제 중의 키워드와 응답 중의 키워드 사이의 매핑 관계를 나타내기 위한 것이고, 상기 예측 모델은 문맥 정보에 따라 복수의 매핑 관계에서 최적화한 매핑 관계를 결정하고, 결정된 매핑 관계에서의 키워드와 매칭되는 조합단어를 생성하기 위한 것이며, 상기 문법 모델은 용어의 순서를 조정하고, 조정 후의 용어에 따라 문법 구조에 부합되는 문장을 생성하기 위한 것이다.
일부 실시예에서, 도 10을 참조하면, 상기 획득 모듈(92)은,
상기 매핑 관계에 따라, 사용자에 의해 입력되는 문제 중의 키워드에 대응되는 응답 중의 키워드를 결정하기 위한 매핑 서브 모듈(921),
상기 예측 모델에 따라, 결정된 키워드에서 최적화한 한 그룹의 키워드를 선택하고, 선택된 한 그룹의 키워드에 따라 조합단어를 생성하기 위한 예측 서브 모듈(922),
상기 문법 모델에 따라, 상기 선택된 한 그룹의 키워드 및 생성된 조합단어에 대하여 문법 구조의 조정을 하여, 문법 구조를 만족하는 문장을 취득하여, 인간 대화의 스타일을 구비한 응답으로 하기 위한 문법 분석 서브 모듈(923)을 포함한다.
일부 실시예에서, 상기 매핑 서브 모듈은 또한 인간 대화 코퍼스에 있어서 문제 중의 키워드 및 대응되는 응답 중의 키워드를 추출하고, 추출된 키워드에 따라 상기 매핑 관계를 생성하기 위한 것이고, 또는,
일부 실시예에서, 상기 예측 서브 모듈은 또한 인간 대화 코퍼스에 있어서 문제 중의 키워드 및 대응되는 응답 중의 키워드를 추출하고, 대응되는 문맥 정보를 추출하며, 추출된 키워드와 문맥 정보에 따라, 상기 예측 모델을 생성하기 위한 것이며, 또는,
일부 실시예에서, 상기 문법 분석 서브 모듈은 인간 대화 코퍼스에 따라 상기 문법 모델을 생성하거나, 또는, 개방형 인터페이스를 통하여 기타 시스템으로부터 상기 문법 모델을 획득하기 위한 것이다.
일부 실시예에서, 도 10을 참조하면, 당해 장치(90)는,
상기 문제를 전처리하여, 상기 획득 모듈을 미리 생성된 모델에 따라 전처리 후의 문제를 처리하도록 트리거링을 하기 위한 전처리 모듈(94)을 더 포함한다.
일부 실시예에서, 도 10을 참조하면, 당해 장치(90)는,
상기 사용자와의 인터랙티브 대화에 따라, 온라인 학습을 하기 위한 온라인 학습 모듈(95)을 더 포함한다.
일부 실시예에서, 도 10을 참조하면, 당해 장치(90)는,
기타 시스템을 호출하거나 기타 시스템에 의해 호출되는데 인터페이스를 제공하기 위한 개방형 인터페이스(96)를 더 포함한다.
이해 가능한 바로는, 본 실시예의 장치는 상술한 방법의 실시예에 대응되고, 구체적인 내용은 방법의 실시예의 관련 설명을 참조할 수 있으며, 여기서 상세히 설명하지 않는다.
본 실시예에서, 인간 대화 코퍼스를 수집하여, 인간 대화 코퍼스에 기반하여 생성 모델을 훈련할 수 있으며, 따라서 기계가 인간 대화의 스타일을 학습하도록 하고, 모델을 대화 과정에 응용한 후, 기계가 인간 대화의 스타일로 인간과 인터랙티브 대화할 수 있어, 휴먼 머신 인터랙티브가 진정으로 인간 사이의 인터랙티브 대화하는 효과를 구비하도록 한다. 나아가, 온라인 학습을 통하여 새로운 데이터를 실시간으로 학습하여, 휴먼 머신 인터랙티브의 효과를 향상할 수 있다. 나아가, 개방형 인터페이스를 통하여 기타 시스템에 의해 호출될 수 있거나 기타 시스템을 호출할 수 있어, 휴먼 머신 인터랙티브 서비스를 더 좋게 제공할 수 있다.
이해 가능한 바로는, 상술한 각 실시예에서 같거나 비슷한 부분은 서로 참조할 수 있고, 일부 실시예에서 상세히 설명하지 않은 내용은 기타 실시예에서 같거나 비슷한 내용을 참조할 수 있다.
본 출원의 실시예는 디바이스를 제공하고, 프로세서, 프로세서에 의해 수행 가능한 명령을 저장하기 위한 메모리를 포함하되, 여기서, 상기 프로세서는 사용자에 의해 입력되는 문제를 수신하고, 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하고, 상기 응답을 사용자에게 피드백하는 것을 수행하도록 구성되며, 상기 모델은 인간 대화 코퍼스에 따라 생성한다.
본 출원의 실시예는 비일시적 컴퓨터 판독 가능 저장 매체를 제공하고, 상기 저장 매체에서의 명령이 프로세서에 의해 수행될 경우, 프로세서가 사용자에 의해 입력되는 문제를 수신하고, 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하는 것을 수행할 수 있도록 하며, 상기 모델은 인간 대화 코퍼스에 따라 생성하며, 상기 응답을 사용자에게 피드백한다.
본 출원의 실시예는 컴퓨터 프로그램 제품을 제공하고, 상기 컴퓨터 프로그램 제품에서의 명령이 프로세서에 의해 수행될 경우, 프로세서가 사용자에 의해 입력되는 문제를 수신하고, 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하는 것을 수행할 수 있도록 하며, 상기 모델은 인간 대화 코퍼스에 따라 생성된다, 상기 응답을 사용자에게 피드백한다.
설명해야 하는 바로는, 본 출원의 설명에서, 용어“제1", "제2" 등은 단지 설명의 목적을 위한 것일 뿐이며, 상대적인 중요성을 지시하거나 암시하는 것으로 이해해서는 안된다. 이 외에, 본 출원의 설명에서, 다른 설명이 없는 한, "복수”의 함의는 적어도 두개를 가리킨다.
흐름도 또는 여기서 기타 방식으로 설명된 모든 프로세스 또는 방법에 관한 설명은, 특정의 로직 기능 또는 프로세스의 단계를 구현하기 위한 하나 또는 그 이상의 실행 가능한 명령의 코드를 포함하는 모듈, 세그먼트 또는 파트를 나타내는 것으로 이해될 수 있다. 또한 본 출원의 바람직한 실시형태의 범위는 그밖의 다른 구현을 포함하며, 그중에서 나타낸 또는 토론된 순서에 따르지 않아도 된다. 이는 언급된 기능이 실질적으로 동시에 또는 상반되는 순서에 따라 기능을 실행하는 것을 포함하며 본 출원의 실시예가 속한 기술 분야의 통상의 지식을 가진 자는 이를 이해해야 한다.
본 출원의 각 파트는 하드웨어, 소프트웨어, 펌웨어 또는 이들의 조합으로 구현될 수 있는 것으로 이해되어야 한다. 상기 실시형태에서, 다수의 단계 또는 방법은, 메모리에 저장되어 적절한 명령 실행 시스템에 의해 실행되는 소프트웨어 또는 펌웨어를 통하여 구현될 수 있다. 예를 들어, 하드웨어를 통하여 구현되는 경우, 다른 실시형태에서와 마찬가지로, 본 기술 분야에서 널리 알려진 하기 기술 중의 임의의 하나 또는 이들의 조합을 통하여 구현될 수 있다. 상기 '기술'은 데이터 신호에 대하여 로직 기능을 구현하기 위한 로직 게이트 회로를 갖춘 이산 로직 회로, 적절한 조합 로직 게이트 회로를 갖춘 전용 집적 회로, 프로그램 가능 게이트 어레이(PGA), 필드-프로그램 가능 게이트 어레이(FPGA) 등이다.
당업자들은, 상술한 실시예에 따른 방법에 포함된 전체 또는 일부 단계가 프로그램을 통하여 관련 하드웨어를 명령함으로써 구현될 수 있으며, 상술한 프로그램은 컴퓨터 판독가능 매체에 저장되며, 당해 프로그램은 실행시 방법 실시예에 따른 단계 중 하나 또는 그 조합을 포함함을 이해할 수 있다.
또한, 본 출원의 각 실시예에 따른 각 기능 유닛은 하나의 처리 모듈에 집적될 수 있으며, 각 유닛이 독립적으로, 물리적으로 존재할 수도 있으며, 2개 또는 2개 이상의 유닛이 하나의 모듈에 집적될 수도 있다. 상기 집적된 모듈은 하드웨어의 형태를 이용하여 구현될 수 있으며, 소프트웨어 기능 모듈의 형태를 이용하여 구현될 수도 있다. 상기 집적된 모듈은 소프트웨어 기능 모듈의 형태로 구현되고 독립적인 제품으로 판매 또는 사용되는 경우, 하나의 컴퓨터 판독가능 저장 매체에 저장될 수도 있다.
이상 언급된 저장 매체는 롬, 자기 디스크 또는 씨디롬 등일 수 있다.
본 명세서의 설명에서, 참고 용어 '일 실시예’, '일부 실시예’, '예시’, '구체적인 예시’, 또는 '일부 예시’ 등 설명은 당해 실시예 또는 예시를 결부하여 설명한 구체적인 특징, 구조, 재료 또는 특점이 본 출원의 적어도 하나의 실시예 또는 예시에 포함됨을 의미한다. 본 명세서에서 상기 용어에 대한 예시적 표현은 동일한 실시예 또는 예시를 반드시 가리키는 것은 아니다. 또한, 설명된 구체적인 특징, 구조, 재료 또는 특점은 임의의 하나 또는 다수의 실시예 또는 예시에서 적절한 형태로 결합될 수 있다.
비록 상술한 바와 같이 이미 본 출원의 실시예를 도시 및 기재하였지만, 상기 실시예들은 예시적인 것으로 본 출원에 대한 한정이 아니며, 본 출원이 소속된 기술분야의 일반 지식을 장악한 당업자라면 본 출원의 범위내에서 상기 실시예에 대한 변경, 수정, 대체 또는 변형을 가할 수 있을 것이라는 점을 이해할 것이다.

Claims (19)

  1. 인공 지능에 기반한 휴먼 머신 인터랙티브 방법에 있어서,
    사용자에 의해 입력된 문제를 수신하는 단계,
    미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하는 단계 - 상기 모델은 인간 대화 코퍼스에 따라 생성됨 -, 및
    상기 응답을 사용자에게 피드백하는 단계,
    를 포함하고,
    상기 모델은 매핑 관계, 예측 모델 및 문법 모델을 포함하고,
    상기 매핑 관계는 문제 중의 키워드와 응답 중의 키워드 사이의 매핑 관계를 나타내기 위한 것이고,
    상기 예측 모델은 문맥 정보에 따라 복수의 매핑 관계에서 최적화한 매핑 관계를 결정하고, 결정된 매핑 관계에서의 키워드와 매칭되는 조합단어를 생성하기 위한 것이며,
    상기 문법 모델은 용어의 순서를 조정하고, 조정 된 용어에 따라 문법 구조에 부합되는 문장을 생성하기 위한 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하는 단계는,
    상기 매핑 관계에 따라, 사용자에 의해 입력된 문제 중의 키워드에 대응되는 응답 중의 키워드를 결정하는 단계,
    상기 예측 모델에 따라, 결정된 키워드에서 최적화한 한 그룹의 키워드를 선택하고, 선택된 한 그룹의 키워드에 따라 조합단어를 생성하는 단계, 및
    상기 문법 모델에 따라, 상기 선택된 한 그룹의 키워드 및 생성된 조합단어에 대하여 문법 구조의 조정을 하여, 문법 구조를 만족시키는 문장을 획득하여, 인간 대화의 스타일을 구비한 응답으로 하는 단계,
    를 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  4. 제1에 있어서,
    인간 대화 코퍼스에 있어서 문제 중의 키워드 및 대응되는 응답 중의 키워드를 추출하고, 추출된 키워드에 따라 상기 매핑 관계를 생성하는 단계를 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  5. 제1항에 있어서,
    인간 대화 코퍼스에 있어서 문제 중의 키워드 및 대응되는 응답 중의 키워드를 추출하고, 또한 대응되는 문맥 정보를 추출하며, 추출된 키워드와 문맥 정보에 따라, 상기 예측 모델을 생성하는 단계를 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  6. 제1항에 있어서,
    인간 대화 코퍼스에 따라 상기 문법 모델을 생성하거나, 또는, 개방형 인터페이스를 통하여 기타 시스템으로부터 상기 문법 모델을 획득하는 단계를 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  7. 제1항에 있어서,
    상기 문제를 전처리하여, 미리 생성된 모델에 따라 전처리된 문제를 처리하도록하는 단계를 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  8. 제1항에 있어서,
    상기 사용자와의 인터랙티브 대화에 따라, 온라인 학습을 하는 단계를 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  9. 제1항에 있어서,
    개방형 인터페이스를 통하여 기타 시스템을 호출하거나 기타 시스템에 의해 호출되는 단계를 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 방법.
  10. 인공 지능에 기반한 휴먼 머신 인터랙티브 장치에 있어서,
    사용자에 의해 입력된 문제를 수신하기 위한 수신 모듈,
    미리 생성된 모델에 따라, 상기 문제를 처리하여, 상기 문제에 대응되는 인간 대화의 스타일을 구비한 응답을 획득하기 위한 획득 모듈, - 상기 모델은 인간 대화 코퍼스에 따라 생성됨-, 및
    상기 응답을 사용자에게 피드백하기 위한 피드백 모듈,
    을 포함하고,
    상기 모델은 매핑 관계, 예측 모델 및 문법 모델을 포함하고,
    상기 매핑 관계는 문제 중의 키워드와 응답 중의 키워드 사이의 매핑 관계를 나타내기 위한 것이고,
    상기 예측 모델은 문맥 정보에 따라 복수의 매핑 관계에서 최적화한 매핑 관계를 결정하고, 결정된 매핑 관계에서의 키워드와 매칭되는 조합단어를 생성하기 위한 것이며,
    상기 문법 모델은 용어의 순서를 조정하고, 조정 후의 용어에 따라 문법 구조에 부합되는 문장을 생성하기 위한 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치.
  11. 삭제
  12. 제10항에 있어서,
    상기 획득 모듈은,
    상기 매핑 관계에 따라, 사용자에 의해 입력된 문제 중의 키워드에 대응되는 응답 중의 키워드를 결정하기 위한 매핑 서브 모듈,
    상기 예측 모델에 따라, 결정된 키워드에서 최적화한 한 그룹의 키워드를 선택하고, 선택된 한 그룹의 키워드에 따라 조합단어를 생성하기 위한 예측 서브 모듈, 및
    상기 문법 모델에 따라, 상기 선택된 한 그룹의 키워드 및 생성된 조합단어에 대하여 문법 구조의 조정을 하여, 문법 구조를 만족시키는 문장을 획득하여, 인간 대화의 스타일을 구비한 응답으로 하기 위한 문법 분석 서브 모듈,
    을 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치.
  13. 제12항에 있어서,
    상기 매핑 서브 모듈은 또한 인간 대화 코퍼스에 있어서 문제 중의 키워드 및 대응되는 응답 중의 키워드를 추출하고, 추출된 키워드에 따라 상기 매핑 관계를 생성하기 위한 것이고, 또는,
    상기 예측 서브 모듈은 또한 인간 대화 코퍼스에 있어서 문제 중의 키워드 및 대응되는 응답 중의 키워드를 추출하고, 또한 대응되는 문맥 정보를 추출하며, 추출된 키워드와 문맥 정보에 따라, 상기 예측 모델을 생성하기 위한 것이며, 또는,
    상기 문법 분석 서브 모듈은 또한 인간 대화 코퍼스에 따라 상기 문법 모델을 생성하거나, 또는, 개방형 인터페이스를 통하여 기타 시스템으로부터 상기 문법 모델을 획득하기 위한 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치.
  14. 제10항, 제12항 및 제13항 중 어느 한 항에 있어서,
    상기 문제를 전처리하여, 상기 획득 모듈을 미리 생성된 모델에 따라 전처리된 문제를 처리하도록 트리거링을 하기 위한 전처리 모듈을 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치.
  15. 제10항, 제12항 및 제13항 중 어느 한 항에 있어서,
    상기 사용자와의 인터랙티브 대화에 따라, 온라인 학습을 하기 위한 온라인 학습 모듈을 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치.
  16. 제10항, 제12항 및 제13항 중 어느 한 항에 있어서,
    기타 시스템을 호출하거나 기타 시스템에 의해 호출되는데 인터페이스를 제공하기 위한 개방형 인터페이스를 더 포함하는 것,
    을 특징으로 하는 인공 지능에 기반한 휴먼 머신 인터랙티브 장치.
  17. 디바이스에 있어서,
    프로세서, 및
    프로세서에 의해 수행 가능한 명령을 저장하기 위한 메모리,를 포함하며,
    상기 프로세서는, 제1항 및 제3항 내지 제9항 중 어느 한 항의 휴먼 머신 인터랙티브 방법을 수행하도록 배치되는 것,
    을 특징으로 하는 디바이스.
  18. 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 저장 매체에서의 명령이 프로세서에 의해 수행될 경우, 프로세서가 제1항 및 제3항 내지 제9항 중 어느 한 항의 휴먼 머신 인터랙티브 방법을 수행 가능하도록 하는 것,
    을 특징으로 하는 비일시적 컴퓨터 판독 가능 저장 매체.
  19. 컴퓨터 판독 가능 저장 매체에 저장되어 있는 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램의 명령어가 프로세서에 의해 수행될 경우, 프로세서가
    제1항 및 제3항 내지 제9항 중 어느 한 항의 휴먼 머신 인터랙티브 방법을 수행 가능하도록 하는 것,
    을 특징으로 하는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020197004771A 2016-09-05 2017-01-23 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치 KR102170563B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610803645.8 2016-09-05
CN201610803645.8A CN106469212B (zh) 2016-09-05 2016-09-05 基于人工智能的人机交互方法和装置
PCT/CN2017/072267 WO2018040501A1 (zh) 2016-09-05 2017-01-23 基于人工智能的人机交互方法和装置

Publications (2)

Publication Number Publication Date
KR20190028793A KR20190028793A (ko) 2019-03-19
KR102170563B1 true KR102170563B1 (ko) 2020-10-27

Family

ID=58230458

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197004771A KR102170563B1 (ko) 2016-09-05 2017-01-23 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치

Country Status (6)

Country Link
US (1) US11645547B2 (ko)
EP (1) EP3508991A4 (ko)
JP (1) JP6726800B2 (ko)
KR (1) KR102170563B1 (ko)
CN (1) CN106469212B (ko)
WO (1) WO2018040501A1 (ko)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649778B (zh) * 2016-12-27 2020-03-03 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN107168990A (zh) * 2017-03-28 2017-09-15 厦门快商通科技股份有限公司 基于用户性格的智能客服系统及对话方法
US10810371B2 (en) 2017-04-06 2020-10-20 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system
US10929759B2 (en) 2017-04-06 2021-02-23 AIBrain Corporation Intelligent robot software platform
US10963493B1 (en) * 2017-04-06 2021-03-30 AIBrain Corporation Interactive game with robot system
US11151992B2 (en) 2017-04-06 2021-10-19 AIBrain Corporation Context aware interactive robot
US10839017B2 (en) 2017-04-06 2020-11-17 AIBrain Corporation Adaptive, interactive, and cognitive reasoner of an autonomous robotic system utilizing an advanced memory graph structure
CN108733722B (zh) * 2017-04-24 2020-07-31 北京京东尚科信息技术有限公司 一种对话机器人自动生成方法及装置
US10628754B2 (en) 2017-06-06 2020-04-21 At&T Intellectual Property I, L.P. Personal assistant for facilitating interaction routines
US11599729B2 (en) * 2017-06-15 2023-03-07 Microsoft Technology Licensing, Llc Method and apparatus for intelligent automated chatting
CN108304436B (zh) 2017-09-12 2019-11-05 深圳市腾讯计算机系统有限公司 风格语句的生成方法、模型的训练方法、装置及设备
CN110019702B (zh) * 2017-09-18 2023-04-07 阿里巴巴集团控股有限公司 数据挖掘方法、装置和设备
CN107818787B (zh) * 2017-10-31 2021-02-05 努比亚技术有限公司 一种语音信息的处理方法、终端及计算机可读存储介质
CN108010531B (zh) * 2017-12-14 2021-07-27 南京美桥信息科技有限公司 一种可视智能问询方法及系统
CN108038230B (zh) * 2017-12-26 2022-05-20 北京百度网讯科技有限公司 基于人工智能的信息生成方法和装置
CN108153875B (zh) * 2017-12-26 2022-03-11 北京金山安全软件有限公司 语料处理方法、装置、智能音箱和存储介质
CN108711423A (zh) * 2018-03-30 2018-10-26 百度在线网络技术(北京)有限公司 智能语音交互实现方法、装置、计算机设备及存储介质
CN110471538B (zh) * 2018-05-10 2023-11-03 北京搜狗科技发展有限公司 一种输入预测方法及装置
CN109033428B (zh) * 2018-08-10 2021-09-10 深圳市磐创网络科技有限公司 一种智能客服方法及系统
WO2020060151A1 (en) 2018-09-19 2020-03-26 Samsung Electronics Co., Ltd. System and method for providing voice assistant service
CN109684453A (zh) * 2018-12-26 2019-04-26 联想(北京)有限公司 一种信息处理方法及电子设备
CN109840255B (zh) * 2019-01-09 2023-09-19 平安科技(深圳)有限公司 答复文本生成方法、装置、设备及存储介质
CN110069707A (zh) * 2019-03-28 2019-07-30 广州创梦空间人工智能科技有限公司 一种人工智能自适应互动教学系统
CN110046242A (zh) * 2019-04-22 2019-07-23 北京六行君通信息科技股份有限公司 一种自动应答装置及方法
CN110223697B (zh) 2019-06-13 2022-04-22 思必驰科技股份有限公司 人机对话方法及系统
CN110689078A (zh) * 2019-09-29 2020-01-14 浙江连信科技有限公司 基于人格分类模型的人机交互方法、装置及计算机设备
KR102380397B1 (ko) * 2019-10-08 2022-03-31 채명진 IoT센서 및 인공지능을 이용한 스마트 빌딩 관리방법
CN111833854A (zh) * 2020-01-08 2020-10-27 北京嘀嘀无限科技发展有限公司 一种人机交互方法与终端、计算机可读存储介质
KR102385198B1 (ko) * 2020-06-25 2022-04-12 (주)아크릴 인공지능 간의 대화를 위한 대화생성 시스템 및 방법
CN113761144A (zh) * 2020-11-16 2021-12-07 北京沃东天骏信息技术有限公司 应答信息确定方法和装置
CN114519101B (zh) 2020-11-18 2023-06-06 易保网络技术(上海)有限公司 数据聚类方法和系统、数据存储方法和系统以及存储介质
CN112667796B (zh) * 2021-01-05 2023-08-11 网易(杭州)网络有限公司 一种对话回复方法、装置、电子设备及可读存储介质
US11610581B2 (en) * 2021-02-05 2023-03-21 International Business Machines Corporation Multi-step linear interpolation of language models
CN113032540B (zh) * 2021-03-19 2023-06-23 北京百度网讯科技有限公司 人机交互方法、装置、设备和存储介质
CN113488030A (zh) * 2021-07-06 2021-10-08 思必驰科技股份有限公司 语音点餐方法、装置及系统
CN113378583A (zh) * 2021-07-15 2021-09-10 北京小米移动软件有限公司 对话回复方法及装置、对话模型训练方法及装置、存储介质
CN116561286B (zh) * 2023-07-06 2023-10-27 杭州华鲤智能科技有限公司 一种对话方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090070311A1 (en) 2007-09-07 2009-03-12 At&T Corp. System and method using a discriminative learning approach for question answering
WO2015023031A1 (ko) 2013-08-14 2015-02-19 숭실대학교산학협력단 전문분야 검색 지원 방법 및 그 장치
CN105068661A (zh) 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) * 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
CN101075435B (zh) * 2007-04-19 2011-05-18 深圳先进技术研究院 一种智能聊天系统及其实现方法
CN101763212B (zh) * 2009-04-30 2012-08-15 广东国笔科技股份有限公司 人机交互系统及其相关系统、设备和方法
EP2839391A4 (en) * 2012-04-20 2016-01-27 Maluuba Inc CONVERSATION AGENT
US9424233B2 (en) * 2012-07-20 2016-08-23 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
KR102175539B1 (ko) * 2013-10-18 2020-11-06 에스케이텔레콤 주식회사 사용자 발화 스타일에 따른 대화형 서비스 장치 및 방법
CN104615646A (zh) * 2014-12-25 2015-05-13 上海科阅信息技术有限公司 智能聊天机器人系统
CN105095444A (zh) * 2015-07-24 2015-11-25 百度在线网络技术(北京)有限公司 信息获取方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090070311A1 (en) 2007-09-07 2009-03-12 At&T Corp. System and method using a discriminative learning approach for question answering
WO2015023031A1 (ko) 2013-08-14 2015-02-19 숭실대학교산학협력단 전문분야 검색 지원 방법 및 그 장치
CN105068661A (zh) 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
중국특허공개공보 105068661 (2015.11.18.) 1부.*

Also Published As

Publication number Publication date
CN106469212A (zh) 2017-03-01
US20190286996A1 (en) 2019-09-19
JP6726800B2 (ja) 2020-07-22
JP2019528512A (ja) 2019-10-10
KR20190028793A (ko) 2019-03-19
CN106469212B (zh) 2019-10-15
EP3508991A4 (en) 2020-02-12
US11645547B2 (en) 2023-05-09
WO2018040501A1 (zh) 2018-03-08
EP3508991A1 (en) 2019-07-10

Similar Documents

Publication Publication Date Title
KR102170563B1 (ko) 인공 지능에 기반한 휴먼 머신 인터랙티브 방법 및 장치
Chen et al. Structure-aware abstractive conversation summarization via discourse and action graphs
US11568855B2 (en) System and method for defining dialog intents and building zero-shot intent recognition models
KR102048030B1 (ko) 자동화 어시스턴트와의 단대단 다국어 통신 촉진
JP6819990B2 (ja) 対話システム及びそのためのコンピュータプログラム
US20100049513A1 (en) Automatic conversation system and conversation scenario editing device
Bell et al. Microblogging as a mechanism for human–robot interaction
Hung et al. Towards a method for evaluating naturalness in conversational dialog systems
Park et al. Systematic review on chatbot techniques and applications
CN114911932A (zh) 基于主题语义增强的异构图结构多会话者情感分析方法
Razavi et al. Managing casual spoken dialogue using flexible schemas, pattern transduction trees, and gist clauses
US20210264812A1 (en) Language learning system and method
KR102624790B1 (ko) 다중 의도 발화의 의도 분석 및 처리를 위한 자연어 처리 장치, 프로그램 및 그것의 제어 방법
Cervone et al. Roving mind: a balancing act between open–domain and engaging dialogue systems
Vyawahare et al. Chatbot assistant for english as a second language learners
Mezza et al. A Multi-Dimensional, Cross-Domain and Hierarchy-Aware Neural Architecture for ISO-Standard Dialogue Act Tagging
Baymurzina et al. Evaluation of conversational skills for commonsense
Shi et al. The design and implementation of intelligent english learning chabot based on transfer learning technology
Nothdurft et al. Application of verbal intelligence in dialog systems for multimodal interaction
Weng Examining conversational programming design needs with convo, a voice-first conversational programming system using natural language
Vázquez Risco et al. Dialogue Management and Language Generation for a Robust Conversational Virtual Coach: Validation and User Study
KR102280792B1 (ko) 대화 재구성 기반의 질의 응답 시스템
JP7295828B2 (ja) 対話中の文脈の因果関係に応じた応答文を推定するプログラム、装置及び方法
Sabharwal et al. Various Cognitive Platforms/Engines
Harshani Sinhala chatbot for train information

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant