KR20230150723A - 분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체 - Google Patents

분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체 Download PDF

Info

Publication number
KR20230150723A
KR20230150723A KR1020230039739A KR20230039739A KR20230150723A KR 20230150723 A KR20230150723 A KR 20230150723A KR 1020230039739 A KR1020230039739 A KR 1020230039739A KR 20230039739 A KR20230039739 A KR 20230039739A KR 20230150723 A KR20230150723 A KR 20230150723A
Authority
KR
South Korea
Prior art keywords
category
semantic
sample
predicted
prediction
Prior art date
Application number
KR1020230039739A
Other languages
English (en)
Inventor
즈난 린
후아펭 친
민 자오
구오신 장
야주안 뤼
Original Assignee
베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 filed Critical 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Publication of KR20230150723A publication Critical patent/KR20230150723A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시는 분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체를 제공하고, 인공 지능 분야에 관한 것으로서, 특히, 지식 그래프, 딥 러닝 및 자연 의미 처리 등 기술에 관한 것이다. 구체적인 구현 방안은 샘플 질의 템플릿 및 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득하고; 여기서, 샘플 질의 템플릿은 샘플 질의 문구 및 예측할 카테고리의 수에 기반하여 구축되며; 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 샘플 의미 카테고리를 얻고; 샘플 의미 카테고리 및 예측할 카테고리의 태그 카테고리에 따라, 의미 분류 모델을 트레이닝한다. 본 개시의 기술에 따르면, 모델의 범용성을 향상시키고, 샘플 불균형 문제에 대응할 수 있다.

Description

분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체{CLASSIFICATION MODEL TRAINING METHOD AND APPARATUS, SEMANTIC CLASSIFICATION METHOD AND APPARATUS, DEVICE AND MEDIUM}
본 개시는 인공 지능 기술분야에 관한 것으로서, 특히, 지식 그래프, 딥 러닝 및 자연 의미 처리 등 기술에 관한 것이다.
텍스트 분류는 자동 텍스트 분류라고도 하고, 컴퓨터가 정보가 로딩된 텍스트를 미리 지정된 임의의 하나의 카테고리 또는 임의의 몇 가지 카테고리 주제에 매핑하는 과정을 의미하며, 감정 분석, 화제 표기, 뉴스 분류, 문답 시스템, 자연어 추리, 대화 행동 분류, 관계 분류 및 이벤트 예측 등과 같은 많은 시나리오에 사용할 수 있다.
본 개시는 분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체를 제공한다.
본 개시의 일 측면에 따르면, 분류 모델 트레이닝 방법을 제공하고, 상기 방법은,
샘플 질의 템플릿 및 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득하는 단계;
샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는 단계; 및
샘플 의미 카테고리 및 예측할 카테고리의 태그 카테고리에 따라, 의미 분류 모델을 트레이닝하는 단계; 를 포함하고, 여기서, 샘플 질의 템플릿은 샘플 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된다.
본 개시의 다른 측면에 따르면, 의미 분류 방법을 더 제공하고, 상기 방법은,
예측 질의 템플릿을 획득하는 단계; 및
예측 질의 템플릿에 따라, 예측할 카테고리의 예측 의미 카테고리를 얻는 단계; 를 포함하고, 여기서, 예측 질의 템플릿은 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된다.
본 개시의 다른 측면에 따르면, 전자 설비를 더 제공하고, 상기 전자 설비는,
적어도 하나의 프로세서; 및
적어도 하나의 프로세서와 통신적으로 연결되는 메모리; 를 포함하되, 여기서,
메모리에는 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되고, 명령이 적어도 하나의 프로세서에 의해 실행되어, 적어도 하나의 프로세서가 본 개시에 따른 실시예에 의해 제공되는 임의의 하나의 분류 모델 트레이닝 방법, 및/또는 의미 분류 방법을 수행할 수 있도록 한다.
본 개시의 다른 측면에 따르면, 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체를 더 제공하고, 여기서, 컴퓨터 명령은 컴퓨터가 본 개시에 따른 실시예에 의해 제공되는 임의의 하나의 분류 모델 트레이닝 방법, 및/또는 의미 분류 방법을 수행하도록 한다.
본 개시의 기술에 따르면, 모델의 범용성을 향상시키고, 샘플 불균형 문제에 대응할 수 있다.
본 문에서 설명된 내용은 본 개시의 실시예의 핵심적인 특징 또는 중요한 특징을 식별하기 위한 것이 아니고, 본 개시의 범위를 한정하려는 의도가 아님을 이해하여야 한다. 본 개시의 기타 특징은 하기 명세서를 통해 쉽게 이해될 수 있다.
도면은 본 방안을 보다 잘 이해하기 위한 것이고, 본 개시를 한정하지 않는다. 여기서,
도 1a는 본 개시에 따른 실시예에 의해 제공되는 분류 모델 트레이닝 방법의 흐름도이다.
도 1b는 본 개시에 따른 실시예에 의해 제공되는 의미 분류 모델의 구조도이다.
도 2는 본 개시에 따른 실시예에 의해 제공되는 다른 분류 모델 트레이닝 방법의 흐름도이다.
도 3은 본 개시에 따른 실시예에 의해 제공되는 다른 분류 모델 트레이닝 방법의 흐름도이다.
도 4a는 본 개시에 따른 실시예에 의해 제공되는 의미 분류 방법의 흐름도이다.
도 4b는 본 개시에 따른 실시예에 의해 제공되는 의미 분류 모델의 구조도이다.
도 5는 본 개시에 따른 실시예에 의해 제공되는 다른 의미 분류 방법의 흐름도이다.
도 6은 본 개시에 따른 실시예에 의해 제공되는 분류 모델 트레이닝 장치의 구조도이다.
도 7은 본 개시에 따른 실시예에 의해 제공되는 의미 분류 장치의 구조도이다.
도 8은 본 개시에 따른 실시예의 분류 모델 트레이닝 방법 및/또는 의미 분류 방법을 구현하기 위한 전자 설비의 블록도이다.
이하, 도면을 결합하여 본 개시의 예시적인 실시예에 대해 설명하도록 하고, 여기서 본 개시의 실시예를 포함하는 각종 상세한 설명은 이해를 돕기 위한 것이며, 이들을 예시적인 것으로 간주하여야 한다. 따라서, 본 분야의 당업자는 본 개시의 범위 및 사상을 벗어나지 않고 여기서 설명된 실시예에 대하여 다양한 변경 및 수정이 가능함을 이해할 것이다. 마찬가지로, 명확하고 간결하게 하기 위해, 이하의 설명에서는 공지된 기능 및 구조에 대한 설명을 생략하도록 한다.
본 개시에 따른 실시예에 의해 제공되는 각 분류 모델 트레이닝 방법은 의미 분류 모델 트레이닝을 수행하는 시나리오에 적용될 수 있고, 해당 방법은 분류 모델 트레이닝 장치에 의해 수행될 수 있으며, 해당 장치는 소프트웨어 및/또는 하드웨어를 사용하여 구현될 수 있고, 구체적으로 전자 설비에 구성된다.
도 1a에 도시된 분류 모델 트레이닝 방법을 참조하면, 상기 방법은 다음 단계를 포함한다:
단계(S101), 샘플 질의 템플릿 및 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득하고; 여기서, 샘플 질의 템플릿은 샘플 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된다.
여기서, 질의 문구는 적어도 하나의 의미 문자에 의해 구축되어 획득된 문구로 이해될 수 있고, 샘플 질의 문구는 모델 트레이닝 과정에서 트레이닝 샘플로 사용되는 질의 문구이다. 여기서, 예측할 카테고리는 샘플 질의 문구의 최대로 예측할 수 있는 카테고리로 이해될 수 있다. 예측할 카테고리의 수는 기술자가 필요 또는 경험값에 따라 설정하거나, 대량의 시험을 통해 결정할 수 있다. 여기서, 예측할 카테고리의 수는 적어도 하나일 수 있다. 추후 트레이닝을 통해 획득된 의미 분류 모델에서 의미 카테고리 예측이 누락되는 상황이 발생하는 것을 방지하기 위해, 일반적으로, 예측할 카테고리의 수를 적어도 2개, 예를 들어, 5개로 설정한다.
설명해야 할 것은, 예측할 카테고리는 예측 가능한 카테고리 중 적어도 하나이고, 일반적으로, 예측할 카테고리의 수는 예측 가능한 카테고리의 수보다 현저하게 작다.
여기서, 샘플 질의 템플릿은 샘플 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된 획일적인 포맷 요구를 구비한 문구이다. 여기서, 예측할 카테고리의 태그 카테고리는 미리 설정된 샘플 질의 문구에 대응되는 표준 의미 카테고리로 이해될 수 있다. 여기서, 본 개시는 태그 카테고리의 구체적인 설정 방식에 대해 한정하지 않으며, 예를 들어, 수동으로 주석화하는 방식을 채택하여 구현할 수 있다.
설명해야 할 것은, 샘플 질의 템플릿 및/또는 상응하는 태그 카테고리는 분류 모델 트레이닝을 수행하는 컴퓨팅 설비의 로컬, 또는 해당 컴퓨팅 설비에 연관된 기타 저장 설비 또는 클라우드에 저장될 수 있고, 필요시, 상응하는 데이터를 획득한다. 본 개시는 상기 각 데이터를 획득하는 방식에 대해 한정하지 않는다.
선택적으로, 분류 모델 트레이닝을 수행하기 전에, 샘플 질의 문구를 획득하고, 샘플 질의 문구 및 예측할 카테고리의 수에 따라, 샘플 질의 템플릿을 실시간으로 구축하여, 추후 분류 모델 트레이닝에서 사용하도록 할 수도 있다.
주의해야 할 점은, 샘플 질의 템플릿 및 상응하는 태그 카테고리를 획득하는 컴퓨팅 설비와 샘플 질의 템플릿을 구축하는 컴퓨팅 설비는 동일하거나 상이할 수 있고, 본 개시는 이에 대해 한정하지 않는다.
단계(S102), 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는다.
샘플 질의 템플릿을 트레이닝 샘플로 하여 미리 구축된 의미 분류 모델에 입력하여, 샘플 질의 템플릿 중 적어도 하나의 예측할 카테고리의 샘플 의미 카테고리를 얻는다. 설명해야 할 것은, 예측된 샘플 의미 카테고리의 수는 예측할 카테고리의 수보다 크지만 않으면 되고, 본 개시는 샘플 의미 카테고리의 구체적인 수에 대해 한정하지 않는다.
여기서, 의미 분류 모델은 종래의 기계 학습 모델 또는 딥 러닝 모델에 기반하여 구현될 수 있고, 본 개시는 해당 의미 분류 모델의 구체적인 네트워크 구조에 대해 한정하지 않는다. 예시적으로, 의미 분류 모델은 PLM(Pre-trained Language Model, 사전 트레이닝 언어 모델)을 사용하여 구현될 수 있다. 예를 들어, 의미 분류 모델은 BERT(Bidirectional Encoder Representation from Transformers, 버트) 또는 ERNIE(Enhanced Representation through Knowledge Integration, 지식 융합을 통한 향상된 표현)모델 등일 수 있다.
일 선택적인 실시예에서, 샘플 질의 템플릿을 트레이닝 샘플로 하여 미리 구축된 의미 분류 모델에 직접 입력할 수 있고, 의미 분류 모델의 출력을 예측할 카테고리의 샘플 의미 카테고리로 직접 사용할 수 있다.
다른 선택적인 실시예에서, 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻고; 각 샘플 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 샘플 의미 카테고리를 얻을 수 있다.
여기서, 예측할 카테고리의 샘플 의미 문자는, 예측할 카테고리 차원에서, 추출된 샘플 질의 템플릿의 의미 특징에 대응되는 문자 정보로 이해될 수 있다. 예시적으로, 임의의 하나의 예측할 카테고리 차원에 대해, 얻을 수 있는 샘플 의미 문자의 수는 적어도 하나이기에, 샘플 의미 문자의 예측 순서에 따라, 각 샘플 의미 문자를 순서대로 조합하여, 예측할 카테고리의 샘플 의미 카테고리를 얻을 수 있다.
이해할 수 있는 것은, 먼저 샘플 의미 문자를 예측한 후, 각 샘플 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는 방식을 통해, 샘플 의미 카테고리를 결정하여, 샘플 의미 카테고리의 결정 메커니즘을 완벽하게 한다. 또한, 샘플 의미 문자의 입도가 작은 점을 감안하여, 문자 입도를 통해 의미 특징을 추출할 수 있어, 예측된 샘플 의미 문자의 정확성을 향상시킨다.
예시적으로, 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 샘플 질의 템플릿 중의 샘플 의미 특징을 추출하고, 샘플 의미 특징에 대해 특징 변환을 수행하여, 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는다. 여기서, 각 예측할 카테고리의 샘플 의미 문자의 수는 동일하거나 상이할 수 있고, 본 개시는 상이한 예측할 카테고리의 샘플 의미 문자의 최대 수에 대해서만 제한하면 된다.
구체적으로, 도 1b에 도시된 의미 분류 모델의 구조도에 결합하면, 해당 의미 분류 모델은 특징 추출 네트워크 및 특징 변환 네트워크를 포함할 수 있다. 임의의 하나의 예측할 카테고리에 대해, 특징 추출 네트워크를 통해, 해당 예측할 카테고리 차원에서 샘플 질의 템플릿에 대해 특징 추출을 수행하여, 해당 예측할 카테고리 차원에서의 샘플 의미 특징을 얻을 수 있고; 특징 변환 네트워크를 통해, 샘플 의미 특징에 대해 특징 변환을 수행하여, 샘플 의미 특징을 의미 특징 공간으로부터 의미 문자 공간에 매핑하고, 의미 문자 공간에서의 매핑 결과와 표준 의미 문자 라이브러리를 매칭하여, 샘플 의미 문자를 얻는다. 상응하게, 각 샘플 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는다.
여기서, 특징 변환은 선형 특징 변환 또는 비선형 특징 변환의 방식을 채택할 수 있고, 본 개시는 이에 대해 한정하지 않는다. 여기서, 표준 의미 문자 라이브러리는 기술자가 필요 또는 경험값에 따라 설정 또는 조정하거나, 대량의 시험을 통해 설정할 수 있다.
이해할 수 있는 것은, 상기 기술 방안은 특징 변환의 방식만을 통해 샘플 의미 문자를 결정하기에, 복잡한 데이터 처리를 수행하지 않아도 되므로, 샘플 의미 문자 결정 과정의 데이터 계산량을 간소화함으로써, 모델 트레이닝 효율의 향상에 도움이 된다.
단계(S103), 샘플 의미 카테고리 및 예측할 카테고리의 태그 카테고리에 따라, 의미 분류 모델을 트레이닝한다.
샘플 의미 카테고리와 예측할 태그의 태그 카테고리 간의 차이에 따라, 손실 함수를 결정하고, 손실 함수에 기반하여 의미 분류 모델의 모델 파라미터를 조정하여, 샘플 의미 태그와 태그 카테고리 간의 차이를 줄이므로, 트레이닝된 의미 분류 모델이 트레이닝 종료 조건을 충족할 때까지, 의미 분류 모델의 분류 능력을 향상시킨다.
여기서, 트레이닝 종료 조건은 의미 분류 모델을 트레이닝하는 샘플 질의 템플릿의 수가 미리 설정된 수의 임계값을 충족하는 것; 손실 함수의 함수값이 안정되는 것; 모델 평가 지표가 미리 설정된 평가 지표 임계값을 충족하는 것; 중 적어도 하나일 수 있다. 여기서, 미리 설정된 수의 임계값 및 미리 설정된 평가 지표 임계값의 구체적인 값은 기술자가 필요 또는 경험값에 따라 설정하거나, 대량의 시험을 통해 결정할 수 있다. 여기서, 모델 평가 지표는 정확도, 민감도 및 특이성 중 적어도 하나를 포함할 수 있다.
본 개시에 따른 실시예는, 샘플 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된 샘플 질의 템플릿을 획득하고, 샘플 질의 템플릿 및 예측할 카테고리의 태그 카테고리에 따라, 미리 구축된 의미 분류 모델을 트레이닝한다. 본 개시는 획일적인 샘플 질의 템플릿에 기반하여 의미 분류 모델을 트레이닝하기 때문에, 카테고리 간의 차이 차원이 아닌 의미 차원에서 샘플을 분류하여, 트레이닝된 의미 분류 모델이 다양한 분류 시나리오에 적응할 수 있도록 하고, 상이한 분류 시나리오에 대해 상이한 분류 모델을 트레이닝하지 않아도 되게 하므로, 트레이닝된 의미 분류 모델의 범용성을 향상시킨다. 또한, 템플릿의 형태를 사용하여, 다양한 샘플 질의 문구의 획일적 통합을 수행하여, 다양한 카테고리 예측 시나리오에서 샘플이 불균형한 문제에 효과적으로 대응할 수 있으므로, 트레이닝된 의미 분류 모델의 작은 샘플 분류 능력의 향상에 도움이 된다.
상기 각 기술 방안의 기초상에서, 본 개시는 하나의 선택적인 실시예를 더 제공한다. 해당 선택적인 실시예에서, 단계(S101)에서 사용된 샘플 질의 템플릿의 구축 메커니즘을 세분화한다. 설명해야 할 것은, 본 개시에 따른 실시예에서 상세하게 설명하지 않은 부분에 대해서는, 기타 실시예의 관련 설명을 참조할 수 있다.
도 2에 도시된 분류 모델 트레이닝 방법을 참조하면, 상기 방법은 다음 단계를 포함한다.
단계(S201), 샘플 의미 카테고리 필링 필드를 포함하는 샘플 카테고리 필링 문구를 구축하고; 여기서, 샘플 의미 카테고리 필링 필드의 수는 예측할 카테고리의 수와 동일하며; 샘플 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 샘플 의미 카테고리를 필링한다.
여기서, 샘플 의미 카테고리 필링 필드는 미리 설정된 블랭크 영역 또는 미리 설정된 식별자가 추가된 영역일 수 있고, 여기서, 미리 설정된 식별자는 기술자가 필요 또는 경험값에 따라 설정 또는 조정할 수 있고, 예를 들어, 널 값(null value) 또는 "MASK" 표기 등일 수 있다.
이해할 수 있는 것은, 샘플 카테고리 필링 문구 중 상이한 샘플 의미 카테고리를 쉽게 구분하기 위해, 상이한 샘플 의미 카테고리 필링 필드 사이에 필드 구분자(Separator)를 추가할 수 있다. 여기서, 필드 구분자는 미리 설정된 문자를 사용하여 구현될 수 있고, 본 개시는 미리 설정된 문자의 구체적인 표현 형태에 대해 한정하지 않는다. 예를 들어, 미리 설정된 문자는 쉼표, 모점, 공란 또는 기타 부호 등일 수 있다.
설명해야 할 것은, 본 개시에서 언급된 예측할 카테고리는 동일한 체계에서의 카테고리 또는 상이한 체계에서의 카테고리일 수 있다. 여기서, 상이한 예측할 카테고리가 속하는 체계는 기술자가 필요 또는 경험값에 따라 설정 또는 조정할 수 있고, 본 개시는 체계의 종류에 대해 한정하지 않는다.
예를 들어 설명하면, 주제 및 의도 두 가지 체계로 구획할 수 있다. 여기서, 종(Species) 귀속 속성을 구비하는 카테고리를 주제 체계로 구획하고, 예를 들어, 인물, 오락인물(Entertainment figures) 등은 모두 주제 체계에 속하며; 데이터 획득 의도를 구비하는 카테고리를 의도 체계로 구획하고, 예를 들어, 키, 체중 등은 모두 의도 체계에 속한다.
예측할 카테고리의 수가 적어도 하나이고, 상이한 예측할 카테고리가 속하는 체계가 상이하면, 즉, 각 예측할 카테고리가 속하는 체계의 수가 적어도 하나인 경우, 임의의 하나의 체계에 대해, 샘플 의미 카테고리 필링 필드를 포함하는 샘플 체계 필링 서브 문구를 구축할 수 있고; 여기서, 샘플 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일하고; 상이한 샘플 체계 필링 서브 문구에 따라, 샘플 카테고리 필링 문구를 결정한다.
구체적으로, 임의의 하나의 체계에 대해, 해당 체계에서의 예측할 카테고리의 수에 따라, 동일한 양의 샘플 의미 카테고리 필링 필드를 설정하고, 설정된 샘플 의미 카테고리 필링 필드를 포함하는 샘플 체계 필링 서브 문구를 구축한다. 예측할 카테고리의 수에 대응되는 체계의 수가 적어도 2개이면, 상이한 체계에 대응되는 각 샘플 체계 필링 서브 문구에 따라, 샘플 카테고리 필링 문구를 결정한다.
예시적으로, 상이한 체계에 대응되는 샘플 체계 필링 서브 문구를 조합하여, 샘플 카테고리 필링 문구를 얻을 수 있다. 나아가, 상이한 체계에서의 예측할 카테고리를 쉽게 구획하기 위해, 샘플 카테고리 필링 문구를 생성할 때, 상이한 샘플 체계 필링 서브 문구 사이에 서브 문구 구분자를 설정할 수 있다. 여기서, 서브 문구 구분자는 미리 설정된 문자를 사용하여 구현될 수 있고, 본 개시는 미리 설정된 문자의 구체적인 표현 형태에 대해 한정하지 않는다. 예를 들어, 미리 설정된 문자는 쉼표, 모점, 공란 또는 기타 부호 등일 수 있다. 설명해야 할 것은, 서브 문구 구분자는 전술한 필드 구분자와 동일하거나 상이할 수 있고, 상이한 샘플 체계 필링 서브 문구를 구분할 수 있도록 보장하기만 하면 된다.
이해할 수 있는 것은, 예측할 카테고리가 속하는 체계를 도입하여, 각 체계에 대해 샘플 체계 필링 서브 문구를 구축하고, 나아가 샘플 체계 필링 서브 문구에 따라 샘플 카테고리 필링 문구를 결정하여, 생성된 샘플 카테고리 필링 문구에서, 예측할 카테고리에 대해 체계 구획을 수행할 수 있다. 또한, 샘플 카테고리 필링 문구는 샘플 질의 템플릿의 생성 기초이기 때문에, 체계의 추가 또는 조정이 용이하여, 상이한 체계에 대해 추후 의미 분류 모델을 각각 트레이닝하지 않아도 되므로, 다양한 샘플 질의 문구에 적용될 수 있어, 모델 범용성의 향상에 도움이 된다. 또한, 다중 체계 다중 카테고리의 의미 분류 모델 트레이닝 과정에서, 상이한 샘플 질의 문구에 의해 트레이닝되는 네트워크 파라미터의 다중화를 구현할 수 있어, 트레이닝 효율의 향상에 도움이 된다.
나아가, 다중 체계 다중 카테고리의 샘플 질의 템플릿을 도입하면, 모델 트레이닝을 수행하는 과정에서, 일반적으로 모델 내부에서 상이한 차원에서의 의미 특징의 교차 강화를 수행하므로, 트레이닝된 모델의 의미 특징 추출 능력의 향상에 도움이 되고, 나아가, 트레이닝된 모델의 정확도의 향상에 도움이 된다.
설명해야 할 것은, 상이한 체계에서의 예측할 카테고리를 쉽게 구획하기 위해, 동일한 체계의 샘플 체계 필링 서브 문구에서, 동일한 필드 구분자를 설정하고, 상이한 샘플 체계 필링 서브 문구에서, 상이한 필드 구분자를 설정할 수 있다.
단계(S202), 샘플 질의 문구 및 샘플 카테고리 필링 문구에 따라, 샘플 질의 템플릿을 구축한다.
샘플 질의 문구 및 샘플 카테고리 필링 문구를 포함하는 샘플 질의 템플릿을 생성한다.
예시적으로, 샘플 질의 문구와 샘플 카테고리 필링 문구를 조합하여, 샘플 질의 템플릿을 얻는다. 나아가, 추후 샘플 의미 카테고리를 예측할 때, 샘플 의미 카테고리를 샘플 질의 템플릿의 샘플 의미 카테고리 필링 필드에 필링한 후, 얻어진 샘플 질의 템플릿의 가독성을 보장하기 위해, 샘플 질의 템플릿을 구축할 때, 샘플 질의 문구와 샘플 카테고리 필링 문구 사이에, 연결 문구를 추가할 수도 있다. 여기서, 연결 문구는 인위적으로 설정될 수 있고, 예를 들어, 연결 문구는 접속사일 수 있다. 물론, 샘플 의미 카테고리 필링 필드에 대해 샘플 의미 카테고리 필링을 수행한 후의 샘플 질의 템플릿의 가독성을 향상시기키 위해, 상이한 샘플 체계 필링 서브 문구 사이에, 연결 문구를 추가할 수도 있다. 본 개시는 샘플 질의 템플릿 중 상이한 위치의 연결 문구의 수 및 내용에 대해 한정하지 않는다.
예를 들어 설명하면, 샘플 질의 문구가 "장삼의 키 및 체중"이고, 예측할 카테고리가 속하는 체계가 주제 체계 및 의도 체계를 포함하며, 각 체계에 대응되는 예측할 카테고리의 수가 3개이면, 다음의 템플릿을 구축할 수 있다. "장삼의 키 및 체중은 [MASK], [MASK], [MASK]; [MASK], [MASK], [MASK]이다". 여기서, "[MASK]"는 샘플 의미 카테고리 필링 필드이고; "[MASK], [MASK], [MASK]; [MASK], [MASK], [MASK]"는 샘플 카테고리 필링 문구이며; "-은"은 접속사이고; "[MASK], [MASK], [MASK]"는 주제 체계에 대응되는 샘플 체계 필링 서브 문구이며, 여기서, ","는 주제 체계에 대응되는 필드 구분자이고; "[MASK], [MASK], [MASK]"는 의도 체계에 대응되는 샘플 체계 필링 서브 문구이며, 여기서, ","는 의도 체계에 대응되는 필드 구분자이고; ";"는 샘플 체계 필링 서브 문구 사이의 서브 문구 구분자이다. 물론, 상기 내용은 구축된 샘플 질의 템플릿에 대해 예시적으로 설명한 것일 뿐, 샘플 질의 템플릿의 구축 방식에 대한 한정으로 이해해서는 아니될 것이다.
단계(S203), 샘플 질의 템플릿 및 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득한다.
단계(S204), 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는다.
앞의 예시에 이어서, 샘플 질의 템플릿은 "장삼의 키 및 체중은 [MASK], [MASK], [MASK]; [MASK], [MASK], [MASK]이다"이고, 결정된 주제 체계에서의 예측할 카테고리는 "인물" 및 "오락인물"을 포함하며, 결정된 의도 체계에서의 예측할 카테고리는 "키" 및 "체중"을 포함하면, 샘플 질의 템플릿 중의 샘플 의미 카테고리 필링 필드가 필링된 후 "장삼의 키 및 체중은 인물, 오락인물, [MASK]; 키, 체중, [MASK]이다"를 얻는다. 필링 후의 샘플 질의 템플릿의 간결성을 보장하기 위해, 필링되지 않은 샘플 의미 카테고리 및 인접하는 필드 구분자를 표시하지 않을 수 있다. 즉, 필링 후의 샘플 질의 템플릿은 "장삼의 키 및 체중은 인물, 오락인물; 키, 체중이다"일 수 있다.
단계(S205), 샘플 의미 카테고리 및 예측할 카테고리의 태그 카테고리에 따라, 의미 분류 모델을 트레이닝한다.
본 개시에 따른 실시예는 샘플 의미 카테고리 필링 필드를 도입하여 샘플 카테고리 필링 문구를 구축하고, 샘플 질의 문구 및 샘플 카테고리 필링 문구에 따라, 샘플 질의 템플릿을 구축하여, 샘플 질의 템플릿의 구축 메커니즘을 완벽하게 하고, 의미 분류 모델의 트레이닝에 대해 데이터 지원을 제공한다. 또한, 상기 획일적인 방식을 통해, 상이한 샘플 질의 문구에 대해 샘플 질의 템플릿을 생성하기 때문에, 네트워크 구조는 특별히 복잡한 의미 분류 모델 없이도 더 좋은 분류 능력을 트레이닝할 수 있으므로, 모델의 복잡도를 간소화하고, 트레이닝 효율의 향상에 도움이 된다.
설명해야 할 것은, 의미 분류 모델 트레이닝을 수행하는 과정에서, 해당 의미 분류 모델은 점차 샘플 질의 템플릿 중의 의미 특징에 기반하여 의미 카테고리를 구획하는 능력을 구비한다. 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리는 주석화 과정에서 주석이 불합리한 경우가 존재할 수 있기에, 태그 카테고리 오류 수정 메커니즘을 도입하여, 주석이 불합리한 태그 카테고리를 보정하므로, 태그 카테고리의 주석 오류로 인해, 의미 분류 모델의 분류 능력에 영향을 미치게 되는 것을 방지한다.
이를 감안하여, 본 개시는 일 선택적인 실시예를 더 제공하고, 해당 선택적인 실시예는, 단계(S103)에서의 의미 분류 모델에 대한 트레이닝 과정에서, 태그 카테고리 오류 수정 메커니즘을 도입하여, 의미 분류 모델의 분류 능력을 향상시킨다. 설명해야 할 것은, 본 개시에 따른 실시예에서 상세하게 설명하지 않은 부분에 대해서는, 기타 실시예의 관련 설명을 참조할 수 있다.
나아가 도 3에 도시된 분류 모델 트레이닝 방법을 참조하면, 상기 방법은 다음 단계를 포함한다.
단계(S301), 샘플 질의 템플릿 및 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득하고; 여기서, 샘플 질의 템플릿은 샘플 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된다.
단계(S302), 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는다.
단계(S303), 샘플 의미 카테고리 및 태그 카테고리에 따라, 태그 이상 유형을 결정한다.
여기서, 태그 이상 유형은 유형 차원에서 샘플 의미 카테고리와 태그 카테고리가 상이할 때의 차이 상황을 특징화한다.
예시적으로, 샘플 의미 카테고리와 태그 카테고리 간의 차이 상황에 따라, 태그 이상 유형을 결정할 수 있다.
일 선택적인 실시예에서, 샘플 의미 카테고리가 태그 카테고리의 하위 카테고리이면, 태그 이상 유형을 상위 예측 하위 유형으로 결정한다.
구체적으로, 태그 카테고리 및 샘플 의미 카테고리가 상하위 소속 관계를 구비하고, 태그 카테고리가 샘플 의미 카테고리의 상위 카테고리이며, 샘플 의미 카테고리가 태그 카테고리의 하위 카테고리이면, 태그 이상 유형을 상위 예측 하위 유형으로 결정한다. 예를 들어, 태그 카테고리는 "게임"이고; 샘플 의미 카테고리는 "장기 게임"이며; "장기 게임"은 "게임"의 하위 카테고리이고, 이때, 대응되는 태그 이상 유형은 "상위 예측 하위 유형"이다.
다른 선택적인 실시예에서, 샘플 의미 카테고리가 태그 카테고리의 상동 변형 카테고리이면, 태그 이상 유형을 소음 유형으로 결정한다.
여기서, 태그 카테고리의 상동 변형 카테고리는, 태그 카테고리에 대해 문자를 직접 추가하거나 삭제하여 얻어진 카테고리로 이해될 수 있다. 예시적으로, 태그 카테고리와 샘플 의미 카테고리의 동일한 문자 비율 또는 유사도를 결정하여, 샘플 의미 카테고리가 태그 카테고리의 상동 변형 카테고리인지를 식별할 수 있다. 샘플 의미 카테고리가 태그 카테고리의 상동 변형 카테고리이면, 태그 이상 유형을 소음 유형으로 결정한다. 예를 들어, 샘플 질의 문구는 "오랫동안 병을 앓으면 의사가 된다의 다음 문장"이고, 해당 샘플 질의 문구의 의도 체계에서의 예측할 카테고리에 대응되는 태그 카테고리는 "기타"이고, 의미 분류 모델에 의해 출력된 샘플 의미 카테고리는 "기타 문장"이며, "기타 문장"은 "기타"의 상동 변형 카테고리이기 때문에, 태그 이상 유형을 소음 유형으로 설정한다.
또 다른 선택적인 실시예에서, 샘플 의미 카테고리가 태그 카테고리의 분리 가능한 카테고리의 조합 카테고리이면, 태그 이상 유형을 혼동 유형으로 결정한다.
여기서, 태그 카테고리의 분리 가능한 카테고리는 복합 의미의 태그 카테고리의 단일 의미 분할 결과로 이해될 수 있다. 여기서, 복합 의미는 적어도 두 층의 단일 의미를 포함할 수 있다. 예를 들어, "박스오피스 차트"가 "박스오피스" 및 "차트"의 복합 의미이면, 태그 카테고리 "박스오피스 차트"에 대응되는 분리 가능한 카테고리는 "박스오피스" 및 "차트"를 포함한다. 샘플 의미 카테고리가 "박스오피스 차트"이면, 태그 이상 유형을 혼동 유형으로 설정한다.
이해할 수 있는 것은, 태그 이상 유형을 상위 예측 하위 유형, 소음 유형 및 혼동 유형 중 적어도 하나를 포함하는 것으로 세분화하여, 태그 이상 유형의 풍부성 및 다양성을 향상시키고, 상이한 유형의 태그 이상 유형을 한정하여, 상이한 태그 이상 유형의 결정 메커니즘을 완벽하게 하고, 상이한 태그 이상 유형에서의 태그 카테고리에 대한 보정에 기초를 마련하게 된다.
단계(S304), 태그 이상 유형에 대응되는 태그 보정 방식에 따라, 태그 카테고리를 조정한다.
예시적으로, 상이한 태그 이상 유형에 대해 상이한 태그 보정 방식을 미리 설정할 수 있고, 상응하게, 태그 이상 유형에 대응되는 태그 보정 방식을 채택하여, 이상 태그 카테고리를 수정할 수 있다.
일 선택적인 실시예에서, 태그 이상 유형이 상위 예측 하위 유형이면, 태그 카테고리를 샘플 의미 카테고리로 직접 대체할 수 있다.
앞의 예시에 이어서, 태그 카테고리가 "게임"이고, 샘플 의미 카테고리가 "장기 게임"이면, 태그 카테고리를 "게임"으로부터 "장기 게임"으로 직접 변경한다.
다른 선택적인 실시예에서, 태그 이상 유형이 소음 유형이면, 태그 카테고리의 상동 변형 카테고리의 대체 가능한 태그에 따라, 태그 카테고리를 조정할 수 있다.
예시적으로, 태그 카테고리의 상동 변형 카테고리의 대체 가능한 태그에서, 그중 하나의 대체 가능한 태그를 태그 카테고리로 선택할 수 있다. 선택적으로, 샘플 질의 문구와 대체 가능한 태그의 유사도를 결정하는 방식 또는 수동적 방식을 채택하여, 대체 가능한 카테고리를 선택할 수 있고, 본 개시는 대체 가능한 태그의 선택 방식에 대해 한정하지 않는다.
앞의 예시에 이어서, 샘플 질의 문구는 "오랫동안 병을 앓으면 의사가 된다의 다음 문장"이고, 해당 샘플 질의 문구의 의도 체계에서의 예측할 카테고리에 대응되는 태그 카테고리는 "기타"이며, 의미 분류 모델에 의해 출력된 샘플 의미 카테고리는 "기타 문장"이면, "기타 문장"의 대체 가능한 태그 "이전 문장" 및 "다음 문장"에서, "다음 문장"을 새로운 태그 카테고리로 선택할 수 있다.
또 다른 선택적인 실시예에서, 태그 이상 유형이 혼동 유형이면, 태그 카테고리를 샘플 의미 또는 태그 카테고리의 분리 가능한 카테고리로 대체한다.
앞의 예시에 이어서, 태그 카테고리는 "박스오피스 차트"이고, 샘플 의미 카테고리는 "박스오피스 차트"이면, 단일 의도 예측 시나리오에서, 단일 의도 예측을 단일 의도 체계에서의 다중 카테고리 예측으로 변환하여, 태그 카테고리를 "박스오피스" 및 "차트"를 포함하는 것으로 보정할 수 있다. 또는, 이중 의도 체계의 단일 카테고리 예측 시나리오에서, 이미 구비하고 있는 제1 의도 체계에서의 "박스오피스" 및 제2 의도 체계에서의 "차트" 뒤에, 새로운 의도 체계 "박스오피스 차트"의 태그 카테고리를 추가한다.
이해할 수 있는 것은, 상이한 태그 이상 유형에서의 태그 카테고리에 대한 보정 과정을 세분화하여, 태그 카테고리 보정 과정의 다양성 및 풍부성을 향상시키고, 상이한 태그 이상 상황을 효과적으로 대응할 수 있으므로, 의미 분류 모델의 정확도의 추가 향상에 기초를 마련하게 된다.
단계(S305), 샘플 의미 카테고리 및 조정된 태그 카테고리에 따라, 의미 분류 모델을 트레이닝한다.
이상적으로 주석화된 태그 카테고리가 아닌 조정된 태그 카테고리에 따라, 의미 분류 모델을 트레이닝함으로써, 의미 분류 모델에 대한 이상적으로 주석화된 태그 카테고리의 네트워크 파라미터를 사용함으로 인해, 의미 분류 모델의 성능이 저하되고, 정확도가 낮아지는 상황이 발생하는 것을 방지하므로, 의미 분류 모델의 정확도 및 강인성의 향상에 도움이 된다.
이상으로, 분류 모델의 트레이닝 과정에 대해 상세하게 설명하였고, 이하에서는, 의미 분류 과정에 대해 상세히 설명하도록 한다.
본 개시에 따른 실시예에 의해 제공되는 각 의미 분류 방법은, 의미 분류를 수행하는 시나리오에 적용될 수 있고, 특히, 전술한 분류 모델 트레이닝 방법에 의해 얻어진 의미 분류 모델에 기반하여, 의미 분류를 수행하는 시나리오에 적용될 수 있다. 해당 방법은 의미 분류 장치에 의해 수행될 수 있고, 해당 장치는 소프트웨어 및/또는 하드웨어를 사용하여 구현될 수 있으며, 구체적으로 전자 설비에 구성된다. 해당 전자 설비는 전술한 분류 모델 트레이닝 방법을 수행하는 컴퓨팅 설비와 동일하거나 상이한 전자 설비일 수 있고, 본 개시는 이에 대해 한정하지 않는다.
도 4a에 도시된 의미 분류 방법을 참조하면, 상기 방법은 다음 단계를 포함한다.
단계(S401), 예측 질의 템플릿을 획득하고; 여기서, 예측 질의 템플릿은 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된다.
여기서, 질의 문구는 적어도 하나의 의미 문자에 의해 구축되어 획득된 문구로 이해될 수 있고, 예측 질의 문구는 의미 분류 과정에서 의미 카테고리 예측을 수행할 질의 문구이다. 여기서, 예측할 카테고리는 예측 질의 문구의 예측할 수 있는 카테고리로 이해될 수 있고, 여기서, 예측할 카테고리의 수는 기술자가 필요 또는 경험값에 따라 설정하거나, 대량의 시험을 통해 결정할 수 있다. 여기서, 예측할 카테고리의 수는 적어도 하나일 수 있다. 상이한 예측 질의 문구에 대해 예측할 카테고리를 결정할 때, 카테고리 예측이 누락되는 상황이 발생하는 것을 방지하기 위해, 일반적으로, 예측할 카테고리의 수를 적어도 2개, 예를 들어, 5개로 설정한다.
설명해야 할 것은, 예측할 카테고리는 예측 가능한 카테고리 중 적어도 하나이고, 일반적으로, 예측할 카테고리의 수는 예측 가능한 카테고리의 수보다 현저하게 작다.
여기서, 예측 질의 템플릿은 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된 획일적인 포맷 요구를 구비한 문구이다. 설명해야 할 것은, 예측 질의 템플릿은 의미 분류 방법을 수행하는 컴퓨팅 설비의 로컬, 또는 해당 컴퓨팅 설비에 연관된 기타 저장 설비 또는 클라우드에 미리 저장될 수 있고, 의미 분류를 수행해야 하는 경우, 상응하는 데이터를 획득한다. 본 개시는 예측 질의 템플릿의 획득 방식에 대해 한정하지 않는다.
선택적으로, 의미 분류를 수행하기 전에, 예측 질의 문구를 획득하고, 예측 질의 문구 및 예측할 카테고리의 수에 따라, 예측 질의 템플릿을 실시간으로 구축할 수도 있다.
주의해야 할 점은, 예측 질의 템플릿을 획득하는 컴퓨팅 설비와 예측 질의 템플릿을 구축하는 컴퓨팅 설비는 동일하거나 상이할 수 있고, 본 개시는 이에 대해 한정하지 않는다.
단계(S402), 예측 질의 템플릿에 따라, 예측할 카테고리의 예측 의미 카테고리를 얻는다.
예시적으로, 예측 질의 템플릿을 트레이닝된 의미 분류 모델의 입력 데이터로 사용하고, 모델 출력 결과에 따라, 예측할 카테고리의 예측 의미 카테고리를 결정할 수 있다. 설명해야 할 것은, 얻어진 예측 의미 카테고리의 수는 예측할 카테고리의 수보다 크지만 않으면 되고, 본 개시는 예측 의미 카테고리의 구체적인 수에 대해 한정하지 않는다. 여기서, 의미 분류 모델은 전술한 적어도 하나의 분류 모델 트레이닝 방법에 의해 트레이닝되어 얻어질 수 있다.
일 선택적인 실시예에서, 예측 질의 템플릿을 트레이닝된 의미 분류 모델에 직접 입력하여, 의미 분류 모델의 출력을 예측할 카테고리의 예측 의미 카테고리로 사용할 수 있다.
다른 선택적인 실시예에서, 예측 질의 템플릿에 따라, 예측할 카테고리의 적어도 하나의 예측 의미 문자를 결정하고; 각 예측 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 예측 의미 카테고리를 얻을 수 있다.
여기서, 예측할 카테고리의 예측 의미 문자는, 예측할 카테고리 차원에서 추출된 예측 질의 템플릿의 의미 특징에 대응되는 문자 정보로 이해될 수 있다. 여기서, 각 예측할 카테고리의 예측 의미 문자의 수는 동일하거나 상이할 수 있고, 본 개시는 상이한 예측할 카테고리의 예측 의미 문자의 최대 수에 대해서만 제한하면 된다.
예시적으로, 예측 질의 템플릿을 트레이닝된 의미 분류 모델에 입력하여, 예측할 카테고리의 적어도 하나의 예측 의미 문자를 얻을 수 있다. 상응하게, 임의의 하나의 예측할 카테고리 차원에 대해, 얻을 수 있는 예측 의미 문자의 수는 적어도 하나이기에, 예측 의미 문자의 예측 순서에 따라, 각 예측 의미 문자를 순서대로 조합하여, 예측할 카테고리의 예측 의미 카테고리를 얻을 수 있다.
이해할 수 있는 것은, 예측 의미 문자를 미리 결정하고, 예측 순서에 따라 각 예측 의미 문자를 조합하여, 예측할 카테고리의 예측 의미 카테고리를 얻는 방식을 통해, 예측 의미 카테고리를 결정하여, 예측 의미 카테고리의 결정 메커니즘을 완벽하게 한다. 또한, 예측 의미 문자의 입도가 작은 점을 감안하여, 문자 입도를 통해 의미 특징을 추출할 수 있어, 결정된 예측 의미 문자의 정확도를 향상시킨다. 또한, 상이한 예측 의미 문자가 많으므로, 상이한 순서의 예측 의미 문자를 조합하기에, 결정된 예측 의미 카테고리의 풍부성 및 다양성을 향상시킨다.
예시적으로, 예측 질의 템플릿에 따라, 예측할 카테고리의 적어도 하나의 예측 의미 문자를 결정하는 것은, 예측 질의 템플릿 중의 예측 의미 특징을 추출하고; 예측 의미 특징에 대해 특징 변환을 수행하여, 예측할 카테고리의 적어도 하나의 예측 의미 문자를 얻는 것일 수 있다.
구체적으로, 도 4b에 도시된 의미 분류 모델의 구조도를 결합하면, 해당 의미 분류 모델은 특징 추출 네트워크 및 특징 변환 네트워크를 포함할 수 있다. 임의의 하나의 예측할 카테고리에 대해, 특징 추출 네트워크를 통해, 해당 예측할 카테고리 차원에서 예측 질의 템플릿에 대해 특징 추출을 수행하여, 해당 예측할 카테고리 차원에서의 예측 의미 특징을 얻을 수 있고; 특징 변환 네트워크를 통해, 예측 의미 특징에 대해 특징 변환을 수행하여, 예측 의미 특징을 의미 특징 공간으로부터 의미 문자 공간에 매핑하고, 의미 문자 공간에서의 매핑 결과와 표준 의미 문자 라이브러리를 매칭하여, 예측 의미 문자를 얻는다. 상응하게, 각 예측 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 예측 의미 카테고리를 얻는다.
여기서, 특징 변환은 선형 특징 변환 또는 비선형 특징 변환의 방식을 채택할 수 있고, 본 개시는 이에 대해 한정하지 않는다. 여기서, 표준 의미 문자 라이브러리는 기술자가 필요 또는 경험값에 따라 설정 또는 조정하거나, 대량의 시험을 통해 설정할 수 있다.
설명해야 할 것은, 의미 분류 결과의 정확도를 보장하기 위해, 의미 분류 모델에 기반하여 예측 의미 문자를 결정하면, 예측 질의 템플릿 중 예측할 카테고리의 예측 의미 문자의 최대 수는 샘플 질의 템플릿 중 예측할 카테고리의 샘플 의미 문자의 최대 수와 일치해야 하고; 특징 변환에서 채택한 특징 변환 방식도 일치해야 하며; 의미 분류 과정에서 사용한 표준 의미 문자 라이브러리와, 분류 모델 트레이닝 과정에서 사용한 표준 의미 문자 라이브러리도 일치해야 한다.
이해할 수 있는 것은, 상기 기술 방안은 특징 변환의 방식만을 통해 예측 의미 문자를 결정하기에, 복잡한 데이터 처리를 수행하지 않아도 되므로, 예측 의미 문자 결정 과정의 데이터 계산량을 간소화함으로써, 의미 분류 효율의 향상에 도움이 된다.
예측 의미 카테고리는 적어도 하나의 문자 예측 비트의 예측 의미 문자가 순서대로 조합되어 얻어질 수 있다. 예측 의미 문자의 다양성을 감안하면, 순서대로 조합하는 방식에 의해 얻어진 예측 의미 카테고리에는 실제 의미가 존재하지 않을 수 있기에, 예측 의미 카테고리 결정 결과의 정확도에 영향을 미치게 된다. 예를 들어, 상이한 문자 예측 비트의 예측 의미 문자가 각각 "오(娛)", "쾌(快)", "인(人)" 및 "물(物)"이면, 조합하여 얻은 예측 의미 카테고리는 "오쾌인물"이지만, "오쾌인물"에는 실제 의미가 존재하지 않는다.
선택적으로, 표준 의미 카테고리 라이브러리에서의 예측 의미 카테고리의 존재성을 판단하고; 존재하면, 실질적인 의미 정보가 존재함을 나타내고; 그렇지 않을 경우, 실질적인 의미 정보가 존재하지 않는다. 여기서, 표준 의미 카테고리 라이브러리에는 예측 가능한 카테고리일 수 있는 표준 의미 카테고리가 저장되어 있고, 각 표준 의미 카테고리는 모두 실질적인 의미를 구비한다. 설명해야 할 것은, 표준 의미 카테고리 라이브러리는 기술자가 필요 또는 경험값에 따라 설정 또는 조정할 수 있고, 본 개시는 이에 대해 한정하지 않는다.
예측 의미 카테고리의 정확도를 향상시키기 위해, 예측 의미 문자를 결정할 때, 적어도 하나의 예측 의미 문자 중 동일한 예측 순서의 예측 의미 문자는 적어도 2개이고, 즉, 동일한 문자 예측 비트에서, 적어도 2개의 예측 의미 문자를 결정하고, 예측 의미 문자의 확률을 도입하여, 상이한 예측 의미 문자가 상응하는 문자 예측 비트에 설정되는 가능성을 구분한다.
상응하게, 각 예측 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 예측 의미 카테고리를 얻는 것은, 상이한 예측 순서의 각 예측 의미 문자를 예측 순서에 따라 조합하여, 적어도 하나의 후보 의미 카테고리를 얻고; 후보 의미 카테고리 중 상이한 예측 의미 문자의 문자 예측 확률에 따라, 후보 의미 카테고리의 카테고리 예측 확률을 결정하며; 카테고리 예측 확률 및 후보 의미 카테고리와 표준 의미 카테고리 라이브러리 중 각 표준 의미 카테고리의 매칭 결과에 따라, 각 후보 의미 카테고리에서 예측 의미 카테고리를 선택하는 것일 수 있다.
예시적으로, 임의의 하나의 예측할 카테고리에 대해, 해당 예측할 카테고리에서의 각 문자 예측 비트 중의 문자 예측 확률을 결정하고; 예측 순서에 따라, 상이한 문자 예측 비트의 예측 의미 문자를 조합하여, 후보 의미 카테고리를 얻으며; 미리 설정된 확률 결정 함수에 기반하여, 후보 의미 카테고리 중 상이한 예측 의미 문자의 문자 예측 확률에 따라, 후보 의미 카테고리의 카테고리 예측 확률을 결정하며; 여기서, 미리 설정된 확률 결정 함수는 문자 예측 확률의 증가 함수이고; 후보 의미 카테고리에서 예측 의미 카테고리로서 카테고리 예측 확률이 높고(예를 들어, 가장 높음), 표준 의미 카테고리 라이브러리 중 각 표준 의미 카테고리와 매칭되는 후보 의미 카테고리를 선택한다.
구체적으로, Beam search(빔 검색) 또는 Bk-tree(Burkhard Keller Tree, Bk 트리)의 방식에 기반하여, 카테고리 예측 확률이 높은 적어도 하나의 후보 의미 카테고리를 결정하고, 그중에서 예측 의미 카테고리로서 카테고리 예측 확률이 높고, 표준 의미 카테고리 라이브러리에서 표준 의미 카테고리와 매칭되는 후보 의미 카테고리를 선택할 수 있다.
앞의 예시에 이어서, 후보 의미 카테고리에 "오쾌인물", "오락인물", "오쾌인원" 및 "오락인원"이 포함되고, 카테고리 예측 확률이 순차적으로 저하되는 경우, "오락인물"만이 표준 의미 카테고리 라이브러리 중의 표준 의미 카테고리이기 때문에, 최종 예측 의미 카테고리로서 "오락인물"을 선택한다.
설명해야 할 것은, 다중 체계 다중 카테고리 예측이 존재하는 경우, 상이한 체계에 대해 설정된 표준 의미 카테고리 라이브러리를 분류할 수 있어, 각 체계에서의 예측 의미 카테고리 결정 결과의 정확도를 향상시키면서, 상이한 체계에서의 표준 의미 카테고리 라이브러리의 혼합 사용으로 인해 계산량이 증가되는 것을 방지한다.
상기 기술 방안은 동일한 예측 순서에서 적어도 2개의 예측 의미 문자를 결정하고, 예측 의미 문자의 문자 예측 확률을 도입하여, 카테고리 예측 확률을 결정함으로써, 카테고리 예측 확률 및 표준 의미 카테고리 라이브러리 중의 표준 의미 카테고리에 기반하여, 예측 의미 카테고리를 결정하기에, 의미 분류 과정에서 분류 결과가 정확하지 않은 상황이 발생되는 것을 방지하고, 분류 예측 결과의 정확도 및 합리성의 향상에 도움이 된다.
본 개시에 따른 실시예는 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된 예측 질의 템플릿을 획득하고, 예측 질의 템플릿에 따라, 예측할 카테고리의 예측 의미 카테고리를 얻는다. 본 개시는 획일적인 예측 질의 템플릿에 기반하여 카테고리 예측을 수행하기 때문에, 카테고리 간의 차이 차원이 아닌 의미 차원에서 분류하므로, 분류 방식이 다양한 분류 시나리오에 적응될 수 있도록 함으로써, 의미 분류의 범용성을 향상시킨다.
나아가 전술한 트레이닝된 의미 분류 모델에 기반하여, 예측 질의 템플릿 중 각 예측할 카테고리의 예측 의미 카테고리를 결정하고, 모델이 다양한 카테고리 예측 시나리오에서 샘플이 불균형한 문제를 대응할 수 있기 때문에, 트레이닝된 의미 분류 모델의 작은 샘플 분류 능력의 향상에 도움이 되므로, 작은 샘플의 경우일 때의 의미 분류 결과의 정확도를 향상시킨다.
상기 각 기술 방안의 기초상에서, 본 개시는 일 선택적인 실시예를 더 제공하고, 해당 선택적인 실시예에서, 단계(S401)에서 사용된 예측 질의 템플릿의 구축 메커니즘을 최적화한다. 설명해야 할 것은, 본 개시에 따른 실시예에서 상세하게 설명하지 않은 부분에 대해서는, 기타 실시예의 관련 설명을 참조할 수 있다.
나아가 도 5에 도시된 의미 분류 방법을 참조하면, 상기 방법은 다음 단계를 포함한다.
단계(S501), 예측 의미 카테고리 필링 필드를 포함하는 예측 카테고리 필링 문구를 구축하고; 여기서, 예측 의미 카테고리 필링 필드의 수는 예측할 카테고리의 수와 동일하며; 예측 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 예측 의미 카테고리를 필링한다.
여기서, 예측 의미 카테고리 필링 필드는 미리 설정된 블랭크 영역 또는 미리 설정된 식별자가 추가된 영역일 수 있고, 여기서, 미리 설정된 식별자는 기술자가 필요 또는 경험값에 따라 설정 또는 조정할 수 있고, 예를 들어, 널 값(null value) 또는 "MASK" 표기 등일 수 있다. 설명해야 할 것은, 여기서, 미리 설정된 식별자는 분류 모델 트레이닝 과정에서의 미리 설정된 식별자와 동일하거나 상이할 수 있다. 바람직하게, 양자가 사용한 미리 설정된 식별자는 동일하다.
이해할 수 있는 것은, 예측 카테고리 필링 문구 중 상이한 예측 의미 카테고리를 쉽게 구분하기 위해, 상이한 예측 의미 카테고리 필링 필드 사이에 필드 구분자(Separator)를 추가할 수 있다. 여기서, 필드 구분자는 미리 설정된 문자를 사용하여 구현될 수 있고, 본 개시는 미리 설정된 문자의 구체적인 표현 형태에 대해 한정하지 않는다. 예를 들어, 미리 설정된 문자는 쉼표, 모점, 공란 또는 기타 부호 등일 수 있다.
설명해야 할 것은, 본 개시에서 언급된 예측할 카테고리는 동일한 체계에서의 카테고리 또는 상이한 체계에서의 카테고리일 수 있다. 여기서, 상이한 예측할 카테고리가 속하는 체계는 기술자가 필요 또는 경험값에 따라 설정 또는 조정할 수 있고, 본 개시는 체계의 종류에 대해 한정하지 않는다.
예를 들어 설명하면, 주제 및 의도 두 가지 체계로 구획할 수 있다. 여기서, 종(Species) 귀속 속성을 구비하는 카테고리를 주제 체계로 구획하고, 예를 들어, 인물, 오락인물(Entertainment figures) 등은 모두 주제 체계에 속하며; 데이터 획득 의도를 구비하는 카테고리를 의도 체계로 구획하고, 예를 들어, 키, 체중 등은 모두 의도 체계에 속한다.
예측할 카테고리의 수가 적어도 하나이고, 상이한 예측할 카테고리가 속하는 체계가 상이하면, 즉, 각 예측할 카테고리가 속하는 체계의 수가 적어도 하나인 경우, 임의의 하나의 체계에 대해, 예측 의미 카테고리 필링 필드를 포함하는 예측 체계 필링 서브 문구를 구축할 수 있고; 여기서, 예측 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일하고; 상이한 예측 체계 필링 서브 문구에 따라, 예측 카테고리 필링 문구를 결정한다.
구체적으로, 임의의 하나의 체계에 대해, 해당 체계에서의 예측할 카테고리의 수에 따라, 동일한 양의 예측 의미 카테고리 필링 필드를 설정하고, 설정된 예측 의미 카테고리 필링 필드를 포함하는 예측 체계 필링 서브 문구를 구축한다. 예측할 카테고리의 수에 대응되는 체계의 수가 적어도 2개이면, 상이한 체계에 대응되는 각 예측 체계 필링 서브 문구에 따라, 예측 카테고리 필링 문구를 결정한다.
예시적으로, 상이한 체계에 대응되는 예측 체계 필링 서브 문구를 조합하여, 예측 카테고리 필링 문구를 얻을 수 있다. 나아가, 상이한 체계에서의 예측할 카테고리를 쉽게 구획하기 위해, 예측 카테고리 필링 문구를 생성할 때, 상이한 예측 체계 필링 서브 문구 사이에 서브 문구 구분자를 설정할 수 있다. 여기서, 서브 문구 구분자는 미리 설정된 문자를 사용하여 구현될 수 있고, 본 개시는 미리 설정된 문자의 구체적인 표현 형태에 대해 한정하지 않는다. 예를 들어, 미리 설정된 문자는 쉼표, 모점, 공란 또는 기타 부호 등일 수 있다. 설명해야 할 것은, 서브 문구 구분자는 전술한 필드 구분자와 동일하거나 상이할 수 있고, 상이한 예측 체계 필링 서브 문구를 구분할 수 있도록 보장하기만 하면 된다.
이해할 수 있는 것은, 예측할 카테고리가 속하는 체계를 도입하여, 각 체계에 대해 예측 체계 필링 서브 문구를 구축하고, 나아가 예측 체계 필링 서브 문구에 따라 예측 카테고리 필링 문구를 결정하여, 생성된 예측 카테고리 필링 문구에서, 예측할 카테고리에 대해 체계 구획을 수행할 수 있다. 또한, 예측 카테고리 필링 문구는 예측 질의 템플릿의 생성 기초이기 때문에, 체계의 추가 또는 조정이 용이하여, 다중 체계에서의 분류 시나리오에 적용할 수 있으므로, 의미 분류의 범용성의 향상에 도움이 된다.
나아가, 다중 체계 다중 카테고리의 예측 질의 템플릿을 도입하면, 전술한 트레이닝된 의미 분류 모델에 기반하여 예측 질의 템플릿을 처리하는 경우, 일반적으로 모델 내부에서 상이한 차원에서의 의미 특징의 교차 강화를 수행하므로, 의미 분류 모델에 의해 추출된 의미 특징의 풍부성 및 정확성을 향상시키고, 나아가 다중 체계 다중 분류에서의 의미 분류 정확도의 향상에 도움이 된다.
설명해야 할 것은, 상이한 체계에서의 예측할 카테고리를 쉽게 구획하기 위해, 동일한 체계의 예측 체계 필링 서브 문구에서, 동일한 필드 구분자를 설정하고, 상이한 예측 체계 필링 서브 문구에서, 상이한 필드 구분자를 설정할 수 있다.
주의해야 할 점은, 본 개시에 따른 실시예 중의 필드 구분자는 분류 모델 트레이닝 과정에서 사용되는 필드 구분자와 동일하거나 상이할 수 있고; 본 개시에 따른 실시예 중의 서브 문구 구분자는 분류 모델 트레이닝 과정에서 사용되는 서브 문구 구분자와 동일하거나 상이할 수 있다. 바람직하게, 본 개시에 따른 실시예 중의 필드 구분자는 분류 모델 트레이닝 과정에서 사용되는 필드 구분자와 동일하고; 본 개시에 따른 실시예 중의 서브 문구 구분자와 분류 모델 트레이닝 과정에서 사용되는 서브 문구 구분자도 동일하다.
단계(S502), 예측 질의 문구 및 예측 카테고리 필링 문구에 따라, 예측 질의 템플릿을 구축한다.
예측 질의 문구 및 예측 카테고리 필링 문구를 포함하는 예측 질의 템플릿을 생성한다.
예시적으로, 예측 질의 문구와 예측 카테고리 필링 문구를 조합하여, 예측 질의 템플릿을 얻는다. 나아가, 추후 예측 의미 카테고리를 결정할 때, 예측 의미 카테고리를 예측 질의 템플릿의 예측 의미 카테고리 필링 필드에 필링한 후, 얻어진 예측 질의 템플릿의 가독성을 보장하기 위해, 예측 질의 템플릿을 구축할 때, 예측 질의 문구와 예측 카테고리 필링 문구 사이에, 연결 문구를 추가할 수도 있다. 여기서, 연결 문구는 인위적으로 설정될 수 있고, 예를 들어, 연결 문구는 접속사일 수 있다. 물론, 예측 의미 카테고리 필링 필드에 대해 예측 의미 카테고리 필링을 수행한 후의 예측 질의 템플릿의 가독성을 향상시키기 위해, 상이한 예측 체계 필링 서브 문구 사이에, 연결 문구를 추가할 수도 있다. 본 개시는 예측 질의 템플릿 중 상이한 위치의 연결 문구의 수 및 내용에 대해 한정하지 않는다.
설명해야 할 것은, 여기서 사용된 연결 문구는 분류 모델 트레이닝 과정에서 사용되는 연결 문구와 동일하거나 상이할 수 있다. 바람직하게, 양자가 사용한 연결 문구는 대응되게 동일하다.
예를 들어 설명하면, 예측 질의 문구가 "장삼의 키 및 체중"이고, 예측할 카테고리가 속하는 체계가 주제 체계 및 의도 체계를 포함하며, 각 체계에 대응되는 예측할 카테고리의 수가 3개이면, 다음의 템플릿을 구축할 수 있다. "장삼의 키 및 체중은 [MASK], [MASK], [MASK]; [MASK], [MASK], [MASK]이다". 여기서, "[MASK]"는 예측 의미 카테고리 필링 필드이고; "[MASK], [MASK], [MASK]; [MASK], [MASK], [MASK]"는 예측 카테고리 필링 문구이며; "-은"은 접속사이고; "[MASK], [MASK], [MASK]"는 주제 체계에 대응되는 예측 체계 필링 서브 문구이며, 여기서, ","는 주제 체계에 대응되는 필드 구분자이고; "[MASK], [MASK], [MASK]"는 의도 체계에 대응되는 예측 체계 필링 서브 문구이며, 여기서, ","는 의도 체계에 대응되는 필드 구분자이고; ";"는 예측 체계 필링 서브 문구 사이의 서브 문구 구분자이다. 물론, 상기 내용은 구축된 예측 질의 템플릿에 대해 예시적으로 설명한 것일 뿐, 예측 질의 템플릿의 구축 방식에 대한 한정으로 이해해서는 아니될 것이다.
단계(S503), 예측 질의 템플릿에 따라, 예측할 카테고리의 예측 의미 카테고리를 얻는다.
본 개시에 따른 실시예는 예측 의미 카테고리 필링 필드를 도입하여 샘플 카테고리 필링 문구를 구축하고, 예측 질의 문구 및 예측 카테고리 필링 문구에 따라, 예측 질의 템플릿을 구축하여, 예측 질의 템플릿의 구축 메커니즘을 완벽하게 하고, 추후 예측 의미 카테고리의 결정에 대해 데이터 지원을 제공한다. 또한, 상기 획일적인 방식을 통해, 상이한 예측 질의 문구에 대해 예측 질의 템플릿을 생성하기 때문에, 예측 질의 문구를 대량으로 쉽게 처리하고, 의미 분류 효율의 향상에 도움이 된다.
상기 각 분류 모델 트레이닝 방법의 구현으로서, 본 개시는 상기 각 분류 모델 트레이닝 방법을 실시하는 수행 장치의 선택적인 실시예를 더 제공한다. 해당 장치는 의미 분류 모델 트레이닝을 수행하는 시나리오에 적용되고, 소프트웨어 및/또는 하드웨어를 사용하여 구현될 수 있으며, 구체적으로 전자 설비에 구성된다.
나아가 도 6에 도시된 분류 모델 트레이닝 장치(600)를 참고하면, 상기 장치는 샘플 질의 템플릿 획득 모듈(601), 샘플 의미 카테고리 결정 모듈(602) 및 의미 분류 모델 트레이닝 모듈(603)을 포함한다.
샘플 질의 템플릿 획득 모듈(601)은 샘플 질의 템플릿 및 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득하고; 여기서, 샘플 질의 템플릿은 샘플 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된다.
샘플 의미 카테고리 결정 모듈(602)은 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는다.
의미 분류 모델 트레이닝 모듈(603)은 샘플 의미 카테고리 및 예측할 카테고리의 태그 카테고리에 따라, 의미 분류 모델을 트레이닝한다.
본 개시는 획일적인 샘플 질의 템플릿에 기반하여 의미 분류 모델을 트레이닝하기 때문에, 카테고리 간의 차이 차원이 아닌 의미 차원에서 샘플을 분류하여, 트레이닝된 의미 분류 모델이 다양한 분류 시나리오에 적응할 수 있도록 하고, 상이한 분류 시나리오에 대해 상이한 분류 모델을 트레이닝하지 않아도 되게 하므로, 트레이닝된 의미 분류 모델의 범용성을 향상시킨다. 또한, 템플릿의 형태를 사용하여, 다양한 샘플 질의 문구의 획일적 통합을 수행하여, 다양한 카테고리 예측 시나리오에서 샘플이 불균형한 문제에 효과적으로 대응할 수 있으므로, 트레이닝된 의미 분류 모델의 작은 샘플 분류 능력의 향상에 도움이 된다.
일 선택적인 실시예에서, 해당 장치(600)는 샘플 질의 템플릿 구축 모듈을 더 포함하고, 구체적으로,
샘플 의미 카테고리 필링 필드를 포함하는 샘플 카테고리 필링 문구를 구축하는 샘플 카테고리 필링 문구 구축 유닛; 및
샘플 질의 문구 및 샘플 카테고리 필링 문구에 따라, 샘플 질의 템플릿을 구축하는 샘플 질의 템플릿 구축 유닛; 을 포함하고, 여기서, 샘플 의미 카테고리 필링 필드의 수는 예측할 카테고리의 수와 동일하고; 샘플 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 샘플 의미 카테고리를 필링한다.
일 선택적인 실시예에서, 예측할 카테고리가 속하는 체계의 수는 적어도 하나이고;
샘플 카테고리 필링 문구 구축 유닛은,
임의의 하나의 체계에 대해, 샘플 의미 카테고리 필링 필드를 포함하는 샘플 체계 필링 서브 문구를 구축하는 샘플 체계 필링 서브 문구 구축 서브 유닛; 및
상이한 샘플 체계 필링 서브 문구에 따라, 샘플 카테고리 필링 문구를 결정하는 샘플 카테고리 필링 문구 결정 서브 유닛; 을 포함하고, 여기서, 샘플 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일하다.
일 선택적인 실시예에서, 샘플 카테고리 필링 문구 중 상이한 샘플 체계 필링 서브 문구 사이에는 서브 문구 구분자가 설정되어 있고; 및/또는, 샘플 체계 필링 서브 문구 중 상이한 샘플 의미 카테고리 필링 필드 사이에는 필드 구분자가 설정되어 있다.
일 선택적인 실시예에서, 샘플 체계 필링 서브 문구에 필드 구분자가 설정되어 있으면, 동일한 샘플 체계 필링 서브 문구 중의 필드 구분자는 동일하고, 상이한 샘플 체계 필링 서브 문구 중의 필드 구분자는 상이하다.
일 선택적인 실시예에서, 의미 분류 모델 트레이닝 모듈(603)은,
샘플 의미 카테고리 및 태그 카테고리에 따라, 태그 이상 유형을 결정하는 태그 이상 유형 결정 유닛;
태그 이상 유형에 대응되는 태그 보정 방식에 따라, 태그 카테고리를 조정하는 태그 카테고리 조정 유닛; 및
샘플 의미 카테고리 및 조정된 태그 카테고리에 따라, 의미 분류 모델을 트레이닝하는 의미 분류 모델 트레이닝 유닛; 을 포함한다.
일 선택적인 실시예에서, 태그 이상 유형 결정 유닛은,
샘플 의미 카테고리가 태그 카테고리의 하위 카테고리이면, 태그 이상 유형을 상위 예측 하위 유형으로 결정하는 상하위 유형 결정 서브 유닛;
샘플 의미 카테고리가 태그 카테고리의 상동 변형 카테고리이면, 태그 이상 유형을 소음 유형으로 결정하는 소음 유형 결정 서브 유닛; 및
샘플 의미 카테고리가 태그 카테고리의 분리 가능한 카테고리의 조합 카테고리이면, 태그 이상 유형을 혼동 유형으로 결정하는 혼동 유형 결정 서브 유닛; 을 포함한다.
일 선택적인 실시예에서, 태그 카테고리 조정 유닛은,
태그 이상 유형이 상위 예측 하위 유형이면, 태그 카테고리를 샘플 의미 카테고리로 대체하는 상하위 유형 조정 서브 유닛;
태그 이상 유형이 소음 유형이면, 태그 카테고리의 상동 변형 카테고리의 대체 가능한 태그에 따라, 태그 카테고리를 조정하는 소음 유형 조정 서브 유닛; 및
태그 이상 유형이 혼동 유형이면, 태그 카테고리를 샘플 의미 카테고리 또는 태그 카테고리의 분리 가능한 카테고리로 대체하는 혼동 유형 조정 서브 유닛; 을 포함한다.
일 선택적인 실시예에서, 샘플 의미 카테고리 결정 모듈(602)은,
샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는 샘플 의미 문자 결정 유닛; 및
각 샘플 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 샘플 의미 카테고리를 얻는 샘플 의미 카테고리 결정 유닛; 을 포함한다.
일 선택적인 실시예에서, 샘플 의미 문자 결정 유닛은 구체적으로,
샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 샘플 질의 템플릿 중의 샘플 의미 특징을 추출하고, 샘플 의미 특징에 대해 특징 변환을 수행하여, 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는다.
상기 분류 모델 트레이닝 장치는 본 개시에 따른 임의의 실시예에서 제공하는 분류 모델 트레이닝 방법을 수행할 수 있고, 각 분류 모델 트레이닝 방법을 수행하기 위한 상응한 기능 모듈 및 유익한 효과를 구비한다.
상기 각 의미 분류 방법의 구현으로서, 본 개시는 상기 각 의미 분류 방법을 실시하는 수행 장치의 선택적인 실시예를 더 제공한다. 해당 장치는 의미 분류를 수행하는 시나리오에 적용되고, 특히, 전술한 분류 모델 트레이닝 방법에 의해 얻어진 의미 분류 모델에 기반하여 의미 분류를 수행하는 시나리오에 적용된다. 해당 장치는 소프트웨어 및/또는 하드웨어를 사용하여 구현될 수 있고, 구체적으로 전자 설비에 구성된다.
나아가 도 7에 도시된 의미 분류 장치(700)를 참고하면, 상기 장치는 예측 질의 템플릿 획득 모듈(701) 및 예측 의미 카테고리 결정 모듈(702)을 포함한다.
예측 질의 템플릿 획득 모듈(701)은 예측 질의 템플릿을 획득하고; 여기서, 예측 질의 템플릿은 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된다.
예측 의미 카테고리 결정 모듈(702)은 예측 질의 템플릿에 따라, 예측할 카테고리의 예측 의미 카테고리를 얻는다.
본 개시에 따른 실시예는 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축된 예측 질의 템플릿을 획득하고, 예측 질의 템플릿에 따라, 예측할 카테고리의 예측 의미 카테고리를 얻는다. 본 개시는 획일적인 예측 질의 템플릿에 기반하여 카테고리 예측을 수행하기 때문에, 카테고리 간의 차이 차원이 아닌 의미 차원에서 분류하므로, 분류 방식이 다양한 분류 시나리오에 적응될 수 있도록 함으로써, 의미 분류의 범용성을 향상시킨다.
일 선택적인 실시예에서, 해당 장치(700)는 예측 질의 템플릿 구축 모듈을 더 포함하고, 구체적으로,
예측 의미 카테고리 필링 필드를 포함하는 예측 카테고리 필링 문구를 구축하는 예측 카테고리 필링 문구 구축 유닛; 및
예측 질의 문구 및 예측 카테고리 필링 문구에 따라, 예측 질의 템플릿을 구축하는 예측 질의 템플릿 구축 유닛; 을 포함하고, 여기서, 예측 의미 카테고리 필링 필드의 수는 예측할 카테고리의 수와 동일하며; 예측 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 예측 의미 카테고리를 필링한다.
일 선택적인 실시예에서, 예측할 카테고리가 속하는 체계의 수는 적어도 하나이고;
예측 카테고리 필링 문구 구축 유닛은,
임의의 하나의 체계에 대해, 예측 의미 카테고리 필링 필드를 포함하는 예측 체계 필링 서브 문구를 구축하는 예측 체계 필링 서브 문구 구축 서브 유닛; 및
상이한 예측 체계 필링 서브 문구에 따라, 예측 카테고리 필링 문구를 결정하는 예측 카테고리 필링 문구 구축 서브 유닛; 을 포함하고, 여기서, 예측 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일하다.
일 선택적인 실시예에서, 예측 카테고리 필링 문구 중 상이한 예측 체계 필링 서브 문구 사이에는 서브 문구 구분자가 설정되어 있고; 및/또는, 예측 체계 필링 서브 문구 중 상이한 예측 의미 카테고리 필링 필드 사이에는 필드 구분자가 설정되어 있다.
일 선택적인 실시예에서, 예측 체계 필링 서브 문구에 필드 구분자가 설정되어 있으면, 동일한 예측 체계 필링 서브 문구 중의 필드 구분자는 동일하고, 상이한 예측 체계 필링 서브 문구 중의 필드 구분자는 상이하다.
일 선택적인 실시예에서, 예측 의미 카테고리 결정 모듈(702)은,
예측 질의 템플릿에 따라, 예측할 카테고리의 적어도 하나의 예측 의미 문자를 결정하는 예측 의미 문자 결정 유닛; 및
각 예측 의미 문자를 예측 순서에 따라 조합하여, 예측할 카테고리의 예측 의미 카테고리를 얻는 예측 의미 카테고리 결정 유닛; 을 포함한다.
일 선택적인 실시예에서, 적어도 하나의 예측 의미 문자 중 동일한 예측 순서의 예측 의미 문자는 적어도 2개이고;
예측 의미 카테고리 결정 유닛은,
상이한 예측 순서의 각 예측 의미 문자를 예측 순서에 따라 조합하여, 적어도 하나의 후보 의미 카테고리를 얻는 후보 의미 카테고리 결정 서브 유닛;
후보 의미 카테고리 중 상이한 예측 의미 문자의 문자 예측 확률에 따라, 후보 의미 카테고리의 카테고리 예측 확률을 결정하는 카테고리 예측 확률 결정 서브 유닛; 및
카테고리 예측 확률 및 후보 의미 카테고리와 표준 의미 카테고리 라이브러리 중 각 표준 의미 카테고리의 매칭 결과에 따라, 각 후보 의미 카테고리에서 예측 의미 카테고리를 선택하는 예측 의미 카테고리 선택 서브 유닛; 을 포함한다.
일 선택적인 실시예에서, 예측 의미 문자 결정 유닛은,
예측 질의 템플릿 중의 예측 의미 특징을 추출하는 예측 의미 특징 추출 서브 유닛; 및
예측 의미 특징에 대해 특징 변환을 수행하여, 예측할 카테고리의 적어도 하나의 예측 의미 문자를 얻는 예측 의미 문자 결정 서브 유닛; 을 포함한다.
상기 의미 분류 장치는 본 개시에 따른 임의의 실시예에서 제공하는 의미 분류 방법을 수행할 수 있고, 각 의미 분류 방법을 수행하기 위한 상응한 기능 모듈 및 유익한 효과를 구비한다.
본 개시의 기술 방안에서, 언급된 샘플 질의 템플릿, 태그 카테고리, 예측 질의 템플릿의 수집, 저장, 사용, 가공, 전송, 제공 및 공개 등 처리는 모두 관련 법규의 규정에 부합되고, 공서양속을 위반하지 않는다.
본 개시의 실시예에 따르면, 본 개시는 전자 설비, 판독 가능 저장 매체 및 컴퓨터 프로그램 제품을 더 제공한다.
도 8은 본 개시에 따른 실시예의 예시를 실시하기 위한 전자 설비(800)의 예시적인 블록도를 도시한다. 전자 설비는 다양한 형태의 디지털 컴퓨터, 예를 들어, 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크테이블, 개인용 정보 단말기, 서버, 블레이드 서버, 대형 컴퓨터 및 기타 적합한 컴퓨터를 나타낸다. 전자 설비는 다양한 형태의 모바일 장치, 예를 들어, 개인 디지털 처리, 휴대 전화기, 스마트폰, 웨어러블 설비 및 기타 유사한 컴퓨팅 장치를 나타낼 수도 있다. 본 문에서 설명된 컴포넌트, 이들의 연결과 관계 및 이들의 기능은 단지 예시적인 것일 뿐, 본 문에서 기술 및/또는 요구한 본 개시의 구현을 제한하려는 의도가 아니다.
도 8에 도시된 바와 같이, 설비(800)는 컴퓨팅 유닛(801)을 포함하되 이는 롬(ROM)(802)에 저장된 컴퓨터 프로그램 또는 저장 유닛(808)으로부터 램(RAM)(803)에 로딩되는 컴퓨터 프로그램에 따라, 각종 적합한 동작 및 처리를 수행할 수 있다. RAM(803)에는 설비(800)의 조작에 필요한 각종 프로그램 및 데이터가 저장될 수도 있다. 컴퓨팅 유닛(801), ROM(802) 및 RAM(803)은 버스(804)를 통해 서로 연결된다. 입력/출력(I/O) 인터페이스(805)도 버스(804)에 연결된다.
설비(800) 중의 복수 개의 컴포넌트는 I/O 인터페이스(805)에 연결되고, 해당 컴포넌트는 예를 들어 키패드, 마우스 등과 같은 입력 유닛(806); 예를 들어 각종 유형의 표시장치, 스피커 등과 같은 출력 유닛(807); 예를 들어 자기디스크, 광디스크 등과 같은 저장 유닛(808); 및 예를 들어 네트워크 카드, 모뎀, 무선통신 트랜시버 등과 같은 통신 유닛(809)을 포함한다. 통신 유닛(809)은 설비(800)가 인터넷과 같은 컴퓨터 네트워크 및/또는 각종 전기 통신망을 통해 기타 설비와 정보/데이터를 교환하는 것을 허용한다.
컴퓨팅 유닛(801)은 처리 및 컴퓨팅 능력을 갖는 각종 범용 및/또는 전용 처리 컴포넌트일 수 있다. 컴퓨팅 유닛(801)의 일부 예시는 중앙 처리 유닛(CPU), 그래픽 처리 유닛(GPU), 각종 전용 인공 지능(AI) 컴퓨팅 칩, 기계 러닝 모델 알고리즘을 수행하는 각종 컴퓨팅 유닛, 디지털 신호 프로세서(DSP) 및 임의의 적합한 프로세서, 컨트롤러, 마이크로 컨트롤러 등을 포함하지만, 이에 한정되지 않는다. 컴퓨팅 유닛(801)은 위에서 설명한 각각의 방법 및 처리를 수행하고, 예를 들어, 분류 모델 트레이닝 방법 및/또는 의미 분류 방법을 수행한다. 예를 들어, 일부 실시예에서, 분류 모델 트레이닝 방법 및/또는 의미 분류 방법은 컴퓨터 소프트웨어 프로그램으로 구현될 수 있고, 이는 저장 유닛(808)과 같은 기계 판독 가능 매체에 유형적으로 포함된다. 일부 실시예에서, 컴퓨터 프로그램의 일부 또는 전체는 ROM(802) 및/또는 통신 유닛(809)에 의해 설비(800)에 로딩 및/또는 장착될 수 있다. 컴퓨터 프로그램이 RAM(803)에 로딩되어 컴퓨팅 유닛(801)에 의해 실행되는 경우, 위에서 설명한 분류 모델 트레이닝 방법 및/또는 의미 분류 방법의 하나 이상의 단계를 수행할 수 있다. 대안적으로, 기타 실시예에서, 컴퓨팅 유닛(801)은 기타 임의의 적합한 방식(예를 들어, 펌웨어를 통해)을 통해 분류 모델 트레이닝 방법 및/또는 의미 분류 방법을 수행하도록 구성될 수 있다.
본 문에서 상술한 시스템 및 기술의 각종 실시형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 필드 프로그래머블 게이트 어레이(FPGA), 주문형 집적 회로(ASIC), 특정 용도 표준 제품(ASSP), 시스템온칩(SOC), 복합 프로그래머블 로직 설비(CPLD), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합으로 구현될 수 있다. 이러한 각종 실시형태는 하나 이상의 컴퓨터 프로그램에서 실시되는 것을 포함할 수 있고, 해당 하나 이상의 컴퓨터 프로그램은 적어도 하나의 프로그래밍 가능한 프로세서를 포함하는 프로그래밍 가능한 시스템에서 실행 및/또는 해석(interpretating)될 수 있으며, 해당 프로그래밍 가능한 프로세서는 전용 또는 범용 프로그래밍 가능한 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신할 수 있으며, 데이터 및 명령을 상기 저장 시스템, 상기 적어도 하나의 입력 장치 및 상기 적어도 하나의 출력 장치로 전송한다.
본 개시의 방법을 실시하기 위한 프로그램 코드는 하나 이상의 프로그래밍 언어의 임의의 조합을 사용하여 작성될 수 있다. 이러한 프로그램 코드는 범용 컴퓨터, 전용 컴퓨터 또는 기타 프로그래밍 가능한 데이터 처리 장치의 프로세서 또는 컨트롤러에 제공되어, 프로그램 코드가 프로세서 또는 컨트롤러에 의해 실행되면, 흐름도 및/또는 블록도에 규정된 기능/조작이 실시될 수 있도록 한다. 프로그램 코드는 전체가 기계에서 실행되거나, 일부가 기계에서 실행되고, 독립적인 소프트웨어 패키지로서 일부가 기계에서 실행되고 일부가 원격 기계에서 실행되거나, 전부가 원격 기계 또는 서버에서 실행될 수 있다.
본 개시의 전문에서, 기계 판독 가능 매체는 유형 매체(tangible medium)일 수 있고, 이는 명령 실행 시스템, 장치 또는 설비에 의해 사용되거나, 명령 실행 시스템, 장치 또는 설비와 결합하여 사용되는 프로그램을 포함하거나 저장할 수 있다. 기계 판독 가능 매체는 기계 판독 가능 신호 매체 또는 기계 판독 가능 저장 매체일 수 있다. 기계 판독 가능 매체는 전자, 자기, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 설비, 또는 상기 내용의 임의의 적합한 조합을 포함할 수 있지만 이에 한정되지 않는다. 기계 판독 가능 저장 매체의 보다 구체적인 예시는 하나 이상의 와이어에 기반한 전기적 연결, 휴대용 컴퓨터 디스크, 하드디스크, 램(RAM), 롬(ROM), 이피롬(EPROM 또는 플래시 메모리), 광섬유, 휴대용 콤팩트 디스크 롬(CD-ROM), 광학 저장 설비, 자기 저장 설비 또는 상기 내용의 임의의 적합한 조합을 포함한다.
사용자와의 인터랙션을 제공하기 위해, 여기서 설명된 시스템 및 기술을 컴퓨터에서 실시할 수 있고, 해당 컴퓨터는 사용자에게 정보를 표시하기 위한 표시장치(예를 들어, CRT(음극선관) 또는 LCD(액정 표시장치)모니터), 키보드 및 방향지시 장치(예를 들어, 마우스 또는 트랙볼)를 구비하며, 사용자는 해당 키보드 및 해당 방향지시 장치를 통해 컴퓨터에 입력을 제공할 수 있다. 기타 유형의 장치는 사용자와의 인터랙션을 제공할 수도 있고, 예를 들어, 사용자에게 제공되는 피드백은 임의의 형태의 센싱 피드백(예를 들어, 시각 피드백, 청각 피드백 또는 촉각 피드백)일 수 있으며, 임의의 형태(사운드 입력, 음성 입력 또는 촉각 입력을 포함함)로 사용자로부터의 입력을 수신할 수 있다.
여기서 설명된 시스템 및 기술은 백엔드 컴포넌트를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버), 또는 미들웨어 컴포넌트를 포함하는 컴퓨팅 시스템(예를 들어, 애플리케이션 서버), 또는 프런트엔드 컴포넌트를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 사용자 인터페이스 또는 웹브라우저를 구비하는 사용자 컴퓨터, 사용자는 해당 그래픽 사용자 인터페이스 또는 해당 웹브라우저를 통해 여기서 설명된 시스템 및 기술의 실시형태와 인터랙션할 수 있음), 또는 이러한 백엔드 컴포넌트, 미들웨어 컴포넌트, 또는 프런트엔드 컴포넌트를 포함하는 임의의 조합의 컴퓨팅 시스템에서 실시될 수 있다. 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)으로 시스템의 컴포넌트를 서로 연결할 수 있다. 통신 네트워크의 예시는 근거리 통신망(LAN), 광역 네트워크(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트 및 서버는 일반적으로 서로 멀리 떨어져 있고, 통상적으로 통신 네트워크를 통해 인터랙션을 수행한다. 클라이언트와 서버의 관계는 상응하는 컴퓨터에서 작동되고 서로 클라이언트-서버 관계를 갖는 컴퓨터 프로그램에 의해 발생된다. 서버는 클라우드 컴퓨팅 서버라고도 칭하는 클라우드 서버 또는 클라우드 컴퓨팅 서비스 체계 중의 호스트 제품인 클라우드 호스트일 수 있고, 종래의 물리적 호스트와 VPS 서비스에 존재하는 관리 난이도가 크고, 비즈니스 확장성이 약한 결함을 해결한다. 서버는 분산 시스템의 서버, 또는 블록체인을 결합한 서버일 수도 있다.
인공 지능은 컴퓨터가 사람의 특정 사고 과정과 지능적 행위(예를 들어, 학습, 추론, 사고, 계획 등)를 시뮬레이션하는 것을 연구하는 학과로서, 하드웨어적인 기술을 구비할 뿐만 아니라 소프트웨어적인 기술도 구비한다. 인공 지능 하드웨어 기술은 일반적으로 센서, 전용 인공 지능 칩, 클라우드 컴퓨팅, 분산식 저장, 빅데이터 처리 등과 같은 기술을 포함하고; 인공 지능 소프트웨어 기술은 주로 컴퓨터 비전 기술, 음성 인식 기술, 자연어 처리 기술 및 기계 학습/딥러닝 기술, 빅데이터 처리 기술, 지식 그래프(Knowledge Graph) 기술 등 방향을 포함한다.
상술한 각종 형태의 프로세스를 사용하여 단계의 순서재배정, 추가 또는 삭제를 수행할 수 있음을 이해해야 한다. 예를 들어, 본 개시에 기재된 각 단계는 병렬로 수행될 수 있거나 순차적으로 수행될 수도 있거나 서로 다른 순서로 수행될 수도 있으며, 본 개시에서 제공한 기술방안이 희망하는 결과를 달성하기만 하면 되기 때문에, 본 문에서는 이에 대해 한정하지 않는다.
상기 구체적인 실시형태는 본 개시의 보호 범위를 한정하지 않는다. 본 분야의 당업자는 설계 요구 및 기타 요소에 따라 각종 수정, 조합, 부분 조합 및 대체가 가능함을 이해할 수 있을 것이다. 본 개시의 사상 및 원칙 내에서 이루어진 수정, 등가적 대체 및 개선 등은 모두 본 개시의 보호 범위 내에 포함되어야 한다.

Claims (39)

  1. 샘플 질의 템플릿 및 상기 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득하는 단계-여기서, 상기 샘플 질의 템플릿은 샘플 질의 문구 및 상기 예측할 카테고리의 수에 기반하여 구축됨-;
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 예측할 카테고리의 샘플 의미 카테고리를 얻는 단계; 및
    상기 샘플 의미 카테고리 및 상기 예측할 카테고리의 태그 카테고리에 따라, 상기 의미 분류 모델을 트레이닝하는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  2. 제 1 항에 있어서,
    상기 샘플 질의 템플릿은,
    샘플 의미 카테고리 필링 필드를 포함하는 샘플 카테고리 필링 문구를 구축하는 방식-여기서, 상기 샘플 의미 카테고리 필링 필드의 수는 상기 예측할 카테고리의 수와 동일하고; 상기 샘플 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 샘플 의미 카테고리를 필링함-; 및
    상기 샘플 질의 문구 및 상기 샘플 카테고리 필링 문구에 따라, 상기 샘플 질의 템플릿을 구축하는 방식에 의해 구축되어 얻어지는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  3. 제 2 항에 있어서,
    상기 예측할 카테고리가 속하는 체계의 수는 적어도 하나이고;
    상기 샘플 의미 카테고리 필링 필드를 포함하는 샘플 카테고리 필링 문구를 구축하는 방식은,
    각 체계에 대해, 해당 체계에서의 샘플 의미 카테고리 필링 필드를 포함하는 샘플 체계 필링 서브 문구를 구축하는 것-여기서, 상기 해당 체계에서의 샘플 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일함-; 및
    모든 체계에서의 샘플 체계 필링 서브 문구에 따라, 상기 샘플 카테고리 필링 문구를 결정하는 것; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  4. 제 3 항에 있어서,
    상기 샘플 카테고리 필링 문구에 대해, 상이한 체계의 샘플 체계 필링 서브 문구 사이에는 서브 문구 구분자가 설정되어 있고; 및/또는, 각 체계에 대해, 상기 샘플 체계 필링 서브 문구 중 적어도 하나의 샘플 의미 카테고리 필링 필드 사이에는 필드 구분자가 설정되어 있는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  5. 제 4 항에 있어서,
    샘플 체계 필링 서브 문구 중 적어도 하나의 샘플 의미 카테고리 필링 필드 사이에 필드 구분자가 설정되어 있으면, 동일한 체계에서의 필드 구분자는 동일하고, 상이한 체계에서의 필드 구분자는 상이한 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 샘플 의미 카테고리 및 상기 예측할 카테고리의 태그 카테고리에 따라, 상기 의미 분류 모델을 트레이닝하는 단계는,
    상기 샘플 의미 카테고리 및 상기 태그 카테고리에 따라, 태그 이상 유형을 결정하는 단계;
    상기 태그 이상 유형에 대응되는 태그 보정 방식에 따라, 상기 태그 카테고리를 조정하는 단계; 및
    상기 샘플 의미 카테고리 및 조정된 태그 카테고리에 따라, 상기 의미 분류 모델을 트레이닝하는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  7. 제 6 항에 있어서,
    상기 샘플 의미 카테고리 및 상기 태그 카테고리에 따라, 태그 이상 유형을 결정하는 단계는,
    상기 샘플 의미 카테고리가 상기 태그 카테고리의 하위 카테고리이면, 상기 태그 이상 유형을 상위 예측 하위 유형으로 결정하는 단계;
    상기 샘플 의미 카테고리가 상기 태그 카테고리의 상동 변형 카테고리이면, 상기 태그 이상 유형을 소음 유형으로 결정하는 단계; 및
    상기 샘플 의미 카테고리가 상기 태그 카테고리의 분리 가능한 카테고리의 조합 카테고리이면, 상기 태그 이상 유형을 혼동 유형으로 결정하는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  8. 제 7 항에 있어서,
    상기 태그 이상 유형에 대응되는 태그 보정 방식에 따라, 상기 태그 카테고리를 조정하는 단계는,
    상기 태그 이상 유형이 상위 예측 하위 유형이면, 상기 태그 카테고리를 상기 샘플 의미 카테고리로 대체하는 단계;
    상기 태그 이상 유형이 소음 유형이면, 상기 태그 카테고리의 상동 변형 카테고리의 대체 가능한 태그에 따라, 상기 태그 카테고리를 조정하는 단계; 및
    상기 태그 이상 유형이 혼동 유형이면, 상기 태그 카테고리를 상기 샘플 의미 카테고리 또는 상기 태그 카테고리의 분리 가능한 카테고리로 대체하는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 예측할 카테고리의 샘플 의미 카테고리를 얻는 단계는,
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는 단계; 및
    각 상기 샘플 의미 문자를 예측 순서에 따라 조합하여, 상기 예측할 카테고리의 샘플 의미 카테고리를 얻는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  10. 제 9 항에 있어서,
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는 단계는,
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 샘플 질의 템플릿 중의 샘플 의미 특징을 추출하고, 상기 샘플 의미 특징에 대해 특징 변환을 수행하여, 상기 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는 단계를 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 방법.
  11. 예측 질의 템플릿을 획득하는 단계-여기서, 상기 예측 질의 템플릿은 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축됨-; 및
    상기 예측 질의 템플릿에 따라, 상기 예측할 카테고리의 예측 의미 카테고리를 얻는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 방법.
  12. 제 11 항에 있어서,
    상기 예측 질의 템플릿은,
    예측 의미 카테고리 필링 필드를 포함하는 예측 카테고리 필링 문구를 구축하는 방식-여기서, 상기 예측 의미 카테고리 필링 필드의 수는 상기 예측할 카테고리의 수와 동일하고; 상기 예측 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 예측 의미 카테고리를 필링함-; 및
    상기 예측 질의 문구 및 상기 예측 카테고리 필링 문구에 따라, 상기 예측 질의 템플릿을 구축하는 방식에 의해 구축되어 얻어지는 것을 특징으로 하는 의미 분류 방법.
  13. 제 12 항에 있어서,
    상기 예측할 카테고리가 속하는 체계의 수는 적어도 하나이고;
    상기 예측 의미 카테고리 필링 필드를 포함하는 예측 카테고리 필링 문구를 구축하는 방식은,
    각 체계에 대해, 해당 체계에서의 예측 의미 카테고리 필링 필드를 포함하는 예측 체계 필링 서브 문구를 구축하는 것-여기서, 상기 해당 체계에서의 예측 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일함-; 및
    모든 체계에서의 예측 체계 필링 서브 문구에 따라, 상기 예측 카테고리 필링 문구를 결정하는 것; 을 포함하는 것을 특징으로 하는 의미 분류 방법.
  14. 제 13 항에 있어서,
    예측 카테고리 필링 문구에 대해, 상이한 체계에서의 예측 체계 필링 서브 문구 사이에는 서브 문구 구분자가 설정되어 있고; 및/또는, 각 체계에 대해, 상기 예측 체계 필링 서브 문구 중 적어도 하나의 예측 의미 카테고리 필링 필드 사이에는 필드 구분자가 설정되어 있는 것을 특징으로 하는 의미 분류 방법.
  15. 제 14 항에 있어서,
    상기 예측 체계 필링 서브 문구 중 적어도 하나의 예측 의미 카테고리 필링 필드 사이에 필드 구분자가 설정되어 있으면, 동일한 체계에서의 필드 구분자는 동일하고, 상이한 체계에서의 필드 구분자는 상이한 것을 특징으로 하는 의미 분류 방법.
  16. 제 11 항 내지 제 15 항 중 어느 한 항에 있어서,
    상기 예측 질의 템플릿에 따라, 상기 예측할 카테고리의 예측 의미 카테고리를 얻는 단계는,
    상기 예측 질의 템플릿에 따라, 상기 예측할 카테고리의 적어도 하나의 예측 의미 문자를 결정하는 단계; 및
    각 상기 예측 의미 문자를 예측 순서에 따라 조합하여, 상기 예측할 카테고리의 예측 의미 카테고리를 얻는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 방법.
  17. 제 16 항에 있어서,
    상기 적어도 하나의 예측 의미 문자 중 동일한 예측 순서의 예측 의미 문자는 적어도 2개이고;
    각 상기 예측 의미 문자를 예측 순서에 따라 조합하여, 상기 예측할 카테고리의 예측 의미 카테고리를 얻는 단계는,
    상이한 예측 순서의 각 상기 예측 의미 문자를 예측 순서에 따라 조합하여, 적어도 하나의 후보 의미 카테고리를 얻는 단계;
    상기 후보 의미 카테고리 중 상이한 예측 의미 문자의 문자 예측 확률에 따라, 상기 후보 의미 카테고리의 카테고리 예측 확률을 결정하는 단계; 및
    상기 카테고리 예측 확률 및 상기 후보 의미 카테고리와 표준 의미 카테고리 라이브러리 중 각 표준 의미 카테고리의 매칭 결과에 따라, 각 후보 의미 카테고리에서 상기 예측 의미 카테고리를 선택하는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 방법.
  18. 제 16 항에 있어서,
    상기 예측 질의 템플릿에 따라, 상기 예측할 카테고리의 적어도 하나의 예측 의미 문자를 결정하는 단계는,
    상기 예측 질의 템플릿 중의 예측 의미 특징을 추출하는 단계; 및
    상기 예측 의미 특징에 대해 특징 변환을 수행하여, 상기 예측할 카테고리의 적어도 하나의 예측 의미 문자를 얻는 단계; 를 포함하는 것을 특징으로 하는 의미 분류 방법.
  19. 샘플 질의 템플릿 및 상기 샘플 질의 템플릿 중 예측할 카테고리의 태그 카테고리를 획득하는 샘플 질의 템플릿 획득 모듈-여기서, 상기 샘플 질의 템플릿은 샘플 질의 문구 및 상기 예측할 카테고리의 수에 기반하여 구축됨-;
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 예측할 카테고리의 샘플 의미 카테고리를 얻는 샘플 의미 카테고리 결정 모듈; 및
    상기 샘플 의미 카테고리 및 상기 예측할 카테고리의 태그 카테고리에 따라, 상기 의미 분류 모델을 트레이닝하는 의미 분류 모델 트레이닝 모듈; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  20. 제 19 항에 있어서,
    상기 장치는 샘플 질의 템플릿 구축 모듈을 더 포함하고, 구체적으로,
    샘플 의미 카테고리 필링 필드를 포함하는 샘플 카테고리 필링 문구를 구축하는 샘플 카테고리 필링 문구 구축 유닛-여기서, 상기 샘플 의미 카테고리 필링 필드의 수는 상기 예측할 카테고리의 수와 동일하고; 상기 샘플 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 샘플 의미 카테고리를 필링함-; 및
    상기 샘플 질의 문구 및 상기 샘플 카테고리 필링 문구에 따라, 상기 샘플 질의 템플릿을 구축하는 샘플 질의 템플릿 구축 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  21. 제 20 항에 있어서,
    상기 예측할 카테고리가 속하는 체계의 수는 적어도 하나이고;
    상기 샘플 카테고리 필링 문구 구축 유닛은,
    각 체계에 대해, 해당 체계에서의 샘플 의미 카테고리 필링 필드를 포함하는 샘플 체계 필링 서브 문구를 구축하는 샘플 체계 필링 서브 문구 구축 서브 유닛-여기서, 상기 해당 체계에서의 샘플 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일함-; 및
    모든 체계에서의 샘플 체계 필링 서브 문구에 따라, 상기 샘플 카테고리 필링 문구를 결정하는 샘플 카테고리 필링 문구 결정 서브 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  22. 제 21 항에 있어서,
    상기 샘플 카테고리 필링 문구에 대해, 상이한 체계의 샘플 체계 필링 서브 문구 사이에는 서브 문구 구분자가 설정되어 있고; 및/또는, 각 체계에 대해, 상기 샘플 체계 필링 서브 문구 중 적어도 하나의 샘플 의미 카테고리 필링 필드 사이에는 필드 구분자가 설정되어 있는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  23. 제 22 항에 있어서,
    샘플 체계 필링 서브 문구 중 적어도 하나의 샘플 의미 카테고리 필링 필드 사이에 필드 구분자가 설정되어 있으면, 동일한 체계에서의 필드 구분자는 동일하고, 상이한 체계에서의 필드 구분자는 상이한 것을 특징으로 하는 분류 모델 트레이닝 장치.
  24. 제 19 항 내지 제 23 항 중 어느 한 항에 있어서,
    상기 의미 분류 모델 트레이닝 모듈은,
    상기 샘플 의미 카테고리 및 상기 태그 카테고리에 따라, 태그 이상 유형을 결정하는 태그 이상 유형 결정 유닛;
    상기 태그 이상 유형에 대응되는 태그 보정 방식에 따라, 상기 태그 카테고리를 조정하는 태그 카테고리 조정 유닛; 및
    상기 샘플 의미 카테고리 및 조정된 태그 카테고리에 따라, 상기 의미 분류 모델을 트레이닝하는 의미 분류 모델 트레이닝 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  25. 제 24 항에 있어서,
    상기 태그 이상 유형 결정 유닛은,
    상기 샘플 의미 카테고리가 상기 태그 카테고리의 하위 카테고리이면, 상기 태그 이상 유형을 상위 예측 하위 유형으로 결정하는 상하위 유형 결정 서브 유닛;
    상기 샘플 의미 카테고리가 상기 태그 카테고리의 상동 변형 카테고리이면, 상기 태그 이상 유형을 소음 유형으로 결정하는 소음 유형 결정 서브 유닛; 및
    상기 샘플 의미 카테고리가 상기 태그 카테고리의 분리 가능한 카테고리의 조합 카테고리이면, 상기 태그 이상 유형을 혼동 유형으로 결정하는 혼동 유형 결정 서브 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  26. 제 25 항에 있어서,
    상기 태그 카테고리 조정 유닛은,
    상기 태그 이상 유형이 상위 예측 하위 유형이면, 상기 태그 카테고리를 상기 샘플 의미 카테고리로 대체하는 상하위 유형 조정 서브 유닛;
    상기 태그 이상 유형이 소음 유형이면, 상기 태그 카테고리의 상동 변형 카테고리의 대체 가능한 태그에 따라, 상기 태그 카테고리를 조정하는 소음 유형 조정 서브 유닛; 및
    상기 태그 이상 유형이 혼동 유형이면, 상기 태그 카테고리를 상기 샘플 의미 카테고리 또는 상기 태그 카테고리의 분리 가능한 카테고리로 대체하는 혼동 유형 조정 서브 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  27. 제 19 항 내지 제 26 항 중 어느 한 항에 있어서,
    상기 샘플 의미 카테고리 결정 모듈은,
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는 샘플 의미 문자 결정 유닛; 및
    각 상기 샘플 의미 문자를 예측 순서에 따라 조합하여, 상기 예측할 카테고리의 샘플 의미 카테고리를 얻는 샘플 의미 카테고리 결정 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  28. 제 27 항에 있어서,
    상기 샘플 의미 문자 결정 유닛은 구체적으로,
    상기 샘플 질의 템플릿을 미리 구축된 의미 분류 모델에 입력하여, 상기 샘플 질의 템플릿 중의 샘플 의미 특징을 추출하고, 상기 샘플 의미 특징에 대해 특징 변환을 수행하여, 상기 예측할 카테고리의 적어도 하나의 샘플 의미 문자를 얻는 것을 특징으로 하는 의미 분류 모델 트레이닝 장치.
  29. 예측 질의 템플릿을 획득하는 예측 질의 템플릿 획득 모듈-여기서, 상기 예측 질의 템플릿은 예측 질의 문구 및 예측할 카테고리의 수에 기반하여 구축됨-; 및
    상기 예측 질의 템플릿에 따라, 상기 예측할 카테고리의 예측 의미 카테고리를 얻는 예측 의미 카테고리 결정 모듈; 을 포함하는 것을 특징으로 하는 의미 분류 장치.
  30. 제 29 항에 있어서,
    상기 장치는 예측 질의 템플릿 구축 모듈을 더 포함하고, 구체적으로,
    예측 의미 카테고리 필링 필드를 포함하는 예측 카테고리 필링 문구를 구축하는 예측 카테고리 필링 문구 구축 유닛-여기서, 상기 예측 의미 카테고리 필링 필드의 수는 상기 예측할 카테고리의 수와 동일하고; 상기 예측 의미 카테고리 필링 필드는 상응하는 예측할 카테고리의 예측 의미 카테고리를 필링함-; 및
    상기 예측 질의 문구 및 상기 예측 카테고리 필링 문구에 따라, 상기 예측 질의 템플릿을 구축하는 예측 질의 템플릿 구축 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 장치.
  31. 제 30 항에 있어서,
    상기 예측할 카테고리가 속하는 체계의 수는 적어도 하나이고;
    상기 예측 카테고리 필링 문구 구축 유닛은,
    각 체계에 대해, 해당 체계에서의 예측 의미 카테고리 필링 필드를 포함하는 예측 체계 필링 서브 문구를 구축하는 예측 체계 필링 서브 문구 구축 서브 유닛-여기서, 상기 해당 체계에서의 예측 의미 카테고리 필링 필드의 수는 해당 체계에서의 예측할 카테고리의 수와 동일함-; 및
    모든 체계에서의 예측 체계 필링 서브 문구에 따라, 상기 예측 카테고리 필링 문구를 결정하는 예측 카테고리 필링 문구 구축 서브 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 장치.
  32. 제 31 항에 있어서,
    예측 카테고리 필링 문구에 대해, 상이한 체계에서의 예측 체계 필링 서브 문구 사이에는 서브 문구 구분자가 설정되어 있고; 및/또는, 각 체계에 대해, 상기 예측 체계 필링 서브 문구 중 적어도 하나의 예측 의미 카테고리 필링 필드 사이에는 필드 구분자가 설정되어 있는 것을 특징으로 하는 의미 분류 장치.
  33. 제 32 항에 있어서,
    상기 예측 체계 필링 서브 문구 중 적어도 하나의 예측 의미 카테고리 필링 필드 사이에 필드 구분자가 설정되어 있으면, 동일한 체계에서의 필드 구분자는 동일하고, 상이한 체계에서의 필드 구분자는 상이한 것을 특징으로 하는 의미 분류 장치.
  34. 제 29 항 내지 제 33 항 중 어느 한 항에 있어서,
    상기 예측 의미 카테고리 결정 모듈은,
    상기 예측 질의 템플릿에 따라, 상기 예측할 카테고리의 적어도 하나의 예측 의미 문자를 결정하는 예측 의미 문자 결정 유닛; 및
    각 상기 예측 의미 문자를 예측 순서에 따라 조합하여, 상기 예측할 카테고리의 예측 의미 카테고리를 얻는 예측 의미 카테고리 결정 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 장치.
  35. 제 34 항에 있어서,
    상기 적어도 하나의 예측 의미 문자 중 동일한 예측 순서의 예측 의미 문자는 적어도 2개이고;
    상기 예측 의미 카테고리 결정 유닛은,
    상이한 예측 순서의 각 상기 예측 의미 문자를 예측 순서에 따라 조합하여, 적어도 하나의 후보 의미 카테고리를 얻는 후보 의미 카테고리 결정 서브 유닛;
    상기 후보 의미 카테고리 중 상이한 예측 의미 문자의 문자 예측 확률에 따라, 상기 후보 의미 카테고리의 카테고리 예측 확률을 결정하는 카테고리 예측 확률 결정 서브 유닛; 및
    상기 카테고리 예측 확률 및 상기 후보 의미 카테고리와 표준 의미 카테고리 라이브러리 중 각 표준 의미 카테고리의 매칭 결과에 따라, 각 후보 의미 카테고리에서 상기 예측 의미 카테고리를 선택하는 예측 의미 카테고리 선택 서브 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 장치.
  36. 제 34 항에 있어서,
    상기 예측 의미 문자 결정 유닛은,
    상기 예측 질의 템플릿 중의 예측 의미 특징을 추출하는 예측 의미 특징 추출 서브 유닛; 및
    상기 예측 의미 특징에 대해 특징 변환을 수행하여, 상기 예측할 카테고리의 적어도 하나의 예측 의미 문자를 얻는 예측 의미 문자 결정 서브 유닛; 을 포함하는 것을 특징으로 하는 의미 분류 장치.
  37. 적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서와 통신적으로 연결되는 메모리; 를 포함하고, 여기서,
    상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되고, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제 1 항 내지 제 5 항 중 어느 한 항에 따른 의미 분류 모델 트레이닝 방법, 및/또는, 제 11 항 내지 제 15 항 중 어느 한 항에 따른 의미 분류 방법을 수행하도록 하는 것을 특징으로 하는 전자 설비.
  38. 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 컴퓨터 명령은 컴퓨터가 제 1 항 내지 제 5 항 중 어느 한 항에 따른 의미 분류 모델 트레이닝 방법, 및/또는, 제 11 항 내지 제 15 항 중 어느 한 항에 따른 의미 분류 방법을 수행하도록 하는 것을 특징으로 하는 컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체.
  39. 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램 중의 컴퓨터 명령이 프로세서에 의해 실행될 때, 제 1 항 내지 제 5 항 중 어느 한 항에 따른 의미 분류 모델 트레이닝 방법의 단계, 및/또는, 제 11 항 내지 제 15 항 중 어느 한 항에 따른 의미 분류 방법의 단계를 구현하는 것을 특징으로 하는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020230039739A 2022-04-22 2023-03-27 분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체 KR20230150723A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202210439044.9 2022-04-22
CN202210439044.9A CN114969326A (zh) 2022-04-22 2022-04-22 分类模型训练、语义分类方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
KR20230150723A true KR20230150723A (ko) 2023-10-31

Family

ID=82979675

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230039739A KR20230150723A (ko) 2022-04-22 2023-03-27 분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체

Country Status (4)

Country Link
US (1) US20230342667A1 (ko)
JP (1) JP2023160746A (ko)
KR (1) KR20230150723A (ko)
CN (1) CN114969326A (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115599891B (zh) * 2022-11-29 2023-03-21 支付宝(杭州)信息技术有限公司 一种确定异常对话数据方法、装置、设备及可读存储介质
CN116051558B (zh) * 2023-03-31 2023-06-16 菲特(天津)检测技术有限公司 一种缺陷图像标注方法、装置、设备及介质
CN116821307B (zh) * 2023-08-21 2023-11-28 腾讯科技(深圳)有限公司 内容交互方法、装置、电子设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10133735B2 (en) * 2016-02-29 2018-11-20 Rovi Guides, Inc. Systems and methods for training a model to determine whether a query with multiple segments comprises multiple distinct commands or a combined command
US10970493B1 (en) * 2019-10-18 2021-04-06 Clinc, Inc. Systems and methods for slot relation extraction for machine learning task-oriented dialogue systems
US11710070B2 (en) * 2020-04-20 2023-07-25 Microsoft Technology Licensing, Llc Machine learned model framework for screening question generation
CN112966076A (zh) * 2021-02-25 2021-06-15 中国平安人寿保险股份有限公司 智能问答问题的生成方法、装置、计算机设备及存储介质
CN113010678A (zh) * 2021-03-17 2021-06-22 北京百度网讯科技有限公司 分类模型的训练方法、文本分类方法及装置
CN113239705B (zh) * 2021-07-12 2021-10-29 北京百度网讯科技有限公司 语义表示模型的预训练方法、装置、电子设备和存储介质
CN113688245B (zh) * 2021-08-31 2023-09-26 中国平安人寿保险股份有限公司 基于人工智能的预训练语言模型的处理方法、装置及设备

Also Published As

Publication number Publication date
CN114969326A (zh) 2022-08-30
US20230342667A1 (en) 2023-10-26
JP2023160746A (ja) 2023-11-02

Similar Documents

Publication Publication Date Title
US20220350965A1 (en) Method for generating pre-trained language model, electronic device and storage medium
EP4060565A1 (en) Method and apparatus for acquiring pre-trained model
US20220004892A1 (en) Method for training multivariate relationship generation model, electronic device and medium
US20220004714A1 (en) Event extraction method and apparatus, and storage medium
US20210312139A1 (en) Method and apparatus of generating semantic feature, method and apparatus of training model, electronic device, and storage medium
KR20230150723A (ko) 분류 모델 트레이닝, 의미 분류 방법, 장치, 설비 및 매체
US20220004811A1 (en) Method and apparatus of training model, device, medium, and program product
US20230004721A1 (en) Method for training semantic representation model, device and storage medium
US20220293092A1 (en) Method and apparatus of training natural language processing model, and method and apparatus of processing natural language
US20230386168A1 (en) Pre-training method, image and text retrieval method for a vision and scene text aggregation model, electronic device, and storage medium
EP4113357A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
EP4155973A1 (en) Sorting model training method and apparatus, and electronic device
US11977567B2 (en) Method of retrieving query, electronic device and medium
JP2022006173A (ja) 知識事前訓練モデルの訓練方法、装置及び電子機器
US20220129768A1 (en) Method and apparatus for training model, and method and apparatus for predicting text
EP4141697A1 (en) Method and apparatus of processing triple data, method and apparatus of training triple data processing model, device, and medium
JP2023002690A (ja) セマンティックス認識方法、装置、電子機器及び記憶媒体
US20220027766A1 (en) Method for industry text increment and electronic device
CN113553411B (zh) 查询语句的生成方法、装置、电子设备和存储介质
US20230342561A1 (en) Machine translation method and apparatus, device and storage medium
CN114328956B (zh) 文本信息的确定方法、装置、电子设备及存储介质
US20230075339A1 (en) Method of training information generation model, method of generating information, and device
CN115577106A (zh) 基于人工智能的文本分类方法、装置、设备和介质
JP2021512384A (ja) 社会的感情および自然言語生成の量子重ね合せおよび量子もつれ
US20210342379A1 (en) Method and device for processing sentence, and storage medium