KR102363369B1 - 문서들의 벡터 표현들 생성하기 - Google Patents
문서들의 벡터 표현들 생성하기 Download PDFInfo
- Publication number
- KR102363369B1 KR102363369B1 KR1020167023661A KR20167023661A KR102363369B1 KR 102363369 B1 KR102363369 B1 KR 102363369B1 KR 1020167023661 A KR1020167023661 A KR 1020167023661A KR 20167023661 A KR20167023661 A KR 20167023661A KR 102363369 B1 KR102363369 B1 KR 102363369B1
- Authority
- KR
- South Korea
- Prior art keywords
- words
- document
- word
- sequence
- vector representation
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 158
- 238000013528 artificial neural network Methods 0.000 claims abstract description 58
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000012549 training Methods 0.000 claims description 56
- 230000008569 process Effects 0.000 claims description 27
- 230000014509 gene expression Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 abstract description 15
- 230000026676 system process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 2는 새로운 문서에 대한 문서 벡터 표현을 결정하기 위한 예시적 프로세스의 흐름도이다.
도 3은 트레이닝 문서로부터의 단어들의 시퀀스에서 신경 네트워크 시스템을 트레이닝하기 위한 예시적 프로세스의 흐름도이다.
도 4는 새로운 문서에 대한 문서 벡터 표현을 조절하기 위한 예시적 프로세스의 흐름도이다.
다양한 도면들에서 동일한 참조 번호들은 및 기호들은 동일한 엘리먼트들을 표시한다.
Claims (20)
- 방법으로서,
새로운 문서를 획득하는 단계;
상기 새로운 문서로부터, (i) 각각 미리 결정된 고정된 길이인 단어들의 복수의 시퀀스들 및 (ii) 단어들의 각 시퀀스에 대해, 상기 새로운 문서의 단어들의 상기 시퀀스에서 마지막 단어를 뒤따르는(follow) 단어를 추출하는 단계; 및
트레이닝(training)된 신경 네트워크 시스템을 사용하여 상기 새로운 문서에 대한 벡터 표현을 결정하는 단계를 포함하며,
상기 트레이닝된 신경 네트워크 시스템은 복수의 라벨링되지 않은 문서들에 대해 트레이닝되었으며 그리고,
입력 문서 및 상기 입력 문서로부터 단어들의 시퀀스를 식별하는 데이터를 수신하고,
상기 입력 문서를 식별하는 데이터로부터, 상기 입력 문서의 벡터 표현을 생성하고, 그리고
단어들의 미리 결정된 세트에서 각 단어에 대한 각각의 단어 점수를 생성하기 위해 파라미터들의 제3 세트의 트레이닝된 값들에 따라 상기 입력 문서로부터 단어들의 시퀀스 및 상기 입력 문서의 벡터 표현을 프로세싱하도록 트레이닝되었으며,
상기 각각의 단어 점수들 각각은 대응하는 단어가 상기 입력 문서의 상기 시퀀스에서 마지막 단어를 뒤따를 것이라는 예측된 가능성을 표현하며, 그리고
상기 트레이닝된 신경 네트워크 시스템을 사용하여 상기 새로운 문서에 대한 상기 벡터 표현을 결정하는 단계는 기울기 하강(gradient descent)을 사용하여 상기 새로운 문서에 대한 상기 벡터 표현을 결정하기 위해 상기 단어들의 복수의 시퀀스들 각각을 상기 트레이닝된 신경 네트워크 시스템에 반복적으로 제공하는 것을 포함하며, 상기 단어들의 각 시퀀스에 대해:
상기 파라미터들의 제3 세트의 트레이닝된 값들에 따라 그리고 상기 새로운 문서의 벡터 표현을 사용하여 생성된 상기 단어들의 미리 결정된 세트에서 각 단어에 대해 각각의 단어 점수를 획득하기 위해 상기 단어들의 시퀀스를 상기 트레이닝된 신경 네트워크 시스템에 제공하는 것,
상기 각각의 단어 점수들과 상기 새로운 문서의 단어들의 시퀀스에서 마지막 단어를 뒤따르는 상기 단어들을 식별하는 단어 점수들의 타겟 세트 사이의 에러를 측정하는 에러 함수의 벡터 표현과 관련한 기울기를 계산하는 것, 및
상기 파라미터들의 제3 세트의 트레이닝된 값들을 고정되게 보유하면서 기울기 하강을 사용하여 상기 기울기에 기초하여 상기 새로운 문서에 대한 벡터 표현을 조절하는 것을 포함하는 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 트레이닝된 신경 네트워크 시스템은 상기 입력 문서 및 상기 입력 문서로부터의 상기 단어들의 시퀀스에서 각 단어를 각각의 벡터 표현들에 맵핑하도록 구성된 내장 레이어(embedding layer), 상기 벡터 표현들을 조합된 표현으로 조합하도록 구성된 조합 레이어(combining layer) 및 상기 조합된 표현을 사용하여 상기 단어 점수들을 생성하도록 구성된 분류자 레이어(classifier layer)를 포함하는 것을 특징으로 하는 방법. - 청구항 2에 있어서,
상기 파라미터들의 제3 세트는 파라미터들의 제1 세트 및 파라미터들의 제2 세트를 포함하며,
상기 내장 레이어는 상기 단어들의 시퀀스에서 상기 단어들을 상기 파라미터들의 제1 세트에 따라 벡터 표현들에 맵핑하며, 그리고
상기 분류자 레이어는 상기 파라미터들의 제2 세트에 따라 상기 조합된 표현으로부터 상기 단어 점수들을 생성하는 것을 특징으로 하는 방법. - 청구항 2에 있어서,
상기 단어들의 복수의 시퀀스들 각각에 대해, 상기 트레이닝된 신경 네트워크 시스템은:
상기 내장 레이어를 사용하여 상기 시퀀스에서 상기 단어들의 각각을 벡터 표현에 맵핑하고;
조합된 표현을 생성하기 위해 상기 시퀀스에서 상기 단어들에 대한 상기 벡터 표현을 상기 단어들의 이전 시퀀스로부터 상기 새로운 문서에 대한 상기 벡터 표현을 조합하고;
상기 조합된 표현으로부터 단어 점수들을 생성하도록 구성되는 것을 포함하는 것을 특징으로 하는 방법. - 청구항 2에 있어서,
상기 조합 레이어는 상기 시퀀스에서 상기 단어들의 상기 벡터 표현들을 상기 입력 문서의 상기 벡터 표현과 연관시키도록 구성되는 것을 특징으로 하는 방법. - 청구항 2에 있어서,
상기 조합 레이어는 상기 시퀀스에서 상기 단어들의 상기 벡터 표현들과 상기 입력 문서의 상기 벡터 표현을 평균(average)하도록 구성되는 것을 특징으로 하는 방법. - 방법으로서,
복수의 트레이닝 문서들을 획득하는 단계, 상기 복수의 트레이닝 문서들에서 각 문서는 라벨링되지 않았으며, 단어들의 복수의 시퀀스들, 그리고 단어들의 각 시퀀스에 대해, 상기 트레이닝 문서의 상기 단어들의 시퀀스에서 마지막 단어를 뒤따르는(follow) 단어를 포함하며; 및
기울기 하강(gradient descent) 및 역전파(backpropagation)를 사용하여 상기 트레이닝 문서들 각각에서 신경 네트워크 시스템을 트레이닝(training)하는 단계를 포함하며,
상기 신경 네트워크 시스템은:
입력 문서 및 상기 입력 문서로부터 단어들의 시퀀스를 식별하는 데이터를 수신하고,
상기 입력 문서를 식별하는 데이터로부터 상기 입력 문서의 벡터 표현을 생성하고, 그리고
단어들의 미리 결정된 세트에서 각 단어에 대한 각각의 단어 점수를 생성하기 위해 파라미터들의 세트에 따라 상기 입력 문서로부터 단어들의 시퀀스 및 상기 입력 문서의 벡터 표현을 프로세싱하도록 구성되며,
상기 각각의 단어 점수들 각각은 대응하는 단어가 상기 입력 문서의 상기 단어들의 시퀀스에서 마지막 단어를 뒤따를 것이라는 예측된 가능성을 표현하며,
상기 트레이닝 문서들 각각에서 상기 신경 네트워크 시스템을 트레이닝하는 단계는, 각 트레이닝 문서에 대해, 반복으로 상기 파라미터들의 세트의 값들을 업데이트하기 위해 상기 트레이닝 문서에서 단어들의 각 시퀀스에 대해 기울기 하강의 각각의 반복을 수행하는 것을 포함하는 것을 특징으로 하는 방법. - 청구항 7에 있어서,
상기 신경 네트워크 시스템은 상기 입력 문서 및 상기 입력 문서로부터의 상기 단어들의 시퀀스에서 각 단어를 각각의 벡터 표현들에 맵핑하도록 구성된 내장 레이어(embedding layer), 상기 벡터 표현들을 조합된 표현으로 조합하도록 구성된 조합 레이어(combining layer) 및 상기 조합된 표현을 사용하여 상기 단어 점수들을 생성하도록 구성된 분류자 레이어(classifier layer)를 포함하는 것을 특징으로 하는 방법. - 청구항 8에 있어서,
상기 내장 레이어는 상기 단어들의 시퀀스에서 상기 단어들을 파라미터들의 제1 세트에 따라 벡터 표현들에 맵핑하며, 그리고
상기 분류자 레이어는 파라미터들의 제2 세트에 따라 상기 조합된 표현으로부터 상기 단어 점수들을 생성하는 것을 특징으로 하는 방법. - 청구항 9에 있어서,
상기 트레이닝 문서에서 상기 복수의 시퀀스들 각각에 대해 기울기 하강의 각각의 반복을 수행하는 것은:
상기 내장 레이어를 사용하여 상기 시퀀스에서 상기 단어들의 각각을 벡터 표현에 맵핑하는 것;
상기 내장 레이어를 사용하여 상기 트레이닝 문서를 식별하는 상기 데이터를 벡터 표현에 맵핑하는 것;
조합된 표현을 생성하기 위해 상기 시퀀스에서 상기 단어들에 대한 상기 벡터 표현을 이전 반복으로부터 상기 트레이닝 문서에 대한 상기 벡터 표현을 조합하는 것;
상기 조합된 표현으로부터 단어 점수들을 생성하는 것;
상기 단어 점수들 및 상기 트레이닝 문서에서 상기 시퀀스를 뒤따르는 상기 단어를 사용하여 기울기를 계산하는 것; 및
상기 기울기를 사용하여 상기 파라미터들의 제2 세트의 값을 조절하는 것을 포함하는 것을 특징으로 하는 방법. - 청구항 10에 있어서,
상기 기울기 하강의 각각의 반복을 수행하는 것은 역전파를 사용하여 상기 파라미터들의 제1 세트의 값을 조절하는 것을 더 포함하는 것을 특징으로 하는 방법. - 청구항 8에 있어서,
상기 조합 레이어는 상기 시퀀스에서 상기 단어들의 상기 벡터 표현들을 상기 입력 문서의 상기 벡터 표현과 연관시키도록 구성되는 것을 특징으로 하는 방법. - 청구항 8에 있어서,
상기 조합 레이어는 상기 시퀀스에서 상기 단어들의 상기 벡터 표현들과 상기 입력 문서의 상기 벡터 표현을 평균(average)하도록 구성되는 것을 특징으로 하는 방법. - 청구항 10에 있어서,
상기 단어들의 복수의 시퀀스들의 각각은 고정된 수의 단어들을 포함하는 것을 특징으로 하는 방법. - 시스템으로서,
하나 이상의 컴퓨터들 및 명령어들을 저장하는 하나 이상의 저장 장치들을 포함하며, 상기 명령어들은 상기 하나 이상의 컴퓨터들에 의해 실행될 때, 상기 하나 이상의 컴퓨터들로 하여금 동작들을 수행하게 하며, 상기 동작들은:
새로운 문서를 획득하는 동작;
상기 새로운 문서로부터, (i) 각각 미리 결정된 고정된 길이인 단어들의 복수의 시퀀스들 및 (ii) 단어들의 각 시퀀스에 대해, 상기 새로운 문서의 단어들의 상기 시퀀스에서 마지막 단어를 뒤따르는(follow) 단어를 추출하는 동작; 및
트레이닝(training)된 신경 네트워크 시스템을 사용하여 상기 새로운 문서에 대한 벡터 표현을 결정하는 동작을 포함하며,
상기 트레이닝된 신경 네트워크 시스템은 복수의 라벨링되지 않은 문서들에 대해 트레이닝되었으며 그리고,
입력 문서 및 상기 입력 문서로부터 단어들의 시퀀스를 식별하는 데이터를 수신하고,
상기 입력 문서를 식별하는 데이터로부터, 상기 입력 문서의 벡터 표현을 생성하고, 그리고
단어들의 미리 결정된 세트에서 각 단어에 대한 각각의 단어 점수를 생성하기 위해 파라미터들의 제3 세트의 트레이닝된 값들에 따라 상기 입력 문서로부터 단어들의 시퀀스 및 상기 입력 문서의 벡터 표현을 프로세싱하도록 트레이닝되었으며,
상기 각각의 단어 점수들 각각은 대응하는 단어가 상기 입력 문서의 상기 시퀀스에서 마지막 단어를 뒤따를 것이라는 예측된 가능성을 표현하며, 그리고
상기 트레이닝된 신경 네트워크 시스템을 사용하여 상기 새로운 문서에 대한 상기 벡터 표현을 결정하는 동작은 기울기 하강(gradient descent)을 사용하여 상기 새로운 문서에 대한 상기 벡터 표현을 결정하기 위해 상기 단어들의 복수의 시퀀스들 각각을 상기 트레이닝된 신경 네트워크 시스템에 반복적으로 제공하는 것을 포함하며, 상기 단어들의 각 시퀀스에 대해:
상기 파라미터들의 제3 세트의 트레이닝된 값들에 따라 그리고 상기 새로운 문서의 벡터 표현을 사용하여 생성된 상기 단어들의 미리 결정된 세트에서 각 단어에 대해 각각의 단어 점수를 획득하기 위해 상기 단어들의 시퀀스를 상기 트레이닝된 신경 네트워크 시스템에 제공하는 것,
상기 각각의 단어 점수들과 상기 새로운 문서의 단어들의 시퀀스에서 마지막 단어를 뒤따르는 상기 단어들을 식별하는 단어 점수들의 타겟 세트 사이의 에러를 측정하는 에러 함수의 벡터 표현과 관련한 기울기를 계산하는 것, 및
상기 파라미터들의 제3 세트의 트레이닝된 값들을 고정되게 보유하면서 기울기 하강을 사용하여 상기 기울기에 기초하여 상기 새로운 문서에 대한 벡터 표현을 조절하는 것을 포함하는 것을 특징으로 하는 시스템. - 청구항 15에 있어서,
상기 신경 네트워크 시스템은 상기 입력 문서 및 상기 입력 문서로부터의 상기 단어들의 시퀀스에서 각 단어를 각각의 벡터 표현들에 맵핑하도록 구성된 내장 레이어(embedding layer), 상기 벡터 표현들을 조합된 표현으로 조합하도록 구성된 조합 레이어(combining layer) 및 상기 조합된 표현을 사용하여 상기 단어 점수들을 생성하도록 구성된 분류자 레이어(classifier layer)를 포함하는 것을 특징으로 하는 시스템. - 청구항 1에 있어서,
상기 새로운 문서에 대한 벡터 표현을 상기 새로운 문서를 분류하는데 사용하기 위한 기계 학습 시스템에 입력으로서 제공하는 방법을 더 포함하는 것을 특징으로 하는 방법. - 청구항 1에 있어서,
상기 새로운 문서의 분류를 생성하기 위해 기계 학습 시스템을 사용하여 상기 새로운 문서에 대한 벡터 표현을 포함하는 구성(feature) 입력을 프로세싱하는 단계를 더 포함하는 것을 특징으로 하는 방법. - 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461934674P | 2014-01-31 | 2014-01-31 | |
US61/934,674 | 2014-01-31 | ||
PCT/US2015/013717 WO2015116909A1 (en) | 2014-01-31 | 2015-01-30 | Generating vector representations of documents |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160117516A KR20160117516A (ko) | 2016-10-10 |
KR102363369B1 true KR102363369B1 (ko) | 2022-02-15 |
Family
ID=52478097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167023661A KR102363369B1 (ko) | 2014-01-31 | 2015-01-30 | 문서들의 벡터 표현들 생성하기 |
Country Status (6)
Country | Link |
---|---|
US (3) | US10366327B2 (ko) |
EP (1) | EP3100212A1 (ko) |
JP (1) | JP6588449B2 (ko) |
KR (1) | KR102363369B1 (ko) |
CN (1) | CN105940395B (ko) |
WO (1) | WO2015116909A1 (ko) |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10614100B2 (en) * | 2014-06-19 | 2020-04-07 | International Business Machines Corporation | Semantic merge of arguments |
US10366324B2 (en) | 2015-09-01 | 2019-07-30 | Google Llc | Neural network for processing graph data |
US10803380B2 (en) | 2015-09-11 | 2020-10-13 | Google Llc | Generating vector representations of documents |
KR101778679B1 (ko) | 2015-10-02 | 2017-09-14 | 네이버 주식회사 | 딥러닝을 이용하여 텍스트 단어 및 기호 시퀀스를 값으로 하는 복수 개의 인자들로 표현된 데이터를 자동으로 분류하는 방법 및 시스템 |
US10354182B2 (en) | 2015-10-29 | 2019-07-16 | Microsoft Technology Licensing, Llc | Identifying relevant content items using a deep-structured neural network |
CN108431832B (zh) * | 2015-12-10 | 2022-09-13 | 渊慧科技有限公司 | 利用外部存储器扩增神经网络 |
US10055489B2 (en) * | 2016-02-08 | 2018-08-21 | Ebay Inc. | System and method for content-based media analysis |
CN105760932B (zh) * | 2016-02-17 | 2018-04-06 | 第四范式(北京)技术有限公司 | 数据交换方法、数据交换装置及计算装置 |
JP6605997B2 (ja) * | 2016-03-17 | 2019-11-13 | 株式会社東芝 | 学習装置、学習方法及びプログラム |
JP6789303B2 (ja) * | 2016-03-18 | 2020-11-25 | グーグル エルエルシー | ニューラルネットワークを用いたテキストセグメントの係り受け解析の生成 |
US10699183B2 (en) * | 2016-03-31 | 2020-06-30 | ZenDesk, Inc. | Automated system for proposing help center articles to be written to facilitate resolving customer-service requests |
US11436610B2 (en) * | 2016-03-31 | 2022-09-06 | ZenDesk, Inc. | Automatically clustering customer-support requests to form customer-support topics |
CN111651201B (zh) * | 2016-04-26 | 2023-06-13 | 中科寒武纪科技股份有限公司 | 一种用于执行向量合并运算的装置和方法 |
WO2017192183A1 (en) * | 2016-05-04 | 2017-11-09 | Google Llc | Augmenting neural networks with external memory using reinforcement learning |
US10909459B2 (en) * | 2016-06-09 | 2021-02-02 | Cognizant Technology Solutions U.S. Corporation | Content embedding using deep metric learning algorithms |
US10453074B2 (en) | 2016-07-08 | 2019-10-22 | Asapp, Inc. | Automatically suggesting resources for responding to a request |
US10083451B2 (en) | 2016-07-08 | 2018-09-25 | Asapp, Inc. | Using semantic processing for customer support |
KR101886373B1 (ko) * | 2016-07-14 | 2018-08-09 | 주식회사 언더핀 | 딥러닝 인공신경망 기반의 타스크 제공 플랫폼 |
US10762439B2 (en) | 2016-07-26 | 2020-09-01 | International Business Machines Corporation | Event clustering and classification with document embedding |
KR101842362B1 (ko) | 2016-09-01 | 2018-03-26 | 성균관대학교산학협력단 | 인공 신경망 기반의 문단 생성 방법 및 장치 |
WO2018071389A1 (en) * | 2016-10-10 | 2018-04-19 | Google Llc | Very deep convolutional neural networks for end-to-end speech recognition |
WO2018085697A1 (en) * | 2016-11-04 | 2018-05-11 | Google Llc | Training neural networks using a variational information bottleneck |
EP3542319B1 (en) | 2016-11-15 | 2023-07-26 | Google LLC | Training neural networks using a clustering loss |
KR101869438B1 (ko) * | 2016-11-22 | 2018-06-20 | 네이버 주식회사 | 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템 |
GB201620232D0 (en) * | 2016-11-29 | 2017-01-11 | Microsoft Technology Licensing Llc | Data input system with online learning |
GB2571645A (en) * | 2016-12-14 | 2019-09-04 | Landmark Graphics Corp | Automatic classification of drilling reports with deep natural language processing |
US10109275B2 (en) | 2016-12-19 | 2018-10-23 | Asapp, Inc. | Word hash language model |
US10360303B2 (en) * | 2017-01-06 | 2019-07-23 | The Toronto-Dominion Bank | Learning document embeddings with convolutional neural network architectures |
US10817781B2 (en) * | 2017-04-28 | 2020-10-27 | SparkCognition, Inc. | Generation of document classifiers |
CN110663049B (zh) * | 2017-04-28 | 2023-12-26 | 谷歌有限责任公司 | 神经网络优化器搜索 |
CN109214519B (zh) * | 2017-07-07 | 2022-07-01 | 阿里巴巴集团控股有限公司 | 数据处理系统、方法和设备 |
US11823013B2 (en) * | 2017-08-29 | 2023-11-21 | International Business Machines Corporation | Text data representation learning using random document embedding |
US10755144B2 (en) | 2017-09-05 | 2020-08-25 | Cognizant Technology Solutions U.S. Corporation | Automated and unsupervised generation of real-world training data |
US10755142B2 (en) | 2017-09-05 | 2020-08-25 | Cognizant Technology Solutions U.S. Corporation | Automated and unsupervised generation of real-world training data |
CN110019830B (zh) * | 2017-09-20 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 语料处理、词向量获取方法及装置、存储介质及设备 |
CN107957989B9 (zh) * | 2017-10-23 | 2021-01-12 | 创新先进技术有限公司 | 基于集群的词向量处理方法、装置以及设备 |
CN108170663A (zh) | 2017-11-14 | 2018-06-15 | 阿里巴巴集团控股有限公司 | 基于集群的词向量处理方法、装置以及设备 |
US10497004B2 (en) | 2017-12-08 | 2019-12-03 | Asapp, Inc. | Automating communications using an intent classifier |
US10489792B2 (en) | 2018-01-05 | 2019-11-26 | Asapp, Inc. | Maintaining quality of customer support messages |
US10891943B2 (en) * | 2018-01-18 | 2021-01-12 | Citrix Systems, Inc. | Intelligent short text information retrieve based on deep learning |
CN110134780B (zh) * | 2018-02-08 | 2023-11-24 | 株式会社理光 | 文档摘要的生成方法、装置、设备、计算机可读存储介质 |
US10210244B1 (en) | 2018-02-12 | 2019-02-19 | Asapp, Inc. | Updating natural language interfaces by processing usage data |
CN109885842B (zh) * | 2018-02-22 | 2023-06-20 | 谷歌有限责任公司 | 处理文本神经网络 |
CN108509413A (zh) * | 2018-03-08 | 2018-09-07 | 平安科技(深圳)有限公司 | 文摘自动提取方法、装置、计算机设备及存储介质 |
US10606955B2 (en) * | 2018-03-15 | 2020-03-31 | Servicenow, Inc. | Incident matching with vector-based natural language processing |
US10169315B1 (en) | 2018-04-27 | 2019-01-01 | Asapp, Inc. | Removing personal information from text using a neural network |
US11182415B2 (en) * | 2018-07-11 | 2021-11-23 | International Business Machines Corporation | Vectorization of documents |
US11216510B2 (en) | 2018-08-03 | 2022-01-04 | Asapp, Inc. | Processing an incomplete message with a neural network to generate suggested messages |
US11551004B2 (en) | 2018-11-13 | 2023-01-10 | Asapp, Inc. | Intent discovery with a prototype classifier |
US10747957B2 (en) | 2018-11-13 | 2020-08-18 | Asapp, Inc. | Processing communications using a prototype classifier |
KR102216689B1 (ko) * | 2018-11-23 | 2021-02-17 | 네이버 주식회사 | 시계열 의료 데이터를 통한 질병 예후 예측을 위한 딥 뉴럴 네트워크의 분류 결과 시각화 방법 및 시스템 |
US12026462B2 (en) | 2018-11-29 | 2024-07-02 | International Business Machines Corporation | Word embedding model parameter advisor |
US11410031B2 (en) * | 2018-11-29 | 2022-08-09 | International Business Machines Corporation | Dynamic updating of a word embedding model |
RU2744028C2 (ru) * | 2018-12-26 | 2021-03-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для хранения множества документов |
US10789510B2 (en) | 2019-01-11 | 2020-09-29 | Google Llc | Dynamic minibatch sizes |
WO2020154373A1 (en) * | 2019-01-23 | 2020-07-30 | Google Llc | Neural network training using the soft nearest neighbor loss |
AU2019200976A1 (en) * | 2019-02-12 | 2020-08-27 | Canon Kabushiki Kaisha | Method, system and apparatus for generating training samples for matching objects in a sequence of images |
US10922486B2 (en) | 2019-03-13 | 2021-02-16 | International Business Machines Corporation | Parse tree based vectorization for natural language processing |
CN111858841A (zh) * | 2019-04-24 | 2020-10-30 | 京东数字科技控股有限公司 | 一种生成词向量的方法和装置 |
US11107096B1 (en) * | 2019-06-27 | 2021-08-31 | 0965688 Bc Ltd | Survey analysis process for extracting and organizing dynamic textual content to use as input to structural equation modeling (SEM) for survey analysis in order to understand how customer experiences drive customer decisions |
US11354361B2 (en) * | 2019-07-11 | 2022-06-07 | International Business Machines Corporation | Document discrepancy determination and mitigation |
US11163963B2 (en) * | 2019-09-10 | 2021-11-02 | Optum Technology, Inc. | Natural language processing using hybrid document embedding |
KR102280856B1 (ko) | 2019-09-16 | 2021-07-23 | 서울대학교산학협력단 | 문서 임베딩을 생성하는 장치 및 방법 |
US11425064B2 (en) | 2019-10-25 | 2022-08-23 | Asapp, Inc. | Customized message suggestion with user embedding vectors |
US11275934B2 (en) * | 2019-11-20 | 2022-03-15 | Sap Se | Positional embeddings for document processing |
KR102348689B1 (ko) * | 2019-12-31 | 2022-01-07 | 성균관대학교산학협력단 | 감정점수를 활용한 시퀀스-투-시퀀스 기반의 텍스트 요약 |
CN113627135B (zh) | 2020-05-08 | 2023-09-29 | 百度在线网络技术(北京)有限公司 | 一种招聘岗位描述文本的生成方法、装置、设备及介质 |
JP7547077B2 (ja) | 2020-05-13 | 2024-09-09 | 株式会社Nttドコモ | 文章翻訳装置及び翻訳モデル |
CN111931509A (zh) * | 2020-08-28 | 2020-11-13 | 北京百度网讯科技有限公司 | 实体链指方法、装置、电子设备及存储介质 |
CN112104919B (zh) * | 2020-09-11 | 2022-05-06 | 腾讯科技(深圳)有限公司 | 基于神经网络的内容标题生成方法、装置、设备、和计算机可读存储介质 |
KR102666670B1 (ko) * | 2020-11-25 | 2024-05-20 | 한국과학기술원 | 그룹 레이블링 학습에서 뉴럴 네트워크 기반 효과적인 임베딩 벡터 생성 및 이를 이용한 레이블 예측 방법, 장치 및 그 예측 모델에서의 학습 방법 |
KR102501869B1 (ko) * | 2021-04-14 | 2023-02-21 | 건국대학교 산학협력단 | 문장 중요도에 기반한 문서 수준의 감성 분류 방법 및 장치 |
KR102606352B1 (ko) * | 2022-04-05 | 2023-11-24 | 주식회사 타날리시스 | 신경망 모델을 활용한 유사 특허 문헌 추출 방법 및 이를 제공하는 장치 |
US11989506B2 (en) * | 2022-07-27 | 2024-05-21 | Capital One Services, Llc | Systems for database searching and database schemas management and methods of use thereof |
KR102744240B1 (ko) * | 2022-09-27 | 2024-12-19 | 네이버 주식회사 | 커뮤니티 네이티브 광고를 제공하는 방법, 시스템, 및 컴퓨터 프로그램 |
CN115879508A (zh) * | 2022-09-30 | 2023-03-31 | 华为技术有限公司 | 一种数据处理方法及相关装置 |
US12164751B1 (en) | 2024-01-12 | 2024-12-10 | Soot, Inc. | Machine-learning-based software application and tool menu |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887443A (zh) | 2009-05-13 | 2010-11-17 | 华为技术有限公司 | 一种文本的分类方法及装置 |
CN102968410A (zh) | 2012-12-04 | 2013-03-13 | 江南大学 | 一种基于rbf神经网络算法与语义特征选取的文本分类方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06309293A (ja) * | 1993-04-26 | 1994-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 多層構造型ニューラルネットワークの構成方法 |
JPH08221439A (ja) * | 1995-02-15 | 1996-08-30 | Oki Electric Ind Co Ltd | テキストファイルの自動分類方法 |
ATE440359T1 (de) | 1996-10-02 | 2009-09-15 | Stanford Res Inst Int | Verfahren und system zur automatischen textunabhängigen bewertung der aussprache für den sprachunterricht |
US9519858B2 (en) * | 2013-02-10 | 2016-12-13 | Microsoft Technology Licensing, Llc | Feature-augmented neural networks and applications of same |
-
2015
- 2015-01-30 KR KR1020167023661A patent/KR102363369B1/ko active IP Right Grant
- 2015-01-30 WO PCT/US2015/013717 patent/WO2015116909A1/en active Application Filing
- 2015-01-30 US US14/609,869 patent/US10366327B2/en active Active
- 2015-01-30 JP JP2016549301A patent/JP6588449B2/ja active Active
- 2015-01-30 EP EP15705162.4A patent/EP3100212A1/en active Pending
- 2015-01-30 CN CN201580006653.3A patent/CN105940395B/zh active Active
-
2019
- 2019-07-26 US US16/523,766 patent/US11853879B2/en active Active
-
2023
- 2023-12-22 US US18/395,172 patent/US20240202519A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887443A (zh) | 2009-05-13 | 2010-11-17 | 华为技术有限公司 | 一种文本的分类方法及装置 |
CN102968410A (zh) | 2012-12-04 | 2013-03-13 | 江南大学 | 一种基于rbf神经网络算法与语义特征选取的文本分类方法 |
Non-Patent Citations (1)
Title |
---|
Holger Schwenk 외 1명, "Connectionist language modeling for large vocabulary continuous speech recognition", 2002 IEEE International Conference on Acoustics, Speech, and Signal Processing, 2002.05.13., pp765-768. 1부.* |
Also Published As
Publication number | Publication date |
---|---|
JP2017509963A (ja) | 2017-04-06 |
JP6588449B2 (ja) | 2019-10-09 |
US20240202519A1 (en) | 2024-06-20 |
US20150220833A1 (en) | 2015-08-06 |
KR20160117516A (ko) | 2016-10-10 |
CN105940395B (zh) | 2019-07-16 |
US20190347552A1 (en) | 2019-11-14 |
WO2015116909A1 (en) | 2015-08-06 |
US11853879B2 (en) | 2023-12-26 |
EP3100212A1 (en) | 2016-12-07 |
US10366327B2 (en) | 2019-07-30 |
CN105940395A (zh) | 2016-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102363369B1 (ko) | 문서들의 벡터 표현들 생성하기 | |
US11960519B2 (en) | Classifying data objects | |
US11275895B1 (en) | Generating author vectors | |
US10803380B2 (en) | Generating vector representations of documents | |
US20200234102A1 (en) | Joint learning of local and global features for entity linking via neural networks | |
US9818409B2 (en) | Context-dependent modeling of phonemes | |
CN108140143B (zh) | 训练神经网络的方法、系统及存储介质 | |
CN105144164B (zh) | 使用深度网络对概念术语评分 | |
US11675975B2 (en) | Word classification based on phonetic features | |
US11954594B1 (en) | Training recurrent neural networks to generate sequences | |
US10381022B1 (en) | Audio classifier | |
CN107102981B (zh) | 词向量生成方法和装置 | |
CN107590168B (zh) | 用于关系推断的系统和方法 | |
US20110184981A1 (en) | Personalize Search Results for Search Queries with General Implicit Local Intent | |
KR20210019562A (ko) | 인공신경망 기계 번역시 메타 정보를 이용하는 기법 | |
WO2016210268A1 (en) | Selecting representative video frames for videos | |
CN112805715B (zh) | 识别实体属性关系 | |
US10755171B1 (en) | Hiding and detecting information using neural networks | |
US10503837B1 (en) | Translating terms using numeric representations | |
AU2014409115A1 (en) | System and method for language detection | |
CN112307738A (zh) | 用于处理文本的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20160826 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200129 Comment text: Request for Examination of Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210630 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220125 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220210 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220211 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20250122 Start annual number: 4 End annual number: 4 |