KR101987592B1 - 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 - Google Patents
문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 Download PDFInfo
- Publication number
- KR101987592B1 KR101987592B1 KR1020180103702A KR20180103702A KR101987592B1 KR 101987592 B1 KR101987592 B1 KR 101987592B1 KR 1020180103702 A KR1020180103702 A KR 1020180103702A KR 20180103702 A KR20180103702 A KR 20180103702A KR 101987592 B1 KR101987592 B1 KR 101987592B1
- Authority
- KR
- South Korea
- Prior art keywords
- probability
- solutions
- length
- solution
- grammar model
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000000243 solution Substances 0.000 description 140
- 230000006870 function Effects 0.000 description 25
- 238000009826 distribution Methods 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003749 cleanliness Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G06F17/274—
-
- G06N7/005—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 도 1에 도시된 정확도 향상 장치의 개략적인 블록도를 나타낸다.
도 3은 일 실시예에 따른 확률합을 추정하는 제1 알고리즘을 설명하기 위한 일 예를 나타낸다.
도 4는 일 실시예에 따른 확률합의 그래디언트를 추정하는 제2 알고리즘을 설명하기 위한 일 예를 나타낸다.
도 5는 도 1에 도시된 정확도 향상 장치의 동작을 설명하기 위한 순서도를 나타낸다.
Claims (14)
- 문법 모델의 정확도 향상 장치의 문법 모델의 정확도 향상 방법에 있어서,
상기 장치가 제1 길이의 해를 문법 모델에 반영하기 위해, 제2 길이의 해의 확률합을 추정하는 단계;
상기 장치가 상기 제2 길이의 해의 확률합에 기초하여 상기 문법 모델의 비용 함수를 설정하는 단계; 및
상기 장치가 상기 비용 함수에 기초하여 상기 문법 모델을 정규화하는 단계
를 포함하고,
상기 제1 길이의 해는 상기 문법 모델에 입력되는 데이터에 대한 해이고,
상기 제2 길이의 해는 상기 문법 모델이 생성한 상기 데이터에 대한 해이고,
상기 제2 길이의 해의 확률합은 복수의 제2 길이의 해들 중에서 서브 트리를 생성하는 복수의 해들의 확률값을 합한 확률합인 문법 모델의 정확도 향상 방법.
- 제1항에 있어서,
상기 제1 길이의 해는 상기 데이터에 대한 무한한 길이의 해이고,
상기 제2 길이의 해는 상기 데이터에 대한 유한한 길이의 해인 문법 모델의 정확도 향상 방법.
- 제1항에 있어서,
상기 추정하는 단계는,
상기 복수의 해들의 확률값을 계산하는 단계;
상기 복수의 해들의 확률값을 합하여 상기 복수의 해들의 확률합을 계산하는 단계; 및
상기 제2 길이의 해의 확률합을 상기 복수의 해들의 확률합으로 결정하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제3항에 있어서,
상기 복수의 해들의 확률값을 계산하는 단계는,
상기 복수의 해들 각각이 생성한 복수의 서브 트리들 중에서 미리 설정된 해의 길이에 대응하는 서브 트리의 생성 확률에 기초하여 상기 복수의 해들의 확률값을 계산하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제3항에 있어서,
상기 복수의 해들의 확률합을 계산하는 단계는,
상기 문법 모델의 세부 규칙들의 선택 확률을 상기 복수의 해들의 확률값에 곱하는 단계; 및
상기 선택 확률을 곱한 복수의 해들의 확률값을 합하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제3항에 있어서,
상기 추정하는 단계는,
상기 복수의 해들의 확률합의 수렴치를 추정하는 단계
를 더 포함하는 문법 모델의 정확도 향상 방법.
- 제6항에 있어서,
상기 설정하는 단계는,
상기 복수의 해의 확률합의 수렴치로 상기 제2 길이의 해의 확률값을 나누어 상기 비용 함수를 설정하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제1 길이의 해를 문법 모델에 반영하기 위해, 제2 길이의 해의 확률합을 추정하는 추정부; 및
상기 제2 길이의 해의 확률합에 기초하여 상기 문법 모델의 비용 함수를 설정하고, 상기 비용 함수에 기초하여 상기 문법 모델을 정규화하는 설정부
를 포함하고,
상기 제1 길이의 해는 상기 문법 모델에 입력되는 데이터에 대한 해이고,
상기 제2 길이의 해는 상기 문법 모델이 생성한 상기 데이터에 대한 해이고,
상기 제2 길이의 해의 확률합은 복수의 제2 길이의 해들 중에서 서브 트리를 생성하는 복수의 해들의 확률값을 합한 확률합인 문법 모델의 정확도 향상 장치.
- 제8항에 있어서,
상기 제1 길이의 해는 상기 데이터에 대한 무한한 길이의 해이고,
상기 제2 길이의 해는 상기 데이터에 대한 유한한 길이의 해인 문법 모델의 정확도 향상 장치.
- 제8항에 있어서,
상기 추정부는,
상기 복수의 해들의 확률값을 계산하고, 상기 복수의 해들의 확률값을 합하여 상기 복수의 해들의 확률합을 계산하고, 상기 제2 길이의 해의 확률합을 상기 복수의 해들의 확률합으로 결정하는 문법 모델의 정확도 향상 장치.
- 제10항에 있어서,
상기 추정부는,
상기 복수의 해들 각각이 생성한 복수의 서브 트리들 중에서 미리 설정된 해의 길이에 대응하는 서브 트리의 생성 확률에 기초하여 상기 복수의 해들의 확률값을 계산하는 문법 모델의 정확도 향상 장치.
- 제10항에 있어서,
상기 추정부는,
상기 문법 모델의 세부 규칙들의 선택 확률을 상기 복수의 해들의 확률값에 곱하고, 상기 선택 확률을 곱한 복수의 해들의 확률값을 합하는 문법 모델의 정확도 향상 장치.
- 제10항에 있어서,
상기 추정부는,
상기 복수의 해들의 확률합의 수렴치를 추정하는 문법 모델의 정확도 향상 장치.
- 제13항에 있어서,
상기 설정부는,
상기 복수의 해의 확률합의 수렴치로 상기 제2 길이의 해의 확률값을 나누어 상기 비용 함수를 설정하는 문법 모델의 정확도 향상 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180103702A KR101987592B1 (ko) | 2018-08-31 | 2018-08-31 | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180103702A KR101987592B1 (ko) | 2018-08-31 | 2018-08-31 | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101987592B1 true KR101987592B1 (ko) | 2019-06-10 |
Family
ID=66848255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180103702A KR101987592B1 (ko) | 2018-08-31 | 2018-08-31 | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101987592B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160008480A (ko) * | 2014-07-14 | 2016-01-22 | 삼성전자주식회사 | 명칭을 강인하게 태깅하는 방법 및 시스템 |
KR20160019942A (ko) * | 2013-07-05 | 2016-02-22 | 리소프트데브, 인코포레이티드 | 인공지능형 에이전트 또는 시스템을 작성 및 구현하는 시스템 및 방법 |
US20170011029A1 (en) * | 2013-05-09 | 2017-01-12 | Moodwire, Inc. | Hybrid human machine learning system and method |
US9934777B1 (en) * | 2016-07-01 | 2018-04-03 | Amazon Technologies, Inc. | Customized speech processing language models |
-
2018
- 2018-08-31 KR KR1020180103702A patent/KR101987592B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170011029A1 (en) * | 2013-05-09 | 2017-01-12 | Moodwire, Inc. | Hybrid human machine learning system and method |
KR20160019942A (ko) * | 2013-07-05 | 2016-02-22 | 리소프트데브, 인코포레이티드 | 인공지능형 에이전트 또는 시스템을 작성 및 구현하는 시스템 및 방법 |
KR20160008480A (ko) * | 2014-07-14 | 2016-01-22 | 삼성전자주식회사 | 명칭을 강인하게 태깅하는 방법 및 시스템 |
US9934777B1 (en) * | 2016-07-01 | 2018-04-03 | Amazon Technologies, Inc. | Customized speech processing language models |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11816442B2 (en) | Multi-turn dialogue response generation with autoregressive transformer models | |
CN111414987B (zh) | 神经网络的训练方法、训练装置和电子设备 | |
JP4532863B2 (ja) | 2言語コーパスを整列させるための方法および装置 | |
US8983887B2 (en) | Probabilistic sampling using search trees constrained by heuristic bounds | |
CN111859991B (zh) | 语言翻译处理模型训练方法和语言翻译处理方法 | |
US20120035915A1 (en) | Language model creation device, language model creation method, and computer-readable storage medium | |
US20210256069A1 (en) | Latent question reformulation and information accumulation for multi-hop machine reading | |
CN110210032A (zh) | 文本处理方法及装置 | |
CN111462751A (zh) | 解码语音数据的方法、装置、计算机设备和存储介质 | |
JP2022526876A (ja) | モデルをトレーニングするためのトレーニング・データ修正 | |
CN110309516A (zh) | 机器翻译模型的训练方法、装置与电子设备 | |
JP7138467B2 (ja) | 訳出完了判定装置、翻訳装置、訳出完了判定モデル学習装置、およびプログラム | |
KR20060044753A (ko) | 삭제된 보간 n-그램 언어 모델의 arpa 표준 형식 표현 | |
JP7175474B2 (ja) | 文生成学習方法、文生成学習装置及びプログラム | |
CN112487813A (zh) | 命名实体识别方法及系统、电子设备及存储介质 | |
KR101987592B1 (ko) | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 | |
CN118093790B (zh) | 一种检索增强的大语言模型生成优化方法 | |
CN117421573A (zh) | 用于问答检索模型的训练方法、装置及存储介质 | |
KR102519618B1 (ko) | 단대단 신경망 번역 시스템 및 그 방법 | |
US20230206084A1 (en) | Method, device, and program product for managing knowledge graphs | |
CN113537487B (zh) | 模型训练的方法、生成图片的方法及其装置 | |
US20220215185A1 (en) | Method and system for facilitating sequence-to-sequence translation | |
KR102635503B1 (ko) | 마르코프 체인 몬테 카를로 샘플링의 초기값 결정 방법 | |
JP7557438B2 (ja) | 自然言語処理モデル取得装置、自然言語処理装置、自然言語処理モデル取得方法、自然言語処理方法及びプログラム | |
CN118261268B (zh) | 一种长序列建模方法、装置、设备、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180831 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20190116 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20180831 Patent event code: PA03021R01I Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190131 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20190529 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20190603 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20190603 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20220329 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20230321 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20240401 Start annual number: 6 End annual number: 6 |