KR101987592B1 - 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 - Google Patents
문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 Download PDFInfo
- Publication number
- KR101987592B1 KR101987592B1 KR1020180103702A KR20180103702A KR101987592B1 KR 101987592 B1 KR101987592 B1 KR 101987592B1 KR 1020180103702 A KR1020180103702 A KR 1020180103702A KR 20180103702 A KR20180103702 A KR 20180103702A KR 101987592 B1 KR101987592 B1 KR 101987592B1
- Authority
- KR
- South Korea
- Prior art keywords
- probability
- solutions
- length
- solution
- grammar model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G06F17/274—
-
- G06N7/005—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 도 1에 도시된 정확도 향상 장치의 개략적인 블록도를 나타낸다.
도 3은 일 실시예에 따른 확률합을 추정하는 제1 알고리즘을 설명하기 위한 일 예를 나타낸다.
도 4는 일 실시예에 따른 확률합의 그래디언트를 추정하는 제2 알고리즘을 설명하기 위한 일 예를 나타낸다.
도 5는 도 1에 도시된 정확도 향상 장치의 동작을 설명하기 위한 순서도를 나타낸다.
Claims (14)
- 문법 모델의 정확도 향상 장치의 문법 모델의 정확도 향상 방법에 있어서,
상기 장치가 제1 길이의 해를 문법 모델에 반영하기 위해, 제2 길이의 해의 확률합을 추정하는 단계;
상기 장치가 상기 제2 길이의 해의 확률합에 기초하여 상기 문법 모델의 비용 함수를 설정하는 단계; 및
상기 장치가 상기 비용 함수에 기초하여 상기 문법 모델을 정규화하는 단계
를 포함하고,
상기 제1 길이의 해는 상기 문법 모델에 입력되는 데이터에 대한 해이고,
상기 제2 길이의 해는 상기 문법 모델이 생성한 상기 데이터에 대한 해이고,
상기 제2 길이의 해의 확률합은 복수의 제2 길이의 해들 중에서 서브 트리를 생성하는 복수의 해들의 확률값을 합한 확률합인 문법 모델의 정확도 향상 방법.
- 제1항에 있어서,
상기 제1 길이의 해는 상기 데이터에 대한 무한한 길이의 해이고,
상기 제2 길이의 해는 상기 데이터에 대한 유한한 길이의 해인 문법 모델의 정확도 향상 방법.
- 제1항에 있어서,
상기 추정하는 단계는,
상기 복수의 해들의 확률값을 계산하는 단계;
상기 복수의 해들의 확률값을 합하여 상기 복수의 해들의 확률합을 계산하는 단계; 및
상기 제2 길이의 해의 확률합을 상기 복수의 해들의 확률합으로 결정하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제3항에 있어서,
상기 복수의 해들의 확률값을 계산하는 단계는,
상기 복수의 해들 각각이 생성한 복수의 서브 트리들 중에서 미리 설정된 해의 길이에 대응하는 서브 트리의 생성 확률에 기초하여 상기 복수의 해들의 확률값을 계산하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제3항에 있어서,
상기 복수의 해들의 확률합을 계산하는 단계는,
상기 문법 모델의 세부 규칙들의 선택 확률을 상기 복수의 해들의 확률값에 곱하는 단계; 및
상기 선택 확률을 곱한 복수의 해들의 확률값을 합하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제3항에 있어서,
상기 추정하는 단계는,
상기 복수의 해들의 확률합의 수렴치를 추정하는 단계
를 더 포함하는 문법 모델의 정확도 향상 방법.
- 제6항에 있어서,
상기 설정하는 단계는,
상기 복수의 해의 확률합의 수렴치로 상기 제2 길이의 해의 확률값을 나누어 상기 비용 함수를 설정하는 단계
를 포함하는 문법 모델의 정확도 향상 방법.
- 제1 길이의 해를 문법 모델에 반영하기 위해, 제2 길이의 해의 확률합을 추정하는 추정부; 및
상기 제2 길이의 해의 확률합에 기초하여 상기 문법 모델의 비용 함수를 설정하고, 상기 비용 함수에 기초하여 상기 문법 모델을 정규화하는 설정부
를 포함하고,
상기 제1 길이의 해는 상기 문법 모델에 입력되는 데이터에 대한 해이고,
상기 제2 길이의 해는 상기 문법 모델이 생성한 상기 데이터에 대한 해이고,
상기 제2 길이의 해의 확률합은 복수의 제2 길이의 해들 중에서 서브 트리를 생성하는 복수의 해들의 확률값을 합한 확률합인 문법 모델의 정확도 향상 장치.
- 제8항에 있어서,
상기 제1 길이의 해는 상기 데이터에 대한 무한한 길이의 해이고,
상기 제2 길이의 해는 상기 데이터에 대한 유한한 길이의 해인 문법 모델의 정확도 향상 장치.
- 제8항에 있어서,
상기 추정부는,
상기 복수의 해들의 확률값을 계산하고, 상기 복수의 해들의 확률값을 합하여 상기 복수의 해들의 확률합을 계산하고, 상기 제2 길이의 해의 확률합을 상기 복수의 해들의 확률합으로 결정하는 문법 모델의 정확도 향상 장치.
- 제10항에 있어서,
상기 추정부는,
상기 복수의 해들 각각이 생성한 복수의 서브 트리들 중에서 미리 설정된 해의 길이에 대응하는 서브 트리의 생성 확률에 기초하여 상기 복수의 해들의 확률값을 계산하는 문법 모델의 정확도 향상 장치.
- 제10항에 있어서,
상기 추정부는,
상기 문법 모델의 세부 규칙들의 선택 확률을 상기 복수의 해들의 확률값에 곱하고, 상기 선택 확률을 곱한 복수의 해들의 확률값을 합하는 문법 모델의 정확도 향상 장치.
- 제10항에 있어서,
상기 추정부는,
상기 복수의 해들의 확률합의 수렴치를 추정하는 문법 모델의 정확도 향상 장치.
- 제13항에 있어서,
상기 설정부는,
상기 복수의 해의 확률합의 수렴치로 상기 제2 길이의 해의 확률값을 나누어 상기 비용 함수를 설정하는 문법 모델의 정확도 향상 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180103702A KR101987592B1 (ko) | 2018-08-31 | 2018-08-31 | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180103702A KR101987592B1 (ko) | 2018-08-31 | 2018-08-31 | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101987592B1 true KR101987592B1 (ko) | 2019-06-10 |
Family
ID=66848255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180103702A Active KR101987592B1 (ko) | 2018-08-31 | 2018-08-31 | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101987592B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160008480A (ko) * | 2014-07-14 | 2016-01-22 | 삼성전자주식회사 | 명칭을 강인하게 태깅하는 방법 및 시스템 |
KR20160019942A (ko) * | 2013-07-05 | 2016-02-22 | 리소프트데브, 인코포레이티드 | 인공지능형 에이전트 또는 시스템을 작성 및 구현하는 시스템 및 방법 |
US20170011029A1 (en) * | 2013-05-09 | 2017-01-12 | Moodwire, Inc. | Hybrid human machine learning system and method |
US9934777B1 (en) * | 2016-07-01 | 2018-04-03 | Amazon Technologies, Inc. | Customized speech processing language models |
-
2018
- 2018-08-31 KR KR1020180103702A patent/KR101987592B1/ko active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170011029A1 (en) * | 2013-05-09 | 2017-01-12 | Moodwire, Inc. | Hybrid human machine learning system and method |
KR20160019942A (ko) * | 2013-07-05 | 2016-02-22 | 리소프트데브, 인코포레이티드 | 인공지능형 에이전트 또는 시스템을 작성 및 구현하는 시스템 및 방법 |
KR20160008480A (ko) * | 2014-07-14 | 2016-01-22 | 삼성전자주식회사 | 명칭을 강인하게 태깅하는 방법 및 시스템 |
US9934777B1 (en) * | 2016-07-01 | 2018-04-03 | Amazon Technologies, Inc. | Customized speech processing language models |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11816442B2 (en) | Multi-turn dialogue response generation with autoregressive transformer models | |
CN111414987B (zh) | 神经网络的训练方法、训练装置和电子设备 | |
JP4532863B2 (ja) | 2言語コーパスを整列させるための方法および装置 | |
CN110442878B (zh) | 翻译方法、机器翻译模型的训练方法、装置及存储介质 | |
US8983887B2 (en) | Probabilistic sampling using search trees constrained by heuristic bounds | |
US20200168213A1 (en) | Method for re-aligning corpus and improving the consistency | |
CN111859991B (zh) | 语言翻译处理模型训练方法和语言翻译处理方法 | |
CN111462751A (zh) | 解码语音数据的方法、装置、计算机设备和存储介质 | |
JP2022526876A (ja) | モデルをトレーニングするためのトレーニング・データ修正 | |
CN110309516A (zh) | 机器翻译模型的训练方法、装置与电子设备 | |
JP7138467B2 (ja) | 訳出完了判定装置、翻訳装置、訳出完了判定モデル学習装置、およびプログラム | |
KR101120773B1 (ko) | 삭제된 보간 n-그램 언어 모델의 arpa 표준 형식 표현 | |
JP7175474B2 (ja) | 文生成学習方法、文生成学習装置及びプログラム | |
CN112487813A (zh) | 命名实体识别方法及系统、电子设备及存储介质 | |
CN118485127A (zh) | 一种prompt自动生成方法、系统、终端及介质 | |
CN112766002B (zh) | 基于动态规划的文本对齐方法及系统 | |
KR20210067293A (ko) | 단대단 신경망 번역 시스템 및 그 방법 | |
KR101987592B1 (ko) | 문법 모델의 정확도 향상 방법 및 이를 수행하는 장치들 | |
CN118093790B (zh) | 一种检索增强的大语言模型生成优化方法 | |
CN118536504A (zh) | 一种用于大语言模型的词向量训练方法、装置及介质 | |
US20230419145A1 (en) | Processor and method for performing tensor network contraction in quantum simulator | |
US20230034322A1 (en) | Computer-implemented method, device, and computer program product | |
CN113537487B (zh) | 模型训练的方法、生成图片的方法及其装置 | |
US20220215185A1 (en) | Method and system for facilitating sequence-to-sequence translation | |
KR102635503B1 (ko) | 마르코프 체인 몬테 카를로 샘플링의 초기값 결정 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180831 |
|
PA0201 | Request for examination | ||
PA0302 | Request for accelerated examination |
Patent event date: 20190116 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination Patent event date: 20180831 Patent event code: PA03021R01I Comment text: Patent Application |
|
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20190131 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20190529 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20190603 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20190603 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20220329 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20230321 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20240401 Start annual number: 6 End annual number: 6 |