TH129835A - ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน - Google Patents
ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจนInfo
- Publication number
- TH129835A TH129835A TH602003101F TH0602003101F TH129835A TH 129835 A TH129835 A TH 129835A TH 602003101 F TH602003101 F TH 602003101F TH 0602003101 F TH0602003101 F TH 0602003101F TH 129835 A TH129835 A TH 129835A
- Authority
- TH
- Thailand
- Prior art keywords
- sentence
- languages
- explicit
- segmentation
- cues
- Prior art date
Links
Abstract
------30/10/2563------(OCR) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้นและจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหาส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วนบอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่าทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่นำไปให้ระบบเรียนรู้ค่าสถิติ ------------ DC60 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวเบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตังบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้กำกวมเพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฏทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฏทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ
Publications (4)
| Publication Number | Publication Date |
|---|---|
| TH87129S TH87129S (th) | 2007-10-19 |
| TH32286S1 TH32286S1 (th) | 2012-03-21 |
| TH129835A true TH129835A (th) | 2013-11-21 |
| TH87129B TH87129B (th) | 2022-03-24 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10061768B2 (en) | Method and apparatus for improving a bilingual corpus, machine translation method and apparatus | |
| US8355904B2 (en) | Apparatus and method for detecting sentence boundaries | |
| CN109858029B (zh) | 一种提高语料整体质量的数据预处理方法 | |
| Sánchez et al. | ICDAR 2015 competition HTRtS: Handwritten Text Recognition on the tranScriptorium dataset | |
| Ramisch et al. | An evaluation of methods for the extraction of multiword expressions | |
| CN105912625A (zh) | 一种面向链接数据的实体分类方法和系统 | |
| Layton et al. | Recentred local profiles for authorship attribution | |
| WO2013068854A3 (en) | System & method for analyzing conceptually-related portions of text | |
| WO2017177809A1 (zh) | 语言文本的分词方法和系统 | |
| US20120010873A1 (en) | Sentence translation apparatus and method | |
| Zampieri et al. | Colonia: Corpus of historical portuguese | |
| Giménez et al. | Context-aware discriminative phrase selection for statistical machine translation | |
| CN106528694A (zh) | 基于人工智能的语义判定处理方法和装置 | |
| EP2833269B1 (en) | Terminology verification system and method for machine translation services for domain-specific texts | |
| CN103559181A (zh) | 一种双语语义关系分类模型的建立方法和系统 | |
| CN104317882B (zh) | 一种决策级中文分词融合方法 | |
| CN109460730B (zh) | 一种表格换行换页的分析方法及装置 | |
| TH129835A (th) | ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน | |
| Barbaresi | Language-classified Open Subtitles (LACLOS): download, extraction, and quality assessment | |
| Leidig et al. | Automatic detection of anglicisms for the pronunciation dictionary generation: a case study on our German IT corpus. | |
| CN107679037B (zh) | 一种基于词频的数字出版物词汇抽取方法 | |
| Ma et al. | Letter sequence labeling for compound splitting | |
| Feng et al. | Semantic cohesion model for phrase-based SMT | |
| US20120197894A1 (en) | Apparatus and method for processing documents to extract expressions and descriptions | |
| Hovy et al. | Mining for unambiguous instances to adapt part-of-speech taggers to new domains |