TH129835A - ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน - Google Patents
ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจนInfo
- Publication number
- TH129835A TH129835A TH602003101F TH0602003101F TH129835A TH 129835 A TH129835 A TH 129835A TH 602003101 F TH602003101 F TH 602003101F TH 0602003101 F TH0602003101 F TH 0602003101F TH 129835 A TH129835 A TH 129835A
- Authority
- TH
- Thailand
- Prior art keywords
- sentence
- languages
- explicit
- segmentation
- cues
- Prior art date
Links
Abstract
------30/10/2563------(OCR) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้นและจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหาส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วนบอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่าทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่นำไปให้ระบบเรียนรู้ค่าสถิติ ------------ DC60 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวเบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตังบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้กำกวมเพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฏทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฏทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ
Publications (4)
| Publication Number | Publication Date |
|---|---|
| TH87129S TH87129S (th) | 2007-10-19 |
| TH32286S1 TH32286S1 (th) | 2012-03-21 |
| TH129835A true TH129835A (th) | 2013-11-21 |
| TH87129B TH87129B (th) | 2022-03-24 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10061768B2 (en) | Method and apparatus for improving a bilingual corpus, machine translation method and apparatus | |
| Albanie et al. | Bbc-oxford british sign language dataset | |
| Ramisch et al. | An evaluation of methods for the extraction of multiword expressions | |
| Wicks et al. | A unified approach to sentence segmentation of punctuated text in many languages | |
| EP2506151A4 (en) | SEMANTIC SYNTAX TREE PROCESSING SYSTEM ON CORE BASIS AND METHOD FOR THE AUTOMATIC EXTRACTION OF SEMANTIC CORRELATIONS BETWEEN SCIENTIFIC AND TECHNICAL BONE UNITS | |
| CN105912625A (zh) | 一种面向链接数据的实体分类方法和系统 | |
| Layton et al. | Recentred local profiles for authorship attribution | |
| WO2017177809A1 (zh) | 语言文本的分词方法和系统 | |
| GB2509667A (en) | System & method for analyzing conceptually-related portions of text | |
| CN105630941A (zh) | 基于统计和网页结构的Web正文内容抽取方法 | |
| Schaefer et al. | A two-step approach for automatic OCR post-correction | |
| CN112101032A (zh) | 一种基于自蒸馏的命名实体识别与纠错方法 | |
| Giménez et al. | Context-aware discriminative phrase selection for statistical machine translation | |
| CN106528694A (zh) | 基于人工智能的语义判定处理方法和装置 | |
| CN104317882B (zh) | 一种决策级中文分词融合方法 | |
| US20150039286A1 (en) | Terminology verification systems and methods for machine translation services for domain-specific texts | |
| CN109460730B (zh) | 一种表格换行换页的分析方法及装置 | |
| KR20120045906A (ko) | 코퍼스 오류 교정 장치 및 그 방법 | |
| TH129835A (th) | ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน | |
| US8666987B2 (en) | Apparatus and method for processing documents to extract expressions and descriptions | |
| Le et al. | Using term position similarity and language modeling for bilingual document alignment | |
| TH87129B (th) | ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน | |
| Hovy et al. | Mining for unambiguous instances to adapt part-of-speech taggers to new domains | |
| CN108205542A (zh) | 一种歌曲评论的分析方法和系统 | |
| CN103942188B (zh) | 一种识别语料语言的方法和装置 |