TH129835A - ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน - Google Patents

ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน

Info

Publication number
TH129835A
TH129835A TH602003101F TH0602003101F TH129835A TH 129835 A TH129835 A TH 129835A TH 602003101 F TH602003101 F TH 602003101F TH 0602003101 F TH0602003101 F TH 0602003101F TH 129835 A TH129835 A TH 129835A
Authority
TH
Thailand
Prior art keywords
sentence
languages
explicit
segmentation
cues
Prior art date
Application number
TH602003101F
Other languages
English (en)
Other versions
TH32286S1 (th
TH87129B (th
TH87129S (th
Inventor
ทรัพย์นิธิ นายเทพชัย
เรืองรจิตปกรณ์ นายธเนศ
Original Assignee
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
Filing date
Publication date
Publication of TH87129S publication Critical patent/TH87129S/th
Application filed by สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ filed Critical สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
Publication of TH32286S1 publication Critical patent/TH32286S1/th
Publication of TH129835A publication Critical patent/TH129835A/th
Publication of TH87129B publication Critical patent/TH87129B/th

Links

Abstract

------30/10/2563------(OCR) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้นและจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหาส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วนบอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่าทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่นำไปให้ระบบเรียนรู้ค่าสถิติ ------------ DC60 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวเบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตังบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้กำกวมเพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฏทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฏทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ
TH602003101F 2010-03-25 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน TH87129B (th)

Publications (4)

Publication Number Publication Date
TH87129S TH87129S (th) 2007-10-19
TH32286S1 TH32286S1 (th) 2012-03-21
TH129835A true TH129835A (th) 2013-11-21
TH87129B TH87129B (th) 2022-03-24

Family

ID=

Similar Documents

Publication Publication Date Title
US10061768B2 (en) Method and apparatus for improving a bilingual corpus, machine translation method and apparatus
Albanie et al. Bbc-oxford british sign language dataset
Ramisch et al. An evaluation of methods for the extraction of multiword expressions
Wicks et al. A unified approach to sentence segmentation of punctuated text in many languages
EP2506151A4 (en) SEMANTIC SYNTAX TREE PROCESSING SYSTEM ON CORE BASIS AND METHOD FOR THE AUTOMATIC EXTRACTION OF SEMANTIC CORRELATIONS BETWEEN SCIENTIFIC AND TECHNICAL BONE UNITS
CN105912625A (zh) 一种面向链接数据的实体分类方法和系统
Layton et al. Recentred local profiles for authorship attribution
WO2017177809A1 (zh) 语言文本的分词方法和系统
GB2509667A (en) System & method for analyzing conceptually-related portions of text
CN105630941A (zh) 基于统计和网页结构的Web正文内容抽取方法
Schaefer et al. A two-step approach for automatic OCR post-correction
CN112101032A (zh) 一种基于自蒸馏的命名实体识别与纠错方法
Giménez et al. Context-aware discriminative phrase selection for statistical machine translation
CN106528694A (zh) 基于人工智能的语义判定处理方法和装置
CN104317882B (zh) 一种决策级中文分词融合方法
US20150039286A1 (en) Terminology verification systems and methods for machine translation services for domain-specific texts
CN109460730B (zh) 一种表格换行换页的分析方法及装置
KR20120045906A (ko) 코퍼스 오류 교정 장치 및 그 방법
TH129835A (th) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน
US8666987B2 (en) Apparatus and method for processing documents to extract expressions and descriptions
Le et al. Using term position similarity and language modeling for bilingual document alignment
TH87129B (th) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน
Hovy et al. Mining for unambiguous instances to adapt part-of-speech taggers to new domains
CN108205542A (zh) 一种歌曲评论的分析方法和系统
CN103942188B (zh) 一种识别语料语言的方法和装置