TH129835A - ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน - Google Patents

ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน

Info

Publication number
TH129835A
TH129835A TH602003101F TH0602003101F TH129835A TH 129835 A TH129835 A TH 129835A TH 602003101 F TH602003101 F TH 602003101F TH 0602003101 F TH0602003101 F TH 0602003101F TH 129835 A TH129835 A TH 129835A
Authority
TH
Thailand
Prior art keywords
sentence
languages
explicit
segmentation
cues
Prior art date
Application number
TH602003101F
Other languages
English (en)
Other versions
TH87129B (th
TH32286S1 (th
TH87129S (th
Inventor
ทรัพย์นิธิ นายเทพชัย
เรืองรจิตปกรณ์ นายธเนศ
Original Assignee
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
Filing date
Publication date
Publication of TH87129S publication Critical patent/TH87129S/th
Application filed by สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ filed Critical สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
Publication of TH32286S1 publication Critical patent/TH32286S1/th
Publication of TH129835A publication Critical patent/TH129835A/th
Publication of TH87129B publication Critical patent/TH87129B/th

Links

Abstract

------30/10/2563------(OCR) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้นและจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหาส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วนบอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่าทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่นำไปให้ระบบเรียนรู้ค่าสถิติ ------------ DC60 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวเบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตังบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้กำกวมเพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฏทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฏทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ
TH602003101F 2010-03-25 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน TH87129B (th)

Publications (4)

Publication Number Publication Date
TH87129S TH87129S (th) 2007-10-19
TH32286S1 TH32286S1 (th) 2012-03-21
TH129835A true TH129835A (th) 2013-11-21
TH87129B TH87129B (th) 2022-03-24

Family

ID=

Similar Documents

Publication Publication Date Title
US10061768B2 (en) Method and apparatus for improving a bilingual corpus, machine translation method and apparatus
US8355904B2 (en) Apparatus and method for detecting sentence boundaries
CN109858029B (zh) 一种提高语料整体质量的数据预处理方法
Sánchez et al. ICDAR 2015 competition HTRtS: Handwritten Text Recognition on the tranScriptorium dataset
Ramisch et al. An evaluation of methods for the extraction of multiword expressions
CN105912625A (zh) 一种面向链接数据的实体分类方法和系统
Layton et al. Recentred local profiles for authorship attribution
WO2013068854A3 (en) System & method for analyzing conceptually-related portions of text
WO2017177809A1 (zh) 语言文本的分词方法和系统
US20120010873A1 (en) Sentence translation apparatus and method
Zampieri et al. Colonia: Corpus of historical portuguese
Giménez et al. Context-aware discriminative phrase selection for statistical machine translation
CN106528694A (zh) 基于人工智能的语义判定处理方法和装置
EP2833269B1 (en) Terminology verification system and method for machine translation services for domain-specific texts
CN103559181A (zh) 一种双语语义关系分类模型的建立方法和系统
CN104317882B (zh) 一种决策级中文分词融合方法
CN109460730B (zh) 一种表格换行换页的分析方法及装置
TH129835A (th) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน
Barbaresi Language-classified Open Subtitles (LACLOS): download, extraction, and quality assessment
Leidig et al. Automatic detection of anglicisms for the pronunciation dictionary generation: a case study on our German IT corpus.
CN107679037B (zh) 一种基于词频的数字出版物词汇抽取方法
Ma et al. Letter sequence labeling for compound splitting
Feng et al. Semantic cohesion model for phrase-based SMT
US20120197894A1 (en) Apparatus and method for processing documents to extract expressions and descriptions
Hovy et al. Mining for unambiguous instances to adapt part-of-speech taggers to new domains