TH87129B - Automatic sentence segmentation system for languages without explicit sentence markers - Google Patents

Automatic sentence segmentation system for languages without explicit sentence markers

Info

Publication number
TH87129B
TH87129B TH602003101F TH0602003101F TH87129B TH 87129 B TH87129 B TH 87129B TH 602003101 F TH602003101 F TH 602003101F TH 0602003101 F TH0602003101 F TH 0602003101F TH 87129 B TH87129 B TH 87129B
Authority
TH
Thailand
Prior art keywords
sentence
languages
explicit
segmentation
cues
Prior art date
Application number
TH602003101F
Other languages
Thai (th)
Other versions
TH32286S1 (en
TH129835A (en
TH87129S (en
Inventor
ตั้งเวียงวัง นายจิระ
ทรัพย์นิธิ นายเทพชัย
เรืองรจิตปกรณ์ นายธเนศ
Original Assignee
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
แอสโซซิเอทเต็ต บริติช ฟูดส์ พีแอลซี
Filing date
Publication date
Publication of TH87129S publication Critical patent/TH87129S/en
Application filed by สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, แอสโซซิเอทเต็ต บริติช ฟูดส์ พีแอลซี filed Critical สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
Publication of TH32286S1 publication Critical patent/TH32286S1/en
Publication of TH129835A publication Critical patent/TH129835A/en
Publication of TH87129B publication Critical patent/TH87129B/en

Links

Abstract

------30/10/2563------(OCR) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้นและจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหาส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วนบอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่าทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่นำไปให้ระบบเรียนรู้ค่าสถิติ ------------ DC60 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวเบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตังบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้กำกวมเพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฏทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฏทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ------30/10/2020------(OCR) Automatic sentence segmentation system for languages without explicit sentence cues. The present invention comprises a mechanism for automatic sentence segmentation that supports languages without explicit sentence beginning and end clues. The present invention provides a special mechanism, namely, a method for finding unclear sentence cues and a process for determining sentence boundaries from ambiguous cues, to solve the sentence segmentation problem in languages without explicit sentence cues. The sentence segmentation decision process is based on a combination of linguistic rules and statistics, i.e., the resulting sentence segmentation covers the capabilities of both approaches. However, the accuracy depends on the granularity of the given linguistic rules and the amount of data fed to the system to learn the statistics. ------------ DC60 Automatic sentence segmentation system for languages without explicit sentence cues. The present invention comprises a mechanism for automatic sentence segmentation that supports languages without explicit sentence beginning and end clues. The present invention provides a special mechanism, namely, a method for finding unclear sentence cues and a process for determining sentence boundaries from ambiguous cues. To solve the sentence segmentation problem in languages without explicit sentence markers, the sentence segmentation decision process is a combination of linguistic rules and statistical methods. That is, the resulting sentence segmentation will cover the capabilities of both approaches. The accuracy depends on the granularity of the given linguistic rules and the amount of data fed to the system to learn the statistics. The automatic sentence segmentation system for languages without explicit sentence markers, according to the present invention, comprises a mechanism for automatic sentence segmentation that supports languages without explicit sentence beginning and end clues. The present invention provides special mechanisms, namely, a method for finding ambiguous sentence marker clues and a process for judging sentence boundaries from ambiguous clues, to solve the sentence segmentation problem in languages without explicit sentence markers. The sentence segmentation decision process is a combination of linguistic rules and statistical methods. That is, the resulting sentence segmentation will cover the capabilities of both approaches. The accuracy depends on the granularity of the given linguistic rules and the amount of data fed to the system to learn the statistics.

Claims (1)

1. ข้าพเจ้าขอถือสิทธิในแบบผลิตภัณฑ์ซึ่งได้แก่รูปร่างลักษณะของ ภาชนะบรรจุ ซึ่งมีลักษณะ ตามที่ปรากฎในภาพแสดงแบบผลิตภัณฑ์ซึ่งได้ยื่นมาพร้อมนี้1. I hereby reserve the rights to the product design, which includes the shape and appearance of the container, as shown in the product design image which has been submitted herewith.
TH602003101F 2010-03-25 Automatic sentence segmentation system for languages without explicit sentence markers TH87129B (en)

Publications (4)

Publication Number Publication Date
TH87129S TH87129S (en) 2007-10-19
TH32286S1 TH32286S1 (en) 2012-03-21
TH129835A TH129835A (en) 2013-11-21
TH87129B true TH87129B (en) 2022-03-24

Family

ID=

Similar Documents

Publication Publication Date Title
Albanie et al. Bbc-oxford british sign language dataset
Shi et al. Open-domain sign language translation learned from online video
US20150186361A1 (en) Method and apparatus for improving a bilingual corpus, machine translation method and apparatus
Petrović et al. Using paraphrases for improving first story detection in news and Twitter
Barbieri et al. Interpretable emoji prediction via label-wise attention LSTMs
US20210304749A1 (en) Method and system for extraction of key-terms and synonyms for the key-terms
WO2015200110A3 (en) Techniques for machine language translation of text from an image based on non-textual context information from the image
GB2523496A (en) Systems and methods for computer assisted dispatch, incident report-based video search and tagging
CN103051945B (en) A kind of caption translating method of video playing terminal, system
GB2509667A (en) System & method for analyzing conceptually-related portions of text
JP2017138655A (en) Bilingual corpus creation method, device and program for the same, and machine translation system
EP2506151A4 (en) TREATMENT SYSTEM BASED ON SYNTHETIC AND SEMANTIC TREE CORE AND METHOD FOR AUTOMATIC EXTRACTION OF CORRELATIONS BETWEEN SCIENTIFIC AND TECHNOLOGICAL FEDERATOR ENTITIES
WO2015054627A1 (en) Methods and systems for aggregation and organization of multimedia data acquired from a plurality of sources
WO2013134641A3 (en) Recognizing speech in multiple languages
WO2011126755A3 (en) Detecting position of word breaks in a textual line image
WO2010105216A3 (en) System and method for automatic semantic labeling of natural language texts
CN106649250B (en) A kind of recognition methods of emotion neologisms and device
GB2583679A (en) Searching multilingual documents based on document structure extraction
Li et al. Learning with structured representations for negation scope extraction
WO2014190220A3 (en) Language model trained using predicted queries from statistical machine translation
WO2017177809A1 (en) Word segmentation method and system for language text
WO2010075155A3 (en) Method and system for searching for information pertaining target objects
US20190012610A1 (en) Self-feeding deep learning method and system
TH87129B (en) Automatic sentence segmentation system for languages without explicit sentence markers
WO2012030053A3 (en) Apparatus and method for recognizing an idiomatic expression using phrase alignment of a parallel corpus