TH87129B - Automatic sentence segmentation system for languages without explicit sentence markers - Google Patents
Automatic sentence segmentation system for languages without explicit sentence markersInfo
- Publication number
- TH87129B TH87129B TH602003101F TH0602003101F TH87129B TH 87129 B TH87129 B TH 87129B TH 602003101 F TH602003101 F TH 602003101F TH 0602003101 F TH0602003101 F TH 0602003101F TH 87129 B TH87129 B TH 87129B
- Authority
- TH
- Thailand
- Prior art keywords
- sentence
- languages
- explicit
- segmentation
- cues
- Prior art date
Links
Abstract
------30/10/2563------(OCR) ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้นและจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหาส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วนบอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่าทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่นำไปให้ระบบเรียนรู้ค่าสถิติ ------------ DC60 ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตัวบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้ที่กำกวม เพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฎทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฎทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาที่ไม่มีตัวเบ่งประโยคชัดเจน ตามการประดิษฐ์นี้ ประกอบด้วย กลไกสำหรับแบ่งประโยคโดยอัตโนมัติที่รองรับภาษาที่ไม่มีส่วนบอกใบ้ถึงจุดเริ่มต้น และจุดสิ้นสุดของประโยคที่ชัดเจน สิ่งประดิษฐ์นี้ได้นำเสนอกลไกพิเศษ อันได้แก่วิธีการค้นหา ส่วนบอกใบ้ถึงตังบ่งประโยคที่ไม่ชัดเจน และกระบวนการพิจารณาขอบเขตของประโยคจากส่วน บอกใบ้กำกวมเพื่อแก้ปัญหาการแบ่งประโยคในภาษาที่ไม่มีตัวบ่งประโยคชัดเจน กระบวนการ ตัดสินการแบ่งประโยคเป็นไปในแนวทางประยุกต์ระหว่างการใช้กฏทางภาษาศาสตร์กับการใช้ค่า ทางสถิติ กล่าวคือ ผลลัพธ์การแบ่งประโยคที่ได้จะครอบคลุมความสามารถของทั้ง 2 แนวทาง ทั้งนี้ ความถูกต้องขึ้นอยู่กับความละเอียดของกฏทางภาษาศาสตร์ที่กำหนดให้และปริมาณของข้อมูลที่ นำไปให้ระบบเรียนรู้ค่าสถิติ------30/10/2020------(OCR) Automatic sentence segmentation system for languages without explicit sentence cues. The present invention comprises a mechanism for automatic sentence segmentation that supports languages without explicit sentence beginning and end clues. The present invention provides a special mechanism, namely, a method for finding unclear sentence cues and a process for determining sentence boundaries from ambiguous cues, to solve the sentence segmentation problem in languages without explicit sentence cues. The sentence segmentation decision process is based on a combination of linguistic rules and statistics, i.e., the resulting sentence segmentation covers the capabilities of both approaches. However, the accuracy depends on the granularity of the given linguistic rules and the amount of data fed to the system to learn the statistics. ------------ DC60 Automatic sentence segmentation system for languages without explicit sentence cues. The present invention comprises a mechanism for automatic sentence segmentation that supports languages without explicit sentence beginning and end clues. The present invention provides a special mechanism, namely, a method for finding unclear sentence cues and a process for determining sentence boundaries from ambiguous cues. To solve the sentence segmentation problem in languages without explicit sentence markers, the sentence segmentation decision process is a combination of linguistic rules and statistical methods. That is, the resulting sentence segmentation will cover the capabilities of both approaches. The accuracy depends on the granularity of the given linguistic rules and the amount of data fed to the system to learn the statistics. The automatic sentence segmentation system for languages without explicit sentence markers, according to the present invention, comprises a mechanism for automatic sentence segmentation that supports languages without explicit sentence beginning and end clues. The present invention provides special mechanisms, namely, a method for finding ambiguous sentence marker clues and a process for judging sentence boundaries from ambiguous clues, to solve the sentence segmentation problem in languages without explicit sentence markers. The sentence segmentation decision process is a combination of linguistic rules and statistical methods. That is, the resulting sentence segmentation will cover the capabilities of both approaches. The accuracy depends on the granularity of the given linguistic rules and the amount of data fed to the system to learn the statistics.
Claims (1)
Publications (4)
| Publication Number | Publication Date |
|---|---|
| TH87129S TH87129S (en) | 2007-10-19 |
| TH32286S1 TH32286S1 (en) | 2012-03-21 |
| TH129835A TH129835A (en) | 2013-11-21 |
| TH87129B true TH87129B (en) | 2022-03-24 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Albanie et al. | Bbc-oxford british sign language dataset | |
| Shi et al. | Open-domain sign language translation learned from online video | |
| US20150186361A1 (en) | Method and apparatus for improving a bilingual corpus, machine translation method and apparatus | |
| Petrović et al. | Using paraphrases for improving first story detection in news and Twitter | |
| Barbieri et al. | Interpretable emoji prediction via label-wise attention LSTMs | |
| US20210304749A1 (en) | Method and system for extraction of key-terms and synonyms for the key-terms | |
| WO2015200110A3 (en) | Techniques for machine language translation of text from an image based on non-textual context information from the image | |
| GB2523496A (en) | Systems and methods for computer assisted dispatch, incident report-based video search and tagging | |
| CN103051945B (en) | A kind of caption translating method of video playing terminal, system | |
| GB2509667A (en) | System & method for analyzing conceptually-related portions of text | |
| JP2017138655A (en) | Bilingual corpus creation method, device and program for the same, and machine translation system | |
| EP2506151A4 (en) | TREATMENT SYSTEM BASED ON SYNTHETIC AND SEMANTIC TREE CORE AND METHOD FOR AUTOMATIC EXTRACTION OF CORRELATIONS BETWEEN SCIENTIFIC AND TECHNOLOGICAL FEDERATOR ENTITIES | |
| WO2015054627A1 (en) | Methods and systems for aggregation and organization of multimedia data acquired from a plurality of sources | |
| WO2013134641A3 (en) | Recognizing speech in multiple languages | |
| WO2011126755A3 (en) | Detecting position of word breaks in a textual line image | |
| WO2010105216A3 (en) | System and method for automatic semantic labeling of natural language texts | |
| CN106649250B (en) | A kind of recognition methods of emotion neologisms and device | |
| GB2583679A (en) | Searching multilingual documents based on document structure extraction | |
| Li et al. | Learning with structured representations for negation scope extraction | |
| WO2014190220A3 (en) | Language model trained using predicted queries from statistical machine translation | |
| WO2017177809A1 (en) | Word segmentation method and system for language text | |
| WO2010075155A3 (en) | Method and system for searching for information pertaining target objects | |
| US20190012610A1 (en) | Self-feeding deep learning method and system | |
| TH87129B (en) | Automatic sentence segmentation system for languages without explicit sentence markers | |
| WO2012030053A3 (en) | Apparatus and method for recognizing an idiomatic expression using phrase alignment of a parallel corpus |