TH65852B - ระบบและกรรมวิธีตัดเเบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน - Google Patents
ระบบและกรรมวิธีตัดเเบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจนInfo
- Publication number
- TH65852B TH65852B TH401003011A TH0401003011A TH65852B TH 65852 B TH65852 B TH 65852B TH 401003011 A TH401003011 A TH 401003011A TH 0401003011 A TH0401003011 A TH 0401003011A TH 65852 B TH65852 B TH 65852B
- Authority
- TH
- Thailand
- Prior art keywords
- sentence
- token
- languages
- gap
- cutting
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 34
- ZPUCINDJVBIVPJ-LJISPDSOSA-N cocaine Chemical compound O([C@H]1C[C@@H]2CC[C@@H](N2C)[C@H]1C(=O)OC)C(=O)C1=CC=CC=C1 ZPUCINDJVBIVPJ-LJISPDSOSA-N 0.000 claims 5
- 230000006870 function Effects 0.000 claims 4
- 230000015572 biosynthetic process Effects 0.000 claims 3
- 238000006243 chemical reaction Methods 0.000 claims 3
- 238000003786 synthesis reaction Methods 0.000 claims 3
- 229960003920 cocaine Drugs 0.000 claims 2
- 230000015556 catabolic process Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 claims 1
- 238000012905 input function Methods 0.000 claims 1
- 238000007619 statistical method Methods 0.000 claims 1
Claims (6)
1. ระบบและกรรมวิธีตัดแบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน ประกอบด้วย อุปกรณ์ภายนอก (11) ที่ทำหน้าที่อินพุตข้อความที่ต่อเนื่องกันเข้าสู่อุปกรณ์ตัดแบ่งประโยค (10) อุปกรณ์ตัดแบ่งประโยค (10) ที่ทำหน้าที่ควบคุมการทำงานของระบบตัดแบ่งประโยค ที่ประกอบด้วย -หน่วยอินพุต (12)ที่ทำหน้าที่รับข้อมูลข้อความที่ต่อเนื่องกันหรือสายอักขระจากฐานข้อมูล (17) หรือ จากอุปกรณ์ภายนอก (11) ดังกล่าว -หน่วยความจำ (16) ที่ทำหน้าที่เก็บข้อมูลที่ได้รับจากหน่วยอินพุต (12) -ส่วนประมวลผล (14) ที่ทำหน้าที่ควบคุมการทำงานของระบบและประมวลผลข้อมูลที่ได้รับจาก หน่วยอินพุต (12) หรือจากหน่วยความจำ (16) และ -ส่วนสำหรับเอาต์พุต (13) ที่ทำหน้าที่ส่งข้อมูลที่ได้รับจากส่วนประมวลผล (14) ออกไปยังหน่วย แสดงผล (19) และ/หรือส่งข้อมูลดังกล่าวไปเก็บฐานข้อมูล (17) ที่มีลักษณะเฉพาะคือ ส่วนประมาณผล (14) ทำการตรวจสอบช่องว่างระหว่างโทเคนแต่ละโทเคนว่าเป็นตำแหน่ง ตัดประโยคหรือไม่ โดยใช้ผลของความน่าจะเป็นทางสถิติ ด้วยวิธีการนำโทเคนนั้นไปต่อเรียงกับโทเคนที่อยู่ก่อน หน้าจนกว่าจะพบช่องว่างที่เป็นตำแหน่งตัดประโยค จากนั้นส่งประโยคที่ได้รับการตัดแบ่งแล้วไปยังส่วนสำหรับ เอาต์พุต (13) เพื่อแสดงผลข้อมูลการตัดประโยคดังกล่าว
2. ระบบและกรรมวิธีตัดแบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน ตามข้อถือสิทธิ 1 ที่ซึ่งส่วน ประมวลผลมีระบบสำหรับการสังเคราะห์เสียงพูดจากข้อความอักษรเบรลล์เพื่อการแปลงข้อความที่ป้อนเข้ามาใน ระบบดังกล่าวให้กลายเป็นเสียงพูดสำหรับการสื่อสารของคนตาบอดด้วยการใช้วิธีการในการตัดแบ่งประโยค
3. ระบบและกรรมวิธีตัดแบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน ตามข้อถือสิทธิ 1 หรือ 2 ที่ซึ่ง ที่ซึ่งวิธีการในการตัดแบ่งประโยคดังกล่าว ปรกอบด้วยขั้นตอนดังต่อไปนี้ ก) การรับอินพุตสายอักขระที่ประกอบด้วยอักขระจำนวนหนึ่ง (21) จากฐานข้อมูล (17) หรือจาก อุปกรณ์ภานอก(11) ข) การแบ่งสายอักขระนั้นออกเป็นโทเคน (token) จำนวนหนึ่ง (22) ค) การวิเคราะห์หาช่องว่าง (space) ภายในโทเคนดังกล่าวแต่ละโทเคน โดยพิจารณาคำที่อยู่รอบข้าง (contextul word) ของช่องว่างดังกล่าว (23) ด้วยการระบุชนิดของคำด้วยวิธีการทางสถิติ (statistical POS tagging) (24) เพื่อตัดสินว่าช่องว่างดังกล่าวเป็นตำแหน่งตัดประโยคหรือไม่ ง) การตรวจสอบช่องว่างระหว่างโทเคนแต่ละโทเคนดังกล่าวเพื่อหาว่าช่องว่างที่พบดังกล่าวเป็น ตำแหน่งตัดประโยคหรือไม่โดยใช้ผลของความน่าจะเป็นทางสถิติ (25) จ) การรำโคเคนนั้นไปต่อเรียงกับโคเทนที่อยู่ก่อนหน้า (26) พร้อมทั้งทำซ้ำขั้นตอน ข), ค) และ ง) ถ้า หากพบว่าช่องว่างที่พบดังกล่าวไม่ใช่ช่องว่างที่เป็นตำแหน่งตัดประโยค โดยจะทำซ้ำจนกว่าจะพบช่องว่างที่เป็น ตำแหน่งตัดประโยค (27) ฉ) ทำการเอาต์พุตโทเคนทั้งหมดดังกล่าวในฐานะที่เป็นประโยคที่ได้รับการตัดแบ่งแล้ว (28)
4. ระบบและกรรมวิธีตัดแบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน ตามข้อถือสิทธิ 1 หรือ 3 ข้อใด ข้อหนึ่ง ที่ซึ่งส่วนประมวลผลทำการตัดแบ่งภาษาที่มีรอยต่อประโยคไม่ชัดเจนดังกล่าวคือ ภาษาไทย
5. ระบบและกรรมวิธีตัดแบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน ตามข้อถือสิทธิ 1 ที่ซึ่งอุปกรณ์ ภายนอก (11) คือ คีย์บอร์ด และ/หรือฐานข้อมูล
6. ระบบและกรรมวิธีตัดแบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน ตามข้อถือสิทธิ 1 ที่ซึ่งอุปกรณ์ตัด แบ่งประโยค (10) คือไมโครโปรเซสเซอร์ คอมพิวเตอร์ หรือตัวประมวลผลสัญญาณดิจิตอล
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TH116194A TH116194A (th) | 2012-09-04 |
| TH65852B true TH65852B (th) | 2018-10-26 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7440889B1 (en) | Sentence reconstruction using word ambiguity resolution | |
| US5634084A (en) | Abbreviation and acronym/initialism expansion procedures for a text to speech reader | |
| US7263488B2 (en) | Method and apparatus for identifying prosodic word boundaries | |
| JP3476008B2 (ja) | 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体 | |
| JP2001249922A (ja) | 単語分割方式及び装置 | |
| JP2002517039A (ja) | 中国語テキストにおける単語分割 | |
| KR20100072997A (ko) | 음절 분리에 기반한 문자열 검색 시스템 및 그 방법 | |
| EP1627325B1 (en) | Automatic segmentation of texts comprising chunks without separators | |
| EP2950306A1 (en) | A method and system for building a language model | |
| KR100481598B1 (ko) | 복합 형태소 분석 장치 및 방법 | |
| JPH10326275A (ja) | 形態素解析方法および装置、並びに日本語形態素解析方法および装置 | |
| US6968308B1 (en) | Method for segmenting non-segmented text using syntactic parse | |
| Tsarfaty | Integrated morphological and syntactic disambiguation for modern hebrew | |
| CN109062891B (zh) | 媒体处理方法、装置、终端和介质 | |
| JP2633824B2 (ja) | 仮名漢字変換装置 | |
| TH116194A (th) | ระบบและกรรมวิธีตัดเเบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน | |
| TH65852B (th) | ระบบและกรรมวิธีตัดเเบ่งประโยคสำหรับภาษาที่มีรอยต่อประโยคไม่ชัดเจน | |
| KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
| KR102278288B1 (ko) | 음소 기반 텍스트 검색 장치 및 방법 | |
| JP3767180B2 (ja) | 文書構造解析方法及び装置及び文書構造解析プログラムを格納した記憶媒体 | |
| JP3470930B2 (ja) | 自然語解析方法及び装置 | |
| JPH01205265A (ja) | 文書整形装置 | |
| KR860000681B1 (ko) | 한글/한자 워드프로 세서 | |
| JPH0546612A (ja) | 文章誤り検出装置 | |
| JP2693467B2 (ja) | かな漢字変換処理における同音語候補の優先度制御方式 |