TH111009A - วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ - Google Patents
วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความInfo
- Publication number
- TH111009A TH111009A TH602001118F TH0602001118F TH111009A TH 111009 A TH111009 A TH 111009A TH 602001118 F TH602001118 F TH 602001118F TH 0602001118 F TH0602001118 F TH 0602001118F TH 111009 A TH111009 A TH 111009A
- Authority
- TH
- Thailand
- Prior art keywords
- character recognition
- documents
- fonts
- feature extraction
- adaptive
- Prior art date
Links
Abstract
DC60 วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยทำให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย
Claims (1)
1. วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความประกอบด้วย ขั้นตอน (สูตร) การรับข้อมูลภาพเอกสาร (สูตร) การแปลงภาพเอกสารเป็นภาพขาวดำสำหรับแยกตัวอักษรออกจากพื้นหลัง (สูตร) การดึงลักษณะสำคัญของโครงสร้างพื้นฐานของตัวอักษร (สูตร) การรู้จำตัวอักษรโดยการนำลักษณะสำคัญของตัวอักษรมาเปรียบเทียบกับ แม่แบบของ ลักษณะสำคัญ(Feature Template) ที่สร้างจากฐานข้อมูลตัวอักษรเพื่อหาตัวอักษรที่ใกล้เคียง (สูตร)แท็ก :
Publications (3)
| Publication Number | Publication Date |
|---|---|
| TH93536S TH93536S (th) | 2009-02-20 |
| TH111009A true TH111009A (th) | 2011-11-21 |
| TH93536B TH93536B (th) | 2023-05-10 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2016146187A5 (th) | ||
| CN101840648B (zh) | 自动盲文阅卷方法 | |
| EP2746989A3 (en) | Document processing device, image processing apparatus, document processing method and computer program product | |
| Ani et al. | Smart Specs: Voice assisted text reading system for visually impaired persons using TTS method | |
| CN110111243B (zh) | 一种利用ai技术美化手写字体的方法及装置 | |
| JP2010182206A5 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
| CN116018622A (zh) | 一种电机铭牌的识别方法、装置和计算机可读存储介质 | |
| GB2614169A8 (en) | Wine label recognition method, wine information management method and apparatus, device, and storage medium | |
| Clausner et al. | Efficient ocr training data generation with aletheia | |
| CN111092832B (zh) | 莫尔斯电码深度学习训练数据制作方法 | |
| CN113901933B (zh) | 基于人工智能的电子发票信息抽取方法、装置及设备 | |
| CN104820962B (zh) | 一种代替人工签名栏的打印水印生成方法 | |
| CN104123527A (zh) | 基于掩膜的图像表格文档识别方法 | |
| TW200425063A (en) | Recognition method to integrate speech input and handwritten input, and system thereof | |
| JP2006053920A (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
| CN116958996A (zh) | Ocr信息提取方法、系统及设备 | |
| CN116704540A (zh) | 将纸质文件内容进行标识并高保真的转换为ofd文件的技术 | |
| CN112927566B (zh) | 一种用于学生复述故事内容的系统及方法 | |
| TH111009A (th) | วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ | |
| TH93536B (th) | วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ | |
| CN116909561A (zh) | 基于深度学习生成前端页面代码的方法及系统 | |
| CN117746183A (zh) | 图片标注方法、装置、设备以及存储介质 | |
| CN104834740A (zh) | 一种全自动音视频结构化与精准搜索的方法 | |
| CN114863446A (zh) | 手写答案识别对比方法、装置、设备及存储介质 | |
| CN108170735A (zh) | 一种适用于卷积神经网络的方言数据库建立方法 |