TH111009A - วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ - Google Patents

วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ

Info

Publication number
TH111009A
TH111009A TH602001118F TH0602001118F TH111009A TH 111009 A TH111009 A TH 111009A TH 602001118 F TH602001118 F TH 602001118F TH 0602001118 F TH0602001118 F TH 0602001118F TH 111009 A TH111009 A TH 111009A
Authority
TH
Thailand
Prior art keywords
character recognition
documents
fonts
feature extraction
adaptive
Prior art date
Application number
TH602001118F
Other languages
English (en)
Other versions
TH93536B (th
TH93536S (th
Inventor
วัชรบุศราคำ นางสาวศรินทร์
ดูเบ นายเปรมนาถ
สินธุภิญโญ นายวศิน
มฤคทัต นายสรรพฤทธิ์
Original Assignee
นางสาวอรกนก พรรณรักษา
นางสาวอรุณศรี ศรีธนะอิทธิพล
นายชาญชัย นีรพัฒนกุล
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
Filing date
Publication date
Publication of TH93536S publication Critical patent/TH93536S/th
Application filed by นางสาวอรกนก พรรณรักษา, นางสาวอรุณศรี ศรีธนะอิทธิพล, นายชาญชัย นีรพัฒนกุล, สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ filed Critical นางสาวอรกนก พรรณรักษา
Publication of TH111009A publication Critical patent/TH111009A/th
Publication of TH93536B publication Critical patent/TH93536B/th

Links

Abstract

DC60 วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยทำให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย

Claims (1)

1. วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความประกอบด้วย ขั้นตอน (สูตร) การรับข้อมูลภาพเอกสาร (สูตร) การแปลงภาพเอกสารเป็นภาพขาวดำสำหรับแยกตัวอักษรออกจากพื้นหลัง (สูตร) การดึงลักษณะสำคัญของโครงสร้างพื้นฐานของตัวอักษร (สูตร) การรู้จำตัวอักษรโดยการนำลักษณะสำคัญของตัวอักษรมาเปรียบเทียบกับ แม่แบบของ ลักษณะสำคัญ(Feature Template) ที่สร้างจากฐานข้อมูลตัวอักษรเพื่อหาตัวอักษรที่ใกล้เคียง (สูตร)แท็ก :
TH602001118F 2010-07-01 วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ TH93536B (th)

Publications (3)

Publication Number Publication Date
TH93536S TH93536S (th) 2009-02-20
TH111009A true TH111009A (th) 2011-11-21
TH93536B TH93536B (th) 2023-05-10

Family

ID=

Similar Documents

Publication Publication Date Title
JP2016146187A5 (th)
CN101840648B (zh) 自动盲文阅卷方法
EP2746989A3 (en) Document processing device, image processing apparatus, document processing method and computer program product
Ani et al. Smart Specs: Voice assisted text reading system for visually impaired persons using TTS method
CN110111243B (zh) 一种利用ai技术美化手写字体的方法及装置
JP2010182206A5 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
CN116018622A (zh) 一种电机铭牌的识别方法、装置和计算机可读存储介质
GB2614169A8 (en) Wine label recognition method, wine information management method and apparatus, device, and storage medium
Clausner et al. Efficient ocr training data generation with aletheia
CN111092832B (zh) 莫尔斯电码深度学习训练数据制作方法
CN113901933B (zh) 基于人工智能的电子发票信息抽取方法、装置及设备
CN104820962B (zh) 一种代替人工签名栏的打印水印生成方法
CN104123527A (zh) 基于掩膜的图像表格文档识别方法
TW200425063A (en) Recognition method to integrate speech input and handwritten input, and system thereof
JP2006053920A (ja) 文字認識プログラム、文字認識方法および文字認識装置
CN116958996A (zh) Ocr信息提取方法、系统及设备
CN116704540A (zh) 将纸质文件内容进行标识并高保真的转换为ofd文件的技术
CN112927566B (zh) 一种用于学生复述故事内容的系统及方法
TH111009A (th) วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ
TH93536B (th) วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ
CN116909561A (zh) 基于深度学习生成前端页面代码的方法及系统
CN117746183A (zh) 图片标注方法、装置、设备以及存储介质
CN104834740A (zh) 一种全自动音视频结构化与精准搜索的方法
CN114863446A (zh) 手写答案识别对比方法、装置、设备及存储介质
CN108170735A (zh) 一种适用于卷积神经网络的方言数据库建立方法