Skip to content Skip to footer

แปลงข้อความเอกสารสู่ข้อความดิจิทัล ด้วยเทคโนโลยี OCR by WordSense 

OCR อ่านเอกสาร

รู้สึกเบื่อกับการต้องพิมพ์เอกสารซ้ำๆ หรือต้องคัดลอกข้อมูลจากภาพหรือเอกสารจำนวนมากอยู่หรือเปล่า ปัญหาเหล่านี้สามารถแก้ไขได้ด้วยเทคโนโลยีปัญญาประดิษฐ์ (AI) ที่มาในรูปแบบ ‘OCR’ หรือ ‘Optical Character Recognition’ ซึ่งเป็นเทคโนโลยีที่สามารถแปลงตัวอักษรบนเอกสาร ภาพถ่ายรวมถึงไฟล์สแกน ให้กลายเป็นข้อความที่สามารถแก้ไขและจัดเก็บในคอมพิวเตอร์ได้อย่างเป็นระบบ ทำงานได้ง่ายและสะดวกขึ้นทุกขั้นตอน ไม่ว่าจะเป็นการค้นหาข้อมูล การแปลภาษา หรือการจัดเก็บข้อมูลในรูปแบบดิจิทัล เทคโนโลยีนี้ช่วยให้การทำงานกับเอกสารที่เป็นภาพง่ายขึ้นและมีประสิทธิภาพมากขึ้น

บริษัท เวิร์ดเซนส์ จำกัด (WordSense) หนึ่งในผู้เชี่ยวชาญด้านการพัฒนาเทคโนโลยี OCR ในประเทศไทย ภายใต้การดูแลของบริษัท ลูลู่ เทคโนโลยี จำกัด ได้มุ่งมั่นพัฒนาโซลูชัน OCR อย่างต่อเนื่อง เพื่อให้ผู้ใช้งานสามารถนำข้อมูลดิจิทัลไปใช้ในหลากหลายบริบท เช่น สถาบันการเงินและธนาคารใช้ OCR ในการอ่านใบสมัครบัตรเครดิตที่ลูกค้ากรอกด้วยมือ ทั้งยังใช้ OCR มาช่วยประมวลผล ตรวจสอบ และวิเคราะห์เอกสารทางการเงิน รวมถึง OCR แปลงใบแจ้งหนี้และใบเสร็จเป็นดิจิทัล เพิ่มความแม่นยำในการบันทึกบัญชี, การขนส่ง : OCR ช่วยอ่านบาร์โค้ดและ QR code ได้อย่างแม่นยำ ฯลฯ เรียกว่าเป็นเทคโนโลยีที่ตอบโจทย์ความต้องการของลูกค้าในทุกอุตสาหกรรม

หากอยากรู้ว่าเทคโนโลยี OCR ทำงานอย่างไร วันนี้เราจะพาทุกคนไปเจาะลึกเบื้องหลังการทำงานของเทคโนโลยีสุดล้ำนี้ ไปพร้อมกับ สหพัฒณ์ ล้ำสมบัติ CEO ของบริษัท เวิร์ดเซนส์ จำกัด ไม่ว่าจะเป็นหลักการทำงาน ขั้นตอนการพัฒนา ไปจนถึงประโยชน์ที่เทคโนโลยี OCR นำมาให้ ซึ่งจะช่วยให้ทุกคนเข้าใจได้อย่างลึกซึ้งว่าทำไม OCR จึงกลายเป็นเครื่องมือสำคัญในการทำงานในยุคดิจิทัล

‘OCR’ ตัวช่วยแปลงเอกสารกระดาษ สู่ข้อมูลดิจิทัล

สหพัฒณ์ เริ่มบทสนทนาด้วยการอธิบายถึงหลักการทำงานของ OCR โดยบอกว่า เทคโนโลยี Optical Character Recognition (OCR) เป็นกระบวนการทำงานที่ใช้เทคโนโลยีในการแปลงข้อความ หรือสแกนเอกสารที่เป็นตัวอักษร แล้วแปลงภาพของตัวอักษรเหล่านั้นให้กลายเป็นข้อความดิจิทัลที่สามารถแก้ไข ค้นหา และจัดเก็บได้เหมือนข้อความที่พิมพ์จากคีย์บอร์ด เรียกได้ว่าเทคโนโลยี OCR เข้ามาช่วยเปลี่ยนเอกสารที่อยู่ในรูปแบบกระดาษ ไฟล์สแกนหรือภาพถ่าย ให้กลายเป็นข้อมูลดิจิทัลที่ใช้งานในคอมพิวเตอร์ได้โดยอัตโนมัติ ทำให้การจัดการข้อมูลเป็นเรื่องง่ายและประหยัดเวลามากขึ้น

สำหรับหลักการทำงานเบื้องต้นของ OCR เริ่มต้นจากการนำเอกสารหรือภาพที่มีข้อความไปสแกน เพื่อแปลงเป็นไฟล์ภาพดิจิทัล ต่อมาระบบ OCR จะทำการวิเคราะห์ภาพที่ได้ แยกส่วนที่เป็นข้อความออกจากส่วนอื่นๆ เช่น รูปภาพ หรือพื้นหลัง จากนั้นระบบจะเปรียบเทียบรูปร่างของตัวอักษรในภาพกับฐานข้อมูลของตัวอักษรที่เรียนรู้มา เพื่อระบุว่าตัวอักษรนั้นคืออะไร ท้ายที่สุดเมื่อระบบสามารถระบุตัวอักษรทั้งหมดได้แล้ว ก็จะนำตัวอักษรเหล่านั้นมาเรียงต่อกันเป็นข้อความที่สมบูรณ์

“ลองนึกภาพว่าเรามีเอกสารหรือหนังสือที่เขียนด้วยมือหรือพิมพ์บนกระดาษ แล้วเราต้องการเก็บเนื้อหาจากเอกสารเหล่านี้เข้าไปในคอมพิวเตอร์ แต่แทนที่จะพิมพ์ทุกคำด้วยมือ ซึ่งอาจใช้เวลานานและเสี่ยงต่อการพิมพ์ผิด เราสามารถใช้เทคโนโลยีที่เรียกว่า OCR ได้” สหพัฒณ์ ยกตัวอย่างให้เห็นภาพชัดเจนยิ่งขึ้น

ความแม่นยำเหนือชั้น อ่านลายมือได้ทุกสไตล์

สหพัฒณ์ ยังเผยถึงหนึ่งในจุดเด่นของ OCR by WordSense นั่นคือความแม่นยำ (Accuracy) ที่สูงมาก ถึงระดับที่ทำให้เทคโนโลยีนี้สามารถอ่านลายมือภาษาไทยได้อย่างมีประสิทธิภาพ อย่างไรก็ตาม ค่าความแม่นยำจะขึ้นอยู่กับความสามารถของโมเดลในการจัดการกับความเฉพาะของรูปภาพ เช่น ในกรณีที่รูปภาพมีความมืด แสงไม่เพียงพอ เบลอ กระดาษมีหมึกเปื้อนหรือรอยยับ เทคโนโลยีดังกล่าวสามารถจัดการกับปัญหาเหล่านี้ได้อย่างครบถ้วน ซึ่งคุณสมบัติที่กล่าวมามีความคล้ายคลึงกับแอปพลิเคชันสำหรับการแต่งรูป ที่สามารถแก้ไขปัญหาต่างๆ ได้ด้วยการกดปุ่มเพียงครั้งเดียว

“กระบวนการที่กล่าวมา เราจะเรียกว่า preprocessing เป็นขั้นตอนที่ OCR จะดำเนินการปรับรูปภาพทั้งหมดให้มีความคมชัดสูงสุด ซึ่งเป็นประโยชน์อย่างมากสำหรับการอ่านลายมือ โดยเฉพาะเมื่อเขียนในกระดาษที่บางครั้งอาจเขียนออกนอกเส้นหรือมีขีดฆ่าทับ เช่น ชื่อคนไทยที่มีความยาวมากๆ เมื่อกรอกในแบบฟอร์ม อาจต้องเขียนแล้วเกินออกไปนอกเส้น หรือบางทีอาจมีขีดฆ่าออกไป ซึ่ง OCR by WordSense ก็สามารถประมวลผลได้

ค่าความแม่นยำของ OCR by WordSense อยู่ที่ประมาณ 95% ซึ่งเป็นตัวเลขเริ่มต้นเท่านั้น หมายความว่ายิ่งใช้ OCR ของเราก็ยิ่งเก่ง ระบบจะเรียนรู้อยู่เรื่อย ๆ เวิร์ดเซนส์จึงมั่นใจในความสามารถของการอ่านลายมือที่มีความแม่นยำและโดดเด่นที่สุดในตลาด ซึ่งบริษัทอื่นๆ อาจเคลมว่ามีค่าความแม่นยำอยู่ที่ประมาณ 80% กล่าวคือ เขียน 5 ตัว อาจผิดไป 1 ตัว แต่นั่นไม่ได้อยู่ในระดับที่สามารถใช้งานจริง ดังนั้น ความสามารถในการอ่านลายมือของเรานี่แหละมีความแม่นยำและโดดเด่นที่สุด” CEO เวิร์ดเซนส์ กล่าวอย่างมั่นใจ

 

ก้าวข้ามขีดจำกัดของ OCR ทั่วไป ด้วย ‘OCR Handwriting’

เพื่อแก้ไขปัญหาการจัดการข้อมูลจากลายมือที่ยุ่งยาก เทคโนโลยี ‘OCR Handwriting’ จึงได้รับการพัฒนาขึ้น โดยเป็นการรู้จำอักขระด้วยแสง ที่ไม่เพียงแต่แปลงข้อความที่พิมพ์จากเครื่องพิมพ์เป็นข้อมูลดิจิทัล แต่ยังสามารถอ่านและแปลงลายมือเขียนของมนุษย์ให้กลายเป็นข้อความที่สามารถจัดเก็บ ค้นหา และใช้งานได้อย่างมีประสิทธิภาพ 

“ลายมือของแต่ละคนมีความแตกต่างกัน ทั้งในด้านรูปแบบการเขียน ขนาดตัวอักษร และการเชื่อมโยงระหว่างตัวอักษร ซึ่งทำให้การแปลงลายมือเป็นข้อความดิจิทัล เป็นงานที่ซับซ้อนกว่าการอ่านตัวพิมพ์ที่มีมาตรฐานเดียวกัน แม้ว่า AI และ Machine Learning จะมีความก้าวหน้าไปมาก แต่การทำ OCR สำหรับลายมือยังต้องการการเรียนรู้จากข้อมูลขนาดใหญ่และซับซ้อนมากกว่าปกติ เพื่อให้สามารถรองรับลายมือหลากหลายรูปแบบได้อย่างถูกต้อง

“ดังนั้น OCR Handwriting จึงต้องการความเชี่ยวชาญจากวิศวกรการเรียนรู้ของเครื่อง (Machine Learning Engineer : MLE) มากกว่า OCR ทั่วไป เนื่องจากความซับซ้อนในการประมวลผลลายมือที่มีความหลากหลายและไม่เป็นมาตรฐาน ซึ่งการพัฒนาโมเดลสำหรับ OCR Handwriting จำเป็นต้องใช้ Deep Learning และการสร้างโมเดลที่สามารถรับมือกับการเปลี่ยนแปลงของลายมือแต่ละคน รวมถึงการจัดการกับข้อมูลที่มีคุณภาพต่ำ สิ่งนี้ทำให้ MLE ต้องมีความเข้าใจลึกซึ้งเกี่ยวกับการประมวลผลด้วยภาพ (Image Processing) และการปรับแต่งโมเดล AI ให้สามารถทำงานกับข้อมูลที่ซับซ้อนได้อย่างมีประสิทธิภาพ” สหพัฒณ์ อธิบาย

อาจกล่าวได้ว่า การพัฒนาเทคโนโลยี OCR Handwriting ถือเป็นการเปิดประตูสู่โอกาสใหม่ในการอนุรักษ์ข้อมูลเก่า ลดภาระในการพิมพ์ซ้ำ และเพิ่มประสิทธิภาพในการจัดการเอกสารที่เคยเป็นเรื่องท้าทายในการทำงาน นับเป็นเครื่องมือที่พร้อมใช้งานในหลากหลายอุตสาหกรรม ตั้งแต่การศึกษา การแพทย์ ตลอดจนธุรกิจที่ต้องการประหยัดเวลาและทรัพยากรในการจัดการข้อมูลลายมือ

‘OCR by WordSense’ โซลูชันที่ตอบโจทย์ธุรกิจทุกอุตสาหกรรม

ด้วยความสามารถในการแปลงข้อมูลจากเอกสารกระดาษหรือภาพถ่าย ให้กลายเป็นข้อมูลดิจิทัลที่สามารถค้นหาและจัดการได้อย่างง่ายดาย ทำให้ OCR by WordSense กลายเป็นเครื่องมือสำคัญสำหรับธุรกิจในหลากหลายอุตสาหกรรม ไม่ว่าจะเป็นธนาคาร โรงพยาบาล บริษัทด้านกฎหมาย หรือบริษัทด้านบัญชี ที่ต้องการลดภาระในการคัดลอกเอกสาร และเพิ่มความแม่นยำในการจัดการข้อมูล

“กลุ่มธุรกิจที่ได้ใช้ประโยชน์สูงสุดจากเทคโนโลยี OCR คือ กลุ่มประกันและธนาคาร กลุ่มนี้เข้ามาหาเราเนื่องด้วยต้องการให้จัดการกับใบสมัครต่างๆ ทั้งใบสมัครประกัน หรือใบสมัครบัตรเครดิต ซึ่งมักเขียนด้วยลายมือ พวกเขาต้องการเทคโนโลยีที่สามารถอ่านและแปลงข้อมูลเหล่านี้ได้ เพื่อลดภาระของพนักงาน ตัวอย่างเช่น ธนาคาร 1 ใน 3 ของประเทศไทย เขาใช้ทีมมากถึง 60 คน ในการนั่งกรอกข้อมูลเข้าสู่ระบบ ซึ่งไม่เพียงเสียเวลาในการกรอกข้อมูล แต่ยังต้องแยกเอกสารต่างๆ เช่น ใบสมัคร สำเนาบัตรประชาชน สเตตเมนต์ และหนังสือรับรองเงินเดือน เพื่อมาตรวจสอบความถูกต้องของข้อมูล

“เมื่อเรานำระบบ OCR เข้ามาใช้ ทีมงานที่เคยต้องนั่งกรอกข้อมูลก็สามารถไปทำงานอื่นได้ แม้ว่าเทคโนโลยีนี้จะมีค่าความแม่นยำอยู่ที่ 92% แต่ยังมีอีก 58% ที่อาจเกิดความผิดพลาด ดังนั้น เราจึงพัฒนาโมเดลเพิ่มเติมที่สามารถระบุความผิดพลาดที่อาจเกิดขึ้น และส่งต่อให้มนุษย์ตรวจสอบ ซึ่งทำให้ระบบสามารถทำงานร่วมกับมนุษย์ได้อย่างมีประสิทธิภาพ” สหพัฒณ์ ยกตัวอย่างเคสที่น่าสนใจ

เทคโนโลยี OCR by WordSense เป็นเครื่องมือที่ทรงพลังสำหรับการแปลงข้อมูลจากเอกสารกระดาษและภาพถ่ายให้กลายเป็นข้อมูลดิจิทัล ซึ่งช่วยเพิ่มประสิทธิภาพในการทำงานและลดต้นทุน โดยเฉพาะอย่างยิ่งสำหรับธุรกิจที่ต้องจัดการกับเอกสารจำนวนมาก เทคโนโลยีนี้ทำให้การจัดการเอกสารเป็นเรื่องง่ายขึ้นและสะดวกสบายมากขึ้น ลดภาระในการคัดลอกข้อมูลด้วยมือ และช่วยให้การทำงานราบรื่นยิ่งกว่าเดิม

ที่มา : https://www.prachachat.net/advertorial/news-1651093

—————————————–

Looloo Technology is a leading AI consulting company, renowned for delivering cutting-edge and customized AI and Data Analytics solutions, with expertise in predictive analytics, natural language processing (NLP), intelligent document processing (IDP), and automatic speech recognition (ASR), Our application of design thinking methodology ensures a deep understanding of our clients, complemented by a strategic consulting approach to identify areas for maximal impact. Emphasizing rigorous user testing, we fine-tune our solutions to precisely meet the users needs.

Our team is a collective of exceptional individuals with global experience handpicked from top institutions. Their relentless pursuit of excellence and commitment to innovation is what sets us apart and help bring our clients substantial growth and profitability.

🌐 Website : www.loolootech.com

📱 Facebook : Looloo Technology

📸 Instagram : loolootech

Related news

OCR ภาษาไทย

เทคโนโลยี AI : OCR เครื่องมือเปลี่ยนงานเอกสาร เป็นข้อความดิจิทัล ช่วยองค์กรประหยัด 30%

การใช้งาน OCR ไม่เพียงแต่เป็นการปรับตัวเข้าสู่โลกดิจิทัล แต่ยังเป็นการเพิ่มโอกาสในการแข่งขันและการเติบโตของธุรกิจในระยะยาวอีกด้วย

AI Looloo

เจาะจักรวาล AI และเทรนด์ใหม่ที่จะเกิดขึ้นในอนาคต! | NEW GEN INVESTOR

แนวโน้มของ AI หรือเทคโนโลยี ปัญญาประดิษฐ์ ในปี 2024 จากการแข่งขันพัฒนาโมเดล LLM ขนาดใหญ่ หลังจากนี้มีโอกาสที่หน่วยงานและภาคธุรกิจต่างๆจะหันมาพัฒนาเอไอของตัวเอง มาฟังมุมมองจากสตาร์ทอัพสัญชาติไทยผู้พัฒนาเอไอให้กับองค์กรต่างๆอย่าง ลูลู่เทคโนโลยี

ASR AI Wordsense

จาก คลื่นเสียง สู่ ตัวอักษร ด้วย Speech-to-Text by WordSense ผู้ช่วยอัจฉริยะแปลงเสียงเป็นข้อความ

Speech-to-Text ของบริษัทเรา มีความโดดเด่นตรงที่เทคโนโลยีมีความแม่นยำสูงในการแปลงเสียงพูดเป็นข้อความ โดยเฉพาะภาษาไทย… ‘แม่นยำ-รวดเร็ว-ชัดเจน’ จุดเด่นของ Speech-to-Text by WordSense