Zhao Zhibing, Wu Di
Juicycode Team
ด้วยการพัฒนาอย่างรวดเร็วของเทคโนโลยีดิจิทัลและระบบอัจฉริยะ ระบบจดจำอัจฉริยะที่ใช้ Computer Vision ได้รับการประยุกต์ใช้อย่างกว้างขวางในหลายสาขา หนึ่งในสาขาที่มีความสำคัญอย่างยิ่งคือ การจัดการและการอนุรักษ์ของสะสม (Collections Management & Preservation)
ArtIQ™ — ระบบบริหารจัดการและจดจำภาพอัจฉริยะสำหรับของสะสมที่พัฒนาบนพื้นฐานของ OpenCV — มีจุดมุ่งหมายเพื่อใช้เทคโนโลยีการมองเห็นด้วยคอมพิวเตอร์ (Computer Vision) ในการจดจำและจัดการ ธนบัตรและเหรียญ纪念 (纪念钞 / Commemorative Banknotes) ได้อย่างรวดเร็วและแม่นยำ
ArtIQ™ ช่วยให้การบริหารจัดการและจดจำเป็นแบบอัตโนมัติ แทนที่วิธีการตรวจสอบธนบัตรด้วยมือแบบเดิมซึ่งใช้เวลานานและมีความผิดพลาดสูง ระบบนี้ใช้ OpenCV เพื่อดำเนินการจดจำภาพอัตโนมัติ สามารถระบุ หมายเลขซีเรียล (Serial Number) และ ประเภทของธนบัตร ได้อย่างรวดเร็วและแม่นยำ ข้อมูลที่ได้จากการจดจำจะถูกจัดเก็บไว้ในระบบฐานข้อมูลเพื่อใช้ในการวิเคราะห์เชิงสถิติ เช่น การจำแนกธนบัตรตามชนิดและหมายเลข เพื่อช่วยให้สถาบันต่าง ๆ สามารถบริหารจัดการและปกป้องของสะสมที่มีค่าได้ดียิ่งขึ้น ทั้งยังช่วยยกระดับประสิทธิภาพของระบบบริหารจัดการของสะสมโดยรวม
ระบบ ArtIQ™ พัฒนาโดยใช้ Python และใช้ฟังก์ชันจากไลบรารี OpenCV ในการประมวลผลภาพ ส่วนอินเทอร์เฟซผู้ใช้ (GUI) พัฒนาโดยใช้ PyQt5
ระบบสามารถจดจำธนบัตรและเหรียญ纪念ได้อย่างรวดเร็ว โดยจะตรวจจับตำแหน่งธนบัตร คำนวณขนาด สี และอัตราส่วนของภาพ จากนั้นตัดพื้นที่ที่ต้องการออกมาเพื่อทำการจดจำแบบเทมเพลต (Template Matching)
ในระบบมีสามโมดูลหลัก ได้แก่
Color – การจดจำด้วยสี
Template – การจดจำด้วยเทมเพลต
Aspect Ratio – การจดจำตามอัตราส่วนกว้างยาว
ระบบจะใช้การรวมผลแบบถ่วงน้ำหนัก (Weighted Fusion) จากทั้งสามโมดูลเพื่อให้ได้ผลการจดจำที่แม่นยำที่สุด
สำหรับเหรียญ纪念 ระบบใช้ ORB (Oriented FAST and Rotated BRIEF) ในการดึงคุณลักษณะภาพ และใช้ SVM (Support Vector Machine) เพื่อจำแนกประเภทของเหรียญ ส่วนหมายเลขซีเรียลจะถูกตรวจจับด้วยโมเดล EAST และจดจำข้อความด้วย Tesseract OCR ข้อมูลภาพที่จดจำได้จะถูกจัดเก็บและสามารถเรียกดูภายหลังได้อย่างสมบูรณ์
ใน GUI ของระบบ มีฟังก์ชันการปรับแบบไดนามิกหลายรูปแบบ เช่น
การปรับค่าน้ำหนักของโมดูลต่าง ๆ แบบเรียลไทม์
การเปิด/ปิดการคำนวณแบบถ่วงน้ำหนัก
การควบคุมข้อมูลผลลัพธ์ที่แสดง
การปรับค่าพารามิเตอร์ของการจำแนกด้านหน้า/ด้านหลังและการแปลงภาพเป็นค่าสีขาวดำ (Binarization)
การปรับความไวของการจับคู่เทมเพลต
การเปิด/ปิดกฎการจับคู่
นอกจากนี้ GUI ยังสามารถแสดงผลใน 3 มุมมองหลัก:
“ภาพสุดท้ายหลังการจดจำ (Final View)”
“ภาพดิบก่อนการแก้ไข (Original View)”
“ภาพประมวลผลแบบเรียลไทม์ (Binarized View)”
ผู้ใช้สามารถเลือกเปิดมุมมองใดมุมมองหนึ่ง หรือเปิดพร้อมกันทั้งหมดได้ รวมถึงมี หน้าต่างเอาต์พุตแบบเรียลไทม์ ที่แสดงผลการจดจำและข้อความแจ้งเตือนของระบบทันที
ระบบยังมี ฟังก์ชันแจ้งเตือนอัจฉริยะ (Real-time Warning System) เพื่อตรวจจับพฤติกรรมการปรับค่าพารามิเตอร์ที่อาจก่อให้เกิดข้อผิดพลาด เช่น หากผู้ใช้ปรับค่าน้ำหนักของโมดูลหนึ่งให้สูงเกินกว่าผลรวมของอีกสองโมดูล ระบบจะขึ้นหน้าต่างเตือน โดยสามารถกด “√” เพื่อคืนค่าพารามิเตอร์กลับไปยังค่าที่แนะนำ หรือกด “X” เพื่อปิดการแจ้งเตือนและละเว้นคำเตือนนั้นจนกว่าจะเริ่มการจดจำใหม่อีกครั้ง
เพื่อควบคุมความเสถียรของแสงและพื้นหลังขณะจดจำภาพ Juicycode ได้ออกแบบ “กล่องควบคุมแสง Juicycode (Juicycode Environment-Control Lightbox)” โดยเฉพาะ ซึ่งมีโหมดแสง สามแบบ ได้แก่
แสงเหลือง (Warm Light)
แสงขาวบริสุทธิ์ (Pure White Light)
แสงผสมเหลืองขาว (Mixed Light)
พร้อมทั้งสามารถปรับระดับความสว่างได้ 12 ระดับ, มีผ้าดูดซับแสง (Absorbing Cloth) และช่องสำหรับติดตั้งกล้อง ช่วยสร้างสภาพแวดล้อมที่เสถียรที่สุดในการจดจำภาพ และเพิ่มความแม่นยำของผลลัพธ์อย่างมีนัยสำคัญ