validation
2 บทความ
AI Workflow22 มีนาคม 2569
Karpathy พิสูจน์แล้ว — AI Agent ที่ไม่มี Validation Harness จะพังทุกครั้ง
คณิตศาสตร์ March of Nines ของ Karpathy บอกชัดเจน: ความแม่นยำ 90% ฟังดูดี แต่ workflow 10 steps = สำเร็จแค่ 35% เราแก้ปัญหานี้อย่างไรด้วย Validation Harness 32 checks
9 นาที
AI Workflow22 มีนาคม 2569
Vision Eval — AI ตรวจ AI (ใช้ Gemini Vision ตรวจสอบคุณภาพรูป AI)
gen รูป AI วันละ 20-30 ไม่เคยตรวจ → cover safe zone ผิด ภาพมืด text ถูกบัง สร้าง vision-eval.py ใช้ Gemini Vision วิเคราะห์ 8 เกณฑ์ ให้คะแนน /80 พร้อม 3 presets + compare mode
9 นาที
