Feature Engineering (การออกแบบคุณลักษณะ)
ในขั้นตอนการพัฒนาระบบ AI เราจะใช้เทคนิคที่เรียกว่า feature engineering ซึ่งก็คือการปรับเปลี่ยนข้อมูลให้อยู่ในรูปแบบที่มีประโยชน์ (features)
วัตถุประสงค์ของการทำ Feature Engineering ที่ดี
ปรับปรุงประสิทธิภาพของโมเดล (Improve model performance)
จุดประสงค์หลักคือการปรับปรุงประสิทธิภาพของโมเดลหรือระบบ AI โดยนักวิทยาศาสตร์ข้อมูลจะพยายามดึงข้อมูลมาจัดโครงสร้างในลักษณะที่ทำให้โมเดลสามารถเรียนรู้ความสัมพันธ์ระหว่าง feature และเป้าหมายได้ดีที่สุด เป้าหมายก็คือการจัดเตรียมชุดข้อมูลย่อยที่มีพลังในการทำนายให้กับโมเดล AI
ลดต้นทุนและเพิ่มประสิทธิผล (Reduce costs, improve effectiveness)
อีกวัตถุประสงค์หนึ่งคือการลดต้นทุนในการคำนวณและการจัดเก็บของโมเดล รวมไปถึงการลดความหน่วงในการฝึกโมเดลและการคาดการณ์ผลลัพธ์ ซึ่งต้นทุนที่ลดลงนี้มาจากการที่ความต้องการในการคำนวณลดลงนั่นเอง
การเพิ่มประสิทธิผลเชิงคำนวณสามารถทำได้ด้วย:
การลดจำนวน feature และปริมาณข้อมูลที่ต้องใช้ในการฝึกโมเดล
การลดจำนวน feature และข้อมูลใน API call
มั่นใจว่าข้อมูลมีประโยชน์และมีพลังในการคาดการณ์สำหรับโมเดล ซึ่งเป็นการเพิ่มความเป็นประโยชน์ต่อผู้ใช้และคุณค่าต่อธุรกิจ
การมีคำจำกัดความ (definitions) ของ feature ที่ชัดเจน มีการจัดการเวอร์ชัน และผ่านการทดสอบแล้ว จะช่วยในเรื่องการใช้งานได้ทั้งในกระบวนการฝึกและกระบวนการใช้งานจริง
การทำ snapshot ตรรกะและคำจำกัดความของโมเดล มีประโยชน์สำหรับผู้ใช้และนักพัฒนาในอนาคต
ช่วยให้โมเดลสามารถอธิบายได้ (Boost model explainability) การที่โมเดลสามารถอธิบายได้ (Model explainability/interpretability) คือระดับที่ใครสักคนสามารถคาดการณ์ผลลัพธ์ของโมเดลได้อย่างสม่ำเสมอ ซึ่งจุดนี้มีคุณค่าสูงและเป็นสิ่งจำเป็นสำหรับ use case ของระบบ AI จำนวนมาก
การอธิบายโมเดลได้เป็นสิ่งสำคัญที่จะช่วยยืนยันความเป็นธรรม ความเป็นส่วนตัว ความน่าเชื่อถือ ความทนทาน ความสัมพันธ์เชิงเหตุและผล และความไว้วางใจ กล่าวอีกนัยหนึ่ง มันส่งผลกระทบต่อสถานการณ์ที่โมเดลสามารถสร้างผลกระทบที่สำคัญต่อผู้ใช้และสังคมโดยรวม ไม่ว่าจะโดยทางตรงหรือทางอ้อม
สรุป
โมเดลของระบบ AI จะถูกสร้างขึ้นในช่วงขั้นตอนการพัฒนา ซึ่งขั้นตอนนี้เกี่ยวข้องกับ feature engineering การฝึกโมเดล (model training) ไปจนถึงการทดสอบและตรวจสอบความถูกต้องของโมเดล (model testing and validation)
Comments