Thursday, July 19, 2007

Data classification

การแบ่งประเภทข้อมูล (Data Classification)
เป็นการหากฏเพื่อระบุประเภทของวัตถุจากคุณสมบัติของวัตถุ เช่น หาความสัมพันธ์ระหว่างผลการตรวจต่างๆ กับการเกิดโรค โดยใช้ข้อมูลผู้ป่วยและการวินิจฉัยของแพทย์ที่เก็บไว้เพื่อนำมาช่วยวินิจฉัยโรคของผู้ป่วยหรือการวิจัยทางการแพทย์

ลักษณะข้อมูลที่ต้องการของตัวแบบจัดจำแนกประเภท

  • การจัดจำแนกประเภท(Classification) เป็นการสร้างตัวแบบเพื่อใช้จำแนกระเบียนที่พบในอนาคตว่าจัดอยู่ในประเภทใด
  • ข้อมูลที่ใช้ต้องมีลักษณะประจำเป้าหมาย(Class)ที่มีค่าไม่ต่อเนื่อง โดยปรกติมักเป็นลักษะประจำทวิภาค
  • สำหรับขั้นตอนวิธีจัดจำแนกประเภทบางขั้นตอนวิธี(ID3)ต้องการลักษณะประจำนำเข้าที่มีค่าไม่ต่อเนื่องเท่านั้น และบางขั้นตอนวิธี(Logistic regression) ก็ต้องการลักษณะประจำที่มีค่าต่อเนื่องเท่านั้น
  • ปัจจุบันขั้นตอนวิธีจัดจำแนกประเภทยอมให้ใช้ลักษณะประจำนำเข้ามีค่าต่อเนื่องหรือไม่ต่อเนื่องก็ได้

No comments: