Friday, July 20, 2007

Data clustering

การแบ่งกลุ่มข้อมูล (Data clustering)
คือการแบ่งข้อมูลที่มีลักษณะคล้ายกันออกเป็นกลุ่ม เช่นการแบ่งกลุ่มผู้ป่วยที่เป็นโรคเดียวกันตามลักษณะ อาการ เพื่อนำไปใช้ประโยชน์ในการวิเคราะห์หาสาเหตุของโรค โดยพิจรณาจากผู้ป่วยที่มีอากการคล้ายคลึงกัน

ลักษณะข้อมูลที่ต้องการของตัวแบบการเกาะกลุ่ม

  • การวิเคราะห์การเกาะกลุ่ม(Cluster analysis) ต้องใช้ระยะระหว่างระเบียนในการบ่งบอกความเหมือนหรือความแตกต่างระหว่างระเบียน
  • การวัดระยะระหว่างระเบียนใช้ผลรวมของการคำนวณระยะระหว่างลักษณะประจำแต่ละตัว
    -ในกรณีที่ลักษณะประจำเป็นจำนวน เราสามารถใช้กำลักสองของผลต่างได้
    -ในกรณีที่ลักษณะประจำเป็นค่าที่ไม่ต่อเนื่องเราสามารถใช้การนับความแตกต่างระหว่างลักษณะประจำที่ต่างกันได้
  • ลักษณะประจำนำเข้าอาจเป็นค่าต่อเนื่องหรือค่าไม่ต่อเนื่องก็ได้ ตราบที่การคำนวณระยะมีสเกลี่เหมาะสม

1 comment:

Anonymous said...

Ι ҝnow this web pagе proνides quality depending articles օr reviews ɑnd
additional data, is there any othеr website աhich offers sucҺ data in quality?


Mү homepage :: 100 Pure Garcinia Cambogia