Tuesday, June 26, 2007

Data Warehouse

คลังข้อมูล (data warehouse) คือฐานข้อมูลขนาดยักษ์ ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา ซึ่งอาจมี schema แตกต่างกัน มาไว้รวม ณ ที่เดียวกัน (และใช้ schema เดียวกัน)

ข้อแตกต่างระหว่าง Database และ Data Warehouse

โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน

โดยสรุปคือ
คลังข้อมูล ใช้เพื่อการวิเคราะห์ (ข้อมูลทั้งอดีตและปัจจุบัน)
ฐานข้อมูล ใช้เพื่อทำการประมวลผล (เฉพาะข้อมูลปัจจุบันDatabase เป็นฐานข้อมูลที่จัดเก็บรวบรวมข้อมูลที่ได้จากงานประจำวันเข้าด้วยกัน ตั้งแต่หน่วยที่ย่อยที่สุดในรูปแบบของ feild , record ไปจนถึงแฟ้มข้อมูล(file) ที่ถูกจัดเก็บในลักษณะของตาราง ทั้งนี้ database ที่ดีจะมีระบบการจัดการฐานข้อมูลที่เรียกว่า Database Management Systems (DBMS) เป็นตัวจัดการในการเรียกใช้ข้อมูลที่ถูกจัดเก็บในฐานข้อมูลData Warehouse เป็นลักษณะของการแยกฐานข้อมูลที่ต้องการใช้งานในลักษณะ ระบบช่วยเหลือการตัดสินใจออกจากฐานข้อมูลที่ใช้งานประจำวัน ทั้งนี้ data warehouse อาจได้จากฐานข้อมูลประจำวันหรือแหล่งข้อมูลภายนอกแต่ถูกกำหนดให้เป็นฐานข้อมูลใหม่ในลักษณะของฐานข้อมูลสารสนเทศเพื่อนำข้อมูลมาใช้วิเคราะห์เพื่อประกอบการตัดสินใจทางธุรกิจ ทั้งนี้รูปแบบการจัดเก็บข้อมูลในลักษณะของ data warehouse จะจัดเก็บในลักษณะตารางหรือตารางหลายมิติ


สำหรับซอฟต์แวร์ระบบวิเคราะห์ข้อมูล ที่ใช้งานในปัจจุบัน เรียกว่า ซอฟต์แวร์ระบบวิเคราะห์ข้อมูลแบบ On Line Analytical Processing (OLAP) ซึ่งปัจจัยที่ต้องคำนึงถึงในการเลือก OLAP ได้แก่
ความสามารถในการวิเคราะห์ข้อมูลแบบหลายมิติ (Multidimensional Analysis)
สถาปัตยกรรมแบบ Client/Server
ความสามารถในการจัดเก็บข้อมูล และความเร็วในการเข้าถึงข้อมูลขนาดใหญ่ (Performance Data Access)
เครื่องมือในการพัฒนาระบบ (Application Development Tools)
การดึงข้อมูล (transformation) จากแหล่งต่างๆ เช่น ระบบคลังข้อมูล, Flat File, Spreadsheet
ความสามารถในการจัดลำดับชั้นของข้อมูล (Hierarchy)
เครื่องมือในการวิเคราะห์ข้อมูล เช่น Forecasting, Statistic, Data Mining

3 comments:

Anonymous said...

ขอบคุณทุกความรู้ที่มอบ

Anonymous said...

กำลังเริ่มศึกษาdatawherehouse ถือว่าเขียนได้ดีครับ ได้ประโยชน์พอสมควร

Anonymous said...

Well said.