คลังข้อมูล (data warehouse) คือฐานข้อมูลขนาดยักษ์ ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา ซึ่งอาจมี schema แตกต่างกัน มาไว้รวม ณ ที่เดียวกัน (และใช้ schema เดียวกัน)
ข้อแตกต่างระหว่าง Database และ Data Warehouse
โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน
โดยสรุปคือ
คลังข้อมูล ใช้เพื่อการวิเคราะห์ (ข้อมูลทั้งอดีตและปัจจุบัน)
ฐานข้อมูล ใช้เพื่อทำการประมวลผล (เฉพาะข้อมูลปัจจุบันDatabase เป็นฐานข้อมูลที่จัดเก็บรวบรวมข้อมูลที่ได้จากงานประจำวันเข้าด้วยกัน ตั้งแต่หน่วยที่ย่อยที่สุดในรูปแบบของ feild , record ไปจนถึงแฟ้มข้อมูล(file) ที่ถูกจัดเก็บในลักษณะของตาราง ทั้งนี้ database ที่ดีจะมีระบบการจัดการฐานข้อมูลที่เรียกว่า Database Management Systems (DBMS) เป็นตัวจัดการในการเรียกใช้ข้อมูลที่ถูกจัดเก็บในฐานข้อมูลData Warehouse เป็นลักษณะของการแยกฐานข้อมูลที่ต้องการใช้งานในลักษณะ ระบบช่วยเหลือการตัดสินใจออกจากฐานข้อมูลที่ใช้งานประจำวัน ทั้งนี้ data warehouse อาจได้จากฐานข้อมูลประจำวันหรือแหล่งข้อมูลภายนอกแต่ถูกกำหนดให้เป็นฐานข้อมูลใหม่ในลักษณะของฐานข้อมูลสารสนเทศเพื่อนำข้อมูลมาใช้วิเคราะห์เพื่อประกอบการตัดสินใจทางธุรกิจ ทั้งนี้รูปแบบการจัดเก็บข้อมูลในลักษณะของ data warehouse จะจัดเก็บในลักษณะตารางหรือตารางหลายมิติ
สำหรับซอฟต์แวร์ระบบวิเคราะห์ข้อมูล ที่ใช้งานในปัจจุบัน เรียกว่า ซอฟต์แวร์ระบบวิเคราะห์ข้อมูลแบบ On Line Analytical Processing (OLAP) ซึ่งปัจจัยที่ต้องคำนึงถึงในการเลือก OLAP ได้แก่
ความสามารถในการวิเคราะห์ข้อมูลแบบหลายมิติ (Multidimensional Analysis)
สถาปัตยกรรมแบบ Client/Server
ความสามารถในการจัดเก็บข้อมูล และความเร็วในการเข้าถึงข้อมูลขนาดใหญ่ (Performance Data Access)
เครื่องมือในการพัฒนาระบบ (Application Development Tools)
การดึงข้อมูล (transformation) จากแหล่งต่างๆ เช่น ระบบคลังข้อมูล, Flat File, Spreadsheet
ความสามารถในการจัดลำดับชั้นของข้อมูล (Hierarchy)
เครื่องมือในการวิเคราะห์ข้อมูล เช่น Forecasting, Statistic, Data Mining
Tuesday, June 26, 2007
Data Warehouse
เขียนโดย
KDD
ที่
12:34 AM
Subscribe to:
Post Comments (Atom)
3 comments:
ขอบคุณทุกความรู้ที่มอบ
กำลังเริ่มศึกษาdatawherehouse ถือว่าเขียนได้ดีครับ ได้ประโยชน์พอสมควร
Well said.
Post a Comment