Karateristik Arsitektur Data Warehouse:
- Data diambil dari sistem asal (sistem informasi yang ada), database dan file.
- Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle,Ms SQL Server, Sybase dan masih banyak yang lainnya.
- Data warehouse merupakan sebuah database terpisah bersifat hanya dapat dibaca yang dibuat khusus untuk mendukung pengambilan keputusan
- Pemakai mengakses data warehouse melalui aplikasi front end tool
Istilah-Istilah Dalam Arsitektur Data
Warehouse
- Sumber Data (Data Source) adalah adalah database layer untuk tujuan operasional
- Data operasional dalam organisasi,misalnya basis data pelanggan dan produk
- Sumber eksternal yang diperoleh misalnya melalui Internet,basis data komersial,basis data pemasok atau pelanggan
- Staging area menyederhanakan proses pembuatan summary dan management data warehouse secara umum
- Metadata adalah istilah dari proses pengidentifikasian suatu atribut dan struktur dari sebuah data atau informasi. Metadata menjelaskan sebuah data itu sendiri
- Data mart merupakan subset dari data resource, biasanya berorientasi untuk suatu tujuan yang spesifik atau subjek data yang didistribusikan untuk mendukung kebutuhan bisnis.
Gambar Arsitektur Data Warehouse
Star Schema VS Snowflake Schema
Star Schema
Disebut star schema karena Entity
Relationship Diagram atau ERD-nya yang menyerupai bintang, tabel fakta berada
di tengah dengan dikelilingi tabel dimensi di sampingnya.
Dalam data warehouse,
data-datanya akan disimpan dalam tabel fakta dan tabel dimensi. Tabel fakta
akan menyimpan data-data utama sementara tabel dimensi mendeskripsikan setiap
nilai dari suatu dimensi dan dapat direlasikan ke tabel fakta jika diperlukan.
Data fakta merupakan data yang terukur besarannya, semisal jumlah siswa,
banyaknya rupiah yang diperoleh, rata-rata IPK, dan sejenisnya. Untuk lebih menjelaskan data fakta, maka
kondisi saat data tersebut diukur turut disampaikan. Data kondisi inilah yang
dipetakan dalam bentuk data dimensi. Kondisi yang dipetakan dalam dimensi
umumnya berupa kondisi waktu, kondisi produk atau item, dan kondisi
geografinya. Mendesain struktur star schema, dimulai dengan menentukan data apa
yang ingin dilihat oleh pengguna (besarannya) dan bagaimana pengguna
melihat data tersebut (kondisi atau
dimensinya).
Tabel dimensi memiliki
primary key sederhana yang mengandung hanya satu atau dua kolom saja. Namun,
tabel fakta akan memiliki sekumpulan foreign key yang disusun dari primary key
komposit dan merupakan gabungan kolom-kolom tabel dimensi yang berelasi.
Snowflake Schema
Sedangkan snowflake schema lebih kompleks
dibandingkan dengan star schema karena merupakan pengembangan dari star schema,
karena tabel-tabel dimensinya merupakan hasil normalisasi dari beberapa tabel
yang berhubungan.
Tabel Perbedaan Star Schema dan Snowflake
Schema
Referensi :
- Paiman, A.S., William, R., Willyam, F., 2010. Analisis Perbandingan Antara Model Dimensi Star Schema Dan Snowflake. Universitas Bina Nusantara, Jakarta.
- http://kegiatanwindy.blogspot.com/2012/02/olap-online-analytical-processing.html
- http://nanang.lecture.ub.ac.id/2010/04/17/skema-star-dan-snowflake/
Tidak ada komentar:
Posting Komentar