Selasa, 14 Oktober 2014

Arsitektur Data Warehouse | Star Schema dan Snowflake Schema

Karateristik Arsitektur Data Warehouse:
  • Data diambil dari sistem asal (sistem informasi yang ada), database dan file.
  • Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle,Ms SQL Server, Sybase dan masih banyak yang lainnya.
  • Data warehouse merupakan sebuah database terpisah bersifat hanya dapat dibaca yang dibuat khusus untuk mendukung pengambilan keputusan
  •  Pemakai mengakses data warehouse melalui aplikasi front end tool

Istilah-Istilah Dalam Arsitektur Data Warehouse
  •  Sumber Data (Data Source) adalah adalah database layer untuk tujuan operasional
    •  Data operasional dalam organisasi,misalnya basis data pelanggan dan produk
    •  Sumber eksternal yang diperoleh misalnya melalui Internet,basis data komersial,basis data pemasok atau pelanggan
  •  Staging area menyederhanakan proses pembuatan summary dan management data warehouse secara umum
  •  Metadata adalah istilah dari proses pengidentifikasian suatu atribut dan struktur dari sebuah data atau informasi. Metadata menjelaskan sebuah data itu sendiri
  •  Data mart merupakan subset dari data resource, biasanya berorientasi untuk suatu tujuan yang spesifik atau subjek data yang didistribusikan untuk mendukung kebutuhan bisnis.

Gambar Arsitektur Data Warehouse


Star Schema VS Snowflake Schema

Star Schema

Disebut star schema karena Entity Relationship Diagram atau ERD-nya yang menyerupai bintang, tabel fakta berada di tengah dengan dikelilingi tabel dimensi di sampingnya.

Dalam data warehouse, data-datanya akan disimpan dalam tabel fakta dan tabel dimensi. Tabel fakta akan menyimpan data-data utama sementara tabel dimensi mendeskripsikan setiap nilai dari suatu dimensi dan dapat direlasikan ke tabel fakta jika diperlukan. Data fakta merupakan data yang terukur besarannya, semisal jumlah siswa, banyaknya rupiah yang diperoleh, rata-rata IPK, dan sejenisnya.  Untuk lebih menjelaskan data fakta, maka kondisi saat data tersebut diukur turut disampaikan. Data kondisi inilah yang dipetakan dalam bentuk data dimensi. Kondisi yang dipetakan dalam dimensi umumnya berupa kondisi waktu, kondisi produk atau item, dan kondisi geografinya. Mendesain struktur star schema, dimulai dengan menentukan data apa yang ingin dilihat oleh pengguna (besarannya) dan bagaimana pengguna melihat  data tersebut (kondisi atau dimensinya).

Tabel dimensi memiliki primary key sederhana yang mengandung hanya satu atau dua kolom saja. Namun, tabel fakta akan memiliki sekumpulan foreign key yang disusun dari primary key komposit dan merupakan gabungan kolom-kolom tabel dimensi yang berelasi.


Snowflake Schema

Sedangkan snowflake schema lebih kompleks dibandingkan dengan star schema karena merupakan pengembangan dari star schema, karena tabel-tabel dimensinya merupakan hasil normalisasi dari beberapa tabel yang berhubungan.

Tabel Perbedaan Star Schema dan Snowflake Schema








Referensi :

  • Paiman, A.S., William, R., Willyam, F., 2010. Analisis Perbandingan Antara Model Dimensi Star Schema Dan Snowflake. Universitas Bina Nusantara, Jakarta.
  • http://kegiatanwindy.blogspot.com/2012/02/olap-online-analytical-processing.html
  • http://nanang.lecture.ub.ac.id/2010/04/17/skema-star-dan-snowflake/


Tidak ada komentar:

Posting Komentar