Selasa, 21 Oktober 2014

Star Schema, SnowFlake Schema, dan StarFlake Schema


Dimensional modeling merupakan suatu desain logic yang merepresentasikan data dalam bentuk standar, dan mudah dipahami , sehingga  mendukung untuk akses terhadap data dengan cepat.
  • Tabel Fakta adalah tabel utama dalam konsep  pemodelan dimensional dimana hasil perhitungan bisnis disimpan.
  • Tabel Dimensi berisi penjelasan deskriptif dari sebuah bisnis dan memiliki banyak kolom atau atribut.

Star schema merupakan struktuk logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data.
Karateristik Star Schema
  1. Pusat dari star disebut fact table
  2. Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel dimensi
  3. Setiap tabel dimensi berelasi langsung dengan fact table
  4. Tabel dimensi beisikan data tentang informasi atau waktu
  5. Relasi antara fact table dengan dimensi-dimensinya adalah 1 – N (one to many)
  6. Primary key pada tabel dimensi akan menjadi key pada fact table atau dapat diakatakan bahwa fact table memiliki kombinasi key dari tabel dimensi tersebut

Keuntungan :
  • Lebih simple
  • Mudah dipahami.
  • Hasil dari proses query juga relatif lebih cepat.

Kerugian :
  • Boros dalam space.






Snowflake Schema Merupakan pengembangan dari star schema, ia juga mempunyai satu atau lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel  dimensi utama.


Keuntungan & Kerugian Snowflake Schema

Keuntungan :
  • Pemakain space yang lebih sedikit
  • Update dan maintenance yang lebih mudah

Kerugian :
  • Model lebih komplek dan rumit
  • Proses query lebih lambat
  • Performance yang kurang bagus





Starflake schema adalah skema yang menggabungkan star schema dan snowflake schemas
Keduanya merupakan model-model dimensional, perbedaannya terletak pada implementasi fisikal. Skema snowflake memberi kemudahan pada perawatan dimensi, dikarenakan strukturnya yang lebih normalisasi. Sedangkan skema bintang lebih efisien serta sederhana dalam membuat query dan mudah  diakses secara langsung oleh pengguna.

Keuntungan :
  • Efisien dalam hal mengakses data
  • Dapat beradaptasi terhadap kebutuhan-kebutuhan user
  • Bersifat fleksibel terhadap perubahan yang terjadi khususnya perubahan yang mengarah pada  perkembangan
  • Memiliki kemampuan dalam memodelkan situasi bisnis secara umum
  • Meskipun skema yang dihasilkan sangat kompleks, tetapi pemrosesan query dapat diperkirakan, hal ini dikarenakan pada level terendah, setiap table fakta harus di query secara independen.


Selasa, 14 Oktober 2014

Arsitektur Data Warehouse | Star Schema dan Snowflake Schema

Karateristik Arsitektur Data Warehouse:
  • Data diambil dari sistem asal (sistem informasi yang ada), database dan file.
  • Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle,Ms SQL Server, Sybase dan masih banyak yang lainnya.
  • Data warehouse merupakan sebuah database terpisah bersifat hanya dapat dibaca yang dibuat khusus untuk mendukung pengambilan keputusan
  •  Pemakai mengakses data warehouse melalui aplikasi front end tool

Istilah-Istilah Dalam Arsitektur Data Warehouse
  •  Sumber Data (Data Source) adalah adalah database layer untuk tujuan operasional
    •  Data operasional dalam organisasi,misalnya basis data pelanggan dan produk
    •  Sumber eksternal yang diperoleh misalnya melalui Internet,basis data komersial,basis data pemasok atau pelanggan
  •  Staging area menyederhanakan proses pembuatan summary dan management data warehouse secara umum
  •  Metadata adalah istilah dari proses pengidentifikasian suatu atribut dan struktur dari sebuah data atau informasi. Metadata menjelaskan sebuah data itu sendiri
  •  Data mart merupakan subset dari data resource, biasanya berorientasi untuk suatu tujuan yang spesifik atau subjek data yang didistribusikan untuk mendukung kebutuhan bisnis.

Gambar Arsitektur Data Warehouse


Star Schema VS Snowflake Schema

Star Schema

Disebut star schema karena Entity Relationship Diagram atau ERD-nya yang menyerupai bintang, tabel fakta berada di tengah dengan dikelilingi tabel dimensi di sampingnya.

Dalam data warehouse, data-datanya akan disimpan dalam tabel fakta dan tabel dimensi. Tabel fakta akan menyimpan data-data utama sementara tabel dimensi mendeskripsikan setiap nilai dari suatu dimensi dan dapat direlasikan ke tabel fakta jika diperlukan. Data fakta merupakan data yang terukur besarannya, semisal jumlah siswa, banyaknya rupiah yang diperoleh, rata-rata IPK, dan sejenisnya.  Untuk lebih menjelaskan data fakta, maka kondisi saat data tersebut diukur turut disampaikan. Data kondisi inilah yang dipetakan dalam bentuk data dimensi. Kondisi yang dipetakan dalam dimensi umumnya berupa kondisi waktu, kondisi produk atau item, dan kondisi geografinya. Mendesain struktur star schema, dimulai dengan menentukan data apa yang ingin dilihat oleh pengguna (besarannya) dan bagaimana pengguna melihat  data tersebut (kondisi atau dimensinya).

Tabel dimensi memiliki primary key sederhana yang mengandung hanya satu atau dua kolom saja. Namun, tabel fakta akan memiliki sekumpulan foreign key yang disusun dari primary key komposit dan merupakan gabungan kolom-kolom tabel dimensi yang berelasi.


Snowflake Schema

Sedangkan snowflake schema lebih kompleks dibandingkan dengan star schema karena merupakan pengembangan dari star schema, karena tabel-tabel dimensinya merupakan hasil normalisasi dari beberapa tabel yang berhubungan.

Tabel Perbedaan Star Schema dan Snowflake Schema








Referensi :

  • Paiman, A.S., William, R., Willyam, F., 2010. Analisis Perbandingan Antara Model Dimensi Star Schema Dan Snowflake. Universitas Bina Nusantara, Jakarta.
  • http://kegiatanwindy.blogspot.com/2012/02/olap-online-analytical-processing.html
  • http://nanang.lecture.ub.ac.id/2010/04/17/skema-star-dan-snowflake/