Selasa, 25 November 2014

Data Quality

Menurut Mark Mosley (2008) dalam bukunya “Dictionary of Data Management”, pengertian kualitas data adalah level data yang menyatakan data tersebut akurat (accurate), lengkap (complete), timely (update), konsisten (consistent) sesuai dengan semua kebutuhan peraturan bisnis dan relevan.

Data yang berkualitas sangat penting karena dapat :
  • Meningkatkan kepercayaan diri dalam pengambilan keputusan
  • Memperbaiki pelayanan kepada Customer
  • Meningkatkan kesempatan memperbaiki kinerja,
  • Mengurangi resiko dari keputusan yang berbahaya,
  • Mengurangi biaya, terutama untuk pemasaran,
  • Mengembangkan strategi untuk pembuatan keputusan,
  • Meningkatkan produktivitas dengan memangkas beberapa proses
  • Menghindari efek komplikasi dari data yang terkontaminasi

Beberapa indicator data berkualitas :

  1. ACCURACY = data yang tersimpan nilainya benar (name cocok dengan alamatnya)
  2. DOMAIN INTEGRITY = nilai attributnya sesuai batasan yang diperkenankan (nilai attribut laki n perempuan)
  3. DATA TYPE = Nilai data disimpan dalam tipe data yang sesuai (data nama disimpan dengan tipe text)
  4. CONSISTENCY = nilai sebuah field data akan sama semua dalam berbagai berkas (field produk A dgn kode 123, akan selalu sama kodenya di setiap berkas lain)
  5. REDUDANCY = tidak boleh ada data yang sama disimpan di tempat yang berbeda dalam satu sistem
  6. COMPLETENESS = Tidak ada nilai atttribut salah yang diberikan dalam sistem
  7. DATA ANOMALY = sebuah field hanya digunakan sesuai kegunaannya. (field address3 è digunakan untuk mencatat baris ketiga dalam alamat bukan untuk telp atau fax)
  8. CLARITY = Kejelasan arti kegunaan dan cara penulisan sebuah data (penamaan khusus)
  9. TIMELY = merepresentasikan waktu dari data yang dimasukkan (jika data digunakan perhari maka data pada warehaouse harus juga dibuat per hari)
  10. USEFULNESS = setiap data harus benar digunakan oleh user
  11. ADHERENCE TO DATA INTEGRITY RULES = taat pada aturan keterhubungan data


Keuntungan Data Berkualitas
  • Analisis dengan Informasi Tepat Waktu
  • Customer Service yang lebih baik
  • Peluang baru
  • Biaya berkurang dan Risiko
  • Peningkatan Produktivitas
  • Handal Pengambilan Keputusan Strategis

Data Quality Challenges ( tantangan dalam membuat data berkualitas )
Terdapat beberapa factor yaitu :
  • Data Source :
    • Penuaan Data
    • Kesalahan Inputan
    • Penipuan
    • Sistem Konversi yang salah
  • Validasi Data :
    • Terjadi duplikasi data
    • Beberapa atribut data tercampur dalam field yang sama
    • Ejaan yang berbeda untuk nama yang sama
    • Tidak adanya atribut kunci
  • Dibutuhkan biaya yang besar  untuk menjaga kualitas data, terdapat beberapa cara yaitu :
    • Mengatur data agar selalu berkualitas membutuhkan biaya yang tidak sedikit
    • Membutuhkan orang – orang yang berkompeten untuk me-manage data

Data Quality Tools

Data Auditing

Data Auditing meningkatkan akurasi dan kebenaran data pada sumbernya. Tools ini pada umumnya membandingkan data di database sumber dengan aturan bisnis yang ada.
Bila menggunakan sumber eksternal organisasi, aturan bisnis dapat ditentukan dengan menggunakan teknik data mining untuk menemukan pola dalam data. Data yang tidak mematuhi aturan bisnis kemudian dapat dimodifikasi sesuai kebutuhan.

Data Cleansing

Data Cleansing digunakan dalam staging area. Data Cleansing berguna untuk melakukan standarisasi, dan verifikasi data terhadap data yang tidak dikenali. Beberapa fitur yang terdapat dalam Data Cleansing adalah :
  • Data Parsing : Memecah nilai dalam bentuk yang kecil untuk digunakan pada tahap selanjutnya.
  • Data Standarization : Mengubah elemen – elemen data kedalam bentuk standar.
  • Data Correction and verification : Melakukan pengecekan data terhadap data yang tidak dikenali, terutama pada lokasi atau alamat.
  • Data Transformation : Menjamin konsistensi pemetaan data dari sistem sumber dengan data warehouse.
  • Householding : Menggabungkan individual data yang memiliki kesamaan alamat

Data Migration

Data Migration digunakan untuk mengekstrak data dari sumber untuk dikirim ke staging area dan dari staging area ke data warehouse.

Data Quality Initiattive

Untuk bisa sukses, Data Quality program harus bisa dimulai oleh CEO, didukung oleh jajaran direksi, dan dijalankan oleh manajer yang khusus bertugas mengatur kualitas data.
Untuk menjalankan program ini, terdapat beberapa langkah yang harus dilakukan :
  • Data Stewardship Program : Bertujuan untuk memberikan konsultasi dan bantuan mengenai penanganan data yang berkualitas
  • Mengatur tujuan dan harapan dari program Data Quality
  • Melihat dan mengawasi program Data Quality



1 komentar:

  1. youtube.com - YouTube - YouTube
    Video on YouTube · youtube.com. YouTube. youtube mp3 YouTube is the most popular YouTube channel in the world · youtube.com is the most visited YouTube channel in the world · youtube.com is the

    BalasHapus