Sabtu, 20 September 2014

Pertemuan 2

Resume Data warehouse

Karakteristik Data Warehouse
Berdasarkan definisi yang dikemukakan Inmon tentang data warehouse, maka data warehouse mempunyai empat buah karakteristik yaitu :

1. Subject Oriented
Sebagaimana telah dijelaskan, data di dalam data warehouse didapat dari data yang ada di sistem operasional. Pada sistem operasional tersebut data diambil berdaskan aplikasi kejadian-kejadian yang ada. Sedangkan pada data warehouse data-data yang berdasarkan aplikasi kejadian tersebut dirubah menjadi data yang berdasarkan pada subjek yang terlibat pada kejadia-kejadian tersebut. Misalnya, sebuah super market pada sistem operasionalnya mencatat transaksi penjualan yang ada di setiap kasir, pembelian barang, dan penggajian karyawan. Maka data warehouse mengelompokkan data hasil kejadian-kejadian tersebut ke dalam berbagai subjek misalnya barang, karyawan, pemasukan, penggajian, dan pemasok. 

2. Integrated
Data yang tersebar di banyak sistem operasional terkadang tidak beragam, baik itu penamaan field, nilai dari sebuah field, atau tipe data yang berbeda-beda untuk suatu hal yang sama. Sebagai contoh, suatu sistem operasional mendefinisikan isi dari field jenis kelamin adalah “pria” atau “wanita”, sedangkan pada sistem operasional lain field tersebut diisi dengan “laki-laki” atau “perempuan”. Hal seperti itulah yang harus diselaraskan agar data di data warehouse seragam sehingga proses analisis dapat dilakukan

3. Non-volatile
Dikarenakan data yang ada di data warehouse adalah data historis untuk kebutuhan masa mendatang, maka data yang ada tersebut bersifat non-volatile atau dengan kata lain, sekali data di-commit untuk masuk, maka data yang telah masuk tersebut tidak dapat diupdate dan dihapus.

4. Time variant
Setiap data yang masuk ke data warehouse dicatat berbagai waktunya, dimulai dari kapan data itu masuk, kapan sebuah transaksi terjadi, kapan terjadinya perubahan. Selain itu terkadang untuk menjaga performa, tabel-tabel fisik yang ada di data warehouse dapat dikelompokkan berdasarkan waktu sesuai kebutuhan analisis. Dengan adanya pencatatan dan pengelompokan waktu tersebut akan sangat membantu dalam kegiatan analisis data historis.


Manfaat Data Warehouse
Berdasarkan pada penjelasan-penjelasan tersebut di atas, dapat disebutkan bahwa penggunaan data warehouse akan memberikan berbagai manfaat, diantaranya :
  • Walaupun mahal dalam pembuatannya, namun untuk kebutuhan pelaporan dan analisis dapat lebih menghemat biaya dan waktu.
  • Dikarenakan terlebih dahulu mengisi data ke data warehouse, ketidakkonsistenan yang ada dapat diketahui dan diatasi sehingga akan mempermudah pelaporan dan analisis.
  • Data yang ada di dalam data warehouse dapat digunakan untuk sistem pendukung keputusan.
  • Data yang ada di dalam data warehouse akan tetap ada walaupun data di sistem operasional telah berubah atau dihapus
DATA MART
Bagian dari data warehouse yang mendukung kebutuhan pada tingkat departemen atau fungsi bisnis tertentu dalam perusahaan. Karakteristik yang membedakan data mart dan data warehouse adalah sebagai berikut (Connolly, Begg, Strachan 1999).
  • Data mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam sebuah departemen atau fungsi bisnis.
  • Data mart biasanya tidak mengandung data operasional yang rinci seperti pada data warehouse.
  • Data mart hanya mengandung sedikit informasi dibandingkan dengan data warehouse. Data mart lebih mudah dipahami dan dinavigasi.
Contoh Data Mart
1.     SmartMart (IBM)
2.     Visual Warehouse (IBM)
3.     PowerMart (Informatica)


Perbedaan Data Warehouse Dan data mining
Sebuah gudang data, seperti data mart, berkaitan dengan bidang studi ganda dan biasanya dilaksanakan dan dikendalikan oleh unit organisasi pusat seperti perusahaan Teknologi Informasi (TI) kelompok. Seringkali, hal itu disebut data warehouse pusat atau perusahaan. Biasanya, data warehouse merakit data dari sistem beberapa sumber.
Tidak ada dalam definisi dasar membatasi ukuran data mart atau kompleksitas dari keputusan-dukungan data yang mengandung. Namun demikian, data mart biasanya lebih kecil dan kurang kompleks daripada gudang data, sehingga, mereka biasanya lebih mudah untuk membangun dan memelihara. 


Kategori
Data Warehouse
Data Mart
Cakupan
Perusahaan
Bidang Usaha (LOB)
Subyek
Kelipatan
Tunggal subjek
Sumber Data
Banyak
Beberapa
Ukuran (khas)
100 GB-TB +
<100 GB
Implementasi Waktu
Bulan untuk tahun
Bulan

 Metadata dalam Definisi, Fungsi, dan Jenisnya

Pengertian yang lainnya menyebutkan metadata adalah informasi terstruktur yang mendeskripsikan, menjelaskan, menemukan, atau setidaknya membuat menjadikan suatu informasi mudah untuk ditemukan kembali, digunakan, atau dikelola. Metadata sering disebut sebagai data tentang data atau informasi tentang informasi. Metadata ini mengandung informasi mengenai isi dari suatu data yang dipakai untuk keperluan manajemen file/data itu nantinya dalam suatu basis data. Jika data tersebut dalam bentuk teks, metadatanya biasanya berupa keterangan mengenai nama ruas (field), panjang field, dan tipe fieldnya: integer, character, date, dll. Untuk jenis data gambar (image), metadata mengandung informasi mengenai siapa pemotretnya, kapan pemotretannya, dan setting kamera pada saat dilakukan pemotretan. Satu lagi untuk jenis data berupa kumpulan file, metadatanya adalah nama-nama file, tipe file, dan nama pengelola (administrator) dari file-file tersebut

Fungsi Metadata :
Metadata memberikan fungsi yang sama seperti katalog yaitu:
·        membuat sumberdaya bisa ditemukan dengan menggunakan kriteria yang relevan;
·        mengidentifikasi sumberdaya
·        mengelompokkan sumberdaya yang serupa
·        membedakan sumberdaya yang tak miliki kesamaan
·        memberikan informasi lokasi

Jenis Metadata :
            Terdapat tiga jenis utama metadata ;
1.Metadata deskriptif menggambarkan suatu sumberdaya dalam maksud seperti penemuan dan identifikasi. Dia bisa meliputi elemen semisal judul, abstrak, pengarang, dan kata kunci.
2.Metadata struktural menunjukkan bagaimana kumpulan obyek disusun secara bersama-sama menjadi satu, semisal bagaimana halaman-halaman ditata untuk membentuk suatu bab.
3.Metadata administratif menyediakan informasi untuk membantu mengelola sumberdaya, semisal terkait kapan dan bagaimana suatu informasi diciptakan, tipe dokumen dan informasi teknis lainnya, serta siapa yang bisa mengaksesnya.


: Referensi ::
[1] Inmon, W.H. (2002). Building the Data Warehouse third edition. Toronto : John Wiley & Sons
[2] docs.oracle.com/html/E10312_01/dm_concepts.htm