Pertemuan 2
Resume Data warehouse
Karakteristik Data
Warehouse
Berdasarkan definisi
yang dikemukakan Inmon tentang data warehouse, maka data warehouse mempunyai
empat buah karakteristik yaitu :
1. Subject Oriented
Sebagaimana telah dijelaskan, data di dalam data warehouse didapat dari data yang ada di sistem operasional. Pada sistem operasional tersebut data diambil berdaskan aplikasi kejadian-kejadian yang ada. Sedangkan pada data warehouse data-data yang berdasarkan aplikasi kejadian tersebut dirubah menjadi data yang berdasarkan pada subjek yang terlibat pada kejadia-kejadian tersebut. Misalnya, sebuah super market pada sistem operasionalnya mencatat transaksi penjualan yang ada di setiap kasir, pembelian barang, dan penggajian karyawan. Maka data warehouse mengelompokkan data hasil kejadian-kejadian tersebut ke dalam berbagai subjek misalnya barang, karyawan, pemasukan, penggajian, dan pemasok.
2. Integrated
Data yang tersebar di
banyak sistem operasional terkadang tidak beragam, baik itu penamaan field,
nilai dari sebuah field, atau tipe data yang berbeda-beda untuk suatu hal yang
sama. Sebagai contoh, suatu sistem operasional mendefinisikan isi dari field
jenis kelamin adalah “pria” atau “wanita”, sedangkan pada sistem operasional
lain field tersebut diisi dengan “laki-laki” atau “perempuan”. Hal seperti
itulah yang harus diselaraskan agar data di data warehouse seragam sehingga
proses analisis dapat dilakukan
3. Non-volatile
Dikarenakan data yang
ada di data warehouse adalah data historis untuk kebutuhan masa mendatang, maka
data yang ada tersebut bersifat non-volatile atau dengan kata lain, sekali data
di-commit untuk masuk, maka data yang telah masuk tersebut tidak dapat diupdate
dan dihapus.
4. Time variant
Setiap data yang masuk
ke data warehouse dicatat berbagai waktunya, dimulai dari kapan data itu masuk,
kapan sebuah transaksi terjadi, kapan terjadinya perubahan. Selain itu
terkadang untuk menjaga performa, tabel-tabel fisik yang ada di data warehouse
dapat dikelompokkan berdasarkan waktu sesuai kebutuhan analisis. Dengan adanya
pencatatan dan pengelompokan waktu tersebut akan sangat membantu dalam kegiatan
analisis data historis.
Manfaat Data Warehouse
Berdasarkan pada
penjelasan-penjelasan tersebut di atas, dapat disebutkan bahwa penggunaan data
warehouse akan memberikan berbagai manfaat, diantaranya :
- Walaupun
mahal dalam pembuatannya, namun untuk kebutuhan pelaporan dan analisis
dapat lebih menghemat biaya dan waktu.
- Dikarenakan
terlebih dahulu mengisi data ke data warehouse, ketidakkonsistenan yang
ada dapat diketahui dan diatasi sehingga akan mempermudah pelaporan dan
analisis.
- Data
yang ada di dalam data warehouse dapat digunakan untuk sistem pendukung
keputusan.
- Data
yang ada di dalam data warehouse akan tetap ada walaupun data di sistem
operasional telah berubah atau dihapus
DATA MART
Bagian dari data
warehouse yang mendukung kebutuhan pada tingkat departemen atau fungsi
bisnis tertentu dalam perusahaan. Karakteristik yang membedakan data mart dan data
warehouse adalah sebagai berikut (Connolly, Begg, Strachan 1999).
- Data
mart memfokuskan hanya pada kebutuhan-kebutuhan pemakai yang terkait dalam
sebuah departemen atau fungsi bisnis.
- Data
mart biasanya tidak mengandung data operasional yang rinci seperti
pada data warehouse.
- Data
mart hanya mengandung sedikit informasi dibandingkan dengan data
warehouse. Data mart lebih mudah dipahami dan dinavigasi.
Contoh Data Mart
1. SmartMart
(IBM)
2. Visual
Warehouse (IBM)
3. PowerMart
(Informatica)
Perbedaan Data Warehouse
Dan data mining
Sebuah gudang data,
seperti data mart, berkaitan dengan bidang studi ganda dan biasanya
dilaksanakan dan dikendalikan oleh unit organisasi pusat seperti perusahaan
Teknologi Informasi (TI) kelompok. Seringkali, hal itu disebut data warehouse
pusat atau perusahaan. Biasanya, data warehouse merakit data dari sistem
beberapa sumber.
Tidak ada dalam definisi
dasar membatasi ukuran data mart atau kompleksitas dari keputusan-dukungan data
yang mengandung. Namun demikian, data mart biasanya lebih kecil dan kurang kompleks
daripada gudang data, sehingga, mereka biasanya lebih mudah untuk membangun dan
memelihara.
Kategori
|
Data Warehouse
|
Data Mart
|
Cakupan
|
Perusahaan
|
Bidang Usaha (LOB)
|
Subyek
|
Kelipatan
|
Tunggal subjek
|
Sumber Data
|
Banyak
|
Beberapa
|
Ukuran (khas)
|
100 GB-TB +
|
<100 GB
|
Implementasi Waktu
|
Bulan untuk tahun
|
Bulan
|
Metadata dalam Definisi, Fungsi, dan
Jenisnya
Pengertian yang lainnya
menyebutkan metadata adalah informasi terstruktur yang mendeskripsikan,
menjelaskan, menemukan, atau setidaknya membuat menjadikan suatu informasi
mudah untuk ditemukan kembali, digunakan, atau dikelola. Metadata sering disebut
sebagai data tentang data atau informasi tentang informasi. Metadata
ini mengandung informasi mengenai isi dari suatu data yang dipakai untuk
keperluan manajemen file/data itu nantinya dalam suatu basis data. Jika data
tersebut dalam bentuk teks, metadatanya biasanya berupa keterangan
mengenai nama ruas (field), panjang field, dan tipe fieldnya: integer,
character, date, dll. Untuk jenis data gambar (image), metadata
mengandung informasi mengenai siapa pemotretnya, kapan pemotretannya, dan
setting kamera pada saat dilakukan pemotretan. Satu lagi untuk jenis data
berupa kumpulan file, metadatanya adalah nama-nama file, tipe file, dan
nama pengelola (administrator) dari file-file tersebut
Fungsi Metadata :
Metadata memberikan
fungsi yang sama seperti katalog yaitu:
· membuat sumberdaya bisa
ditemukan dengan menggunakan kriteria yang relevan;
· mengidentifikasi
sumberdaya
· mengelompokkan sumberdaya
yang serupa
· membedakan sumberdaya yang
tak miliki kesamaan
· memberikan informasi
lokasi
Jenis Metadata :
Terdapat tiga jenis utama metadata ;
1.Metadata deskriptif
menggambarkan suatu sumberdaya dalam maksud seperti penemuan dan identifikasi.
Dia bisa meliputi elemen semisal judul, abstrak, pengarang, dan kata kunci.
2.Metadata struktural
menunjukkan bagaimana kumpulan obyek disusun secara bersama-sama menjadi satu,
semisal bagaimana halaman-halaman ditata untuk membentuk suatu bab.
3.Metadata administratif
menyediakan informasi untuk membantu mengelola sumberdaya, semisal terkait
kapan dan bagaimana suatu informasi diciptakan, tipe dokumen dan informasi
teknis lainnya, serta siapa yang bisa mengaksesnya.
: Referensi ::
[1] Inmon, W.H. (2002). Building the Data Warehouse third edition. Toronto : John Wiley & Sons
[1] Inmon, W.H. (2002). Building the Data Warehouse third edition. Toronto : John Wiley & Sons
[2] docs.oracle.com/html/E10312_01/dm_concepts.htm