-->
Pengertian Olap
1 Pengertian OLAP
  • Menurut Inmon (2005: 500), OLAP ialah potongan pemrosesan untuk lingkungan data mart.
  • Menurut Connolly & Begg (2005: 1205), OLAP yaitu sintesis, analisis, dan konsolidasi dinamis dari sejumlah besar data multidimensional. OLAP ialah tampilan mullti-dimensional dari data agregat untuk menyediakan saluran cepat kepada informasi strategis yang akan digunakan untuk tujuan analisis tingkat lanjut.
  • Menurut Kimball & Ross (2002: 408), OLAP yaitu kumpulan hukum yang menyediakan sebuah kerangka dimensional yang sanggup mendukung sebuah keputusan.
  • Menurut Saptadi & Lisangan (2010: 83), OLAP yaitu penerapan sekumpulan perangkat grafis yang memmenolong user dalam menampilkan data secara multidimensional sehingga user sanggup menganalisis data tersebut dengan menggunakan metode yang lebih sederhana.
Berdasarkan teori-teori diatas sanggup disimpulkan bahwa OLAP yaitu teknologi yang menggunkana sekumpulan prinsip kerangka kerja dimensional yang menggunakan data agregat untuk menyediakan saluran cepat kepada informasi strategis sehingga sanggup digunakan untuk melaksanakan analisis tingkat lanjut dalam untuk mendukung proses pengambilan keputusan.

2 Pengertian Data Warehouse
  • Menurut Reeves (2009: 4), data warehouse yaitu sekumpulan proses dan data yang mempunyai tujuan untuk mendukung bisnis dengan analisis dan pengambilan keputusan.
  • Menurut Singh, D.C.Upadhaya, & Yadav (2011: 1), data warehouse yaitu sistem kompleks yang terdiri dari banyak komponen yang menyimpan data untuk mendukung keputusan. 
  • Menurut Inmon (2005: 29), data warehouse yaitu kumpulan basis data yang mempunyai sifat berorientasi subyek, terintegrasi, mempunyai rentang waktu, yang dirancang untuk mendukung fungsi sistem pendukung pengambilan keputusan
  • Menurut Turban, McLean, & Wetherbe (2004: 55), data warehouse yaitu database yang didesain untuk mendukung DSS, ESS, dan proses analisis lainnya dan kegiatan end-user.
Berdasarkan teori-teori tersebut sanggup disimpulkan bahwa data warehouse yaitu kawasan penyimpanan data yang berorientasi pada subjek, terintegrasi, tidak simpel berubah, dan mempunyai rentang waktu, yang diambil dari database operasional, historis, dan eksternal, yang diproses semoga sanggup dianalisis untuk mendukung proses pengambilan keputusan.

3 Perbandingan OLTP dengan Data Warehouseksi yang mempunyai performa tinggi.

  • Menurut Connolly & Begg (2005: 1149), OLTP yaitu sistem yang dirancang untuk menangani jumlah hasil transaksi yang tinggi, dengan transaksi yang biasanya membuat perubahan kecil pada data operasional perusahaan, yaitu data yang diperulkan oleh perusahaan untuk menangani operasi dari hari ke hari.
  • Menurut Kimball & Ross (2002: 408), OLTP yaitu deksripsi pertama dari setiap kegiatan dan sistem yang bekerjasama dengan proses input data ke dalam sebuah database

Berdasarkan teori-teori tersebut sanggup disimpulkan bahwa OLTP yaitu suatu sistem berperforma tinggi yang dirancang untuk menangani proses transaksi yang terjadi setiap hari pada perushaan, dan data dari hasil transaksi tersebut dimasukkan ke dalam database secara berkala.

1. Keuntungan Data Warehouse
Menurut Connolly & Begg (2005: 1152), data warehouse yang sudah diimplementasikan dengan baik sanggup mempersembahkan keuntungan yang besar bagi organisasi, yaitu:
a) Potensi nilai kembali yang besar pada investasi
Sebuah organisasi harus mengeluarkan uang dan sumber daya dalam jumlah yang cukup besar untuk memastikan kalau data warehouse sudah diimplementasikan dengan baik, biaya yang di keluarkan tergantung dari solusi metodeal yang dinginkan. Akan tetapi, sehabis data warehouse digunakan, maka kemungkinan didapatkan ROI (Return on Investment) akan relatif lebih besar

b) Keuntungan kompetitif
Keuntungan kompetitif didapatkan apabila pengambil keputusan mengakses data yang sanggup mengungkapkan informasi yang sebelumnya tidak diketahui, tidak tersedia, contohnya informasi terkena konsumen, trend, dan permintaan.

c) Meningkatkan produktivitas para pengambil keputusan perusahaan
Data warehouse meningkatkan produktivitas para pengambil keputusan perusahaan dengan menciptkan sebuah database yang terintegrasi secara konsisten, berorientasi pada subjek, dan data historis. Data warehouse mengintegrasikan data dari beberapa sistem yang tidak compatible ke dalam bentuk yang menyediakan satu padangan yang konsisten dari organisasi. melaluiataubersamaini mengubah data menjadi informasi yang berguna, maka seorang manajer bisnis sanggup membuat analisa yang lebih akurat dan konsisten.

Al-Debei (2011: 158) menambahkan bahwa data warehouse sanggup bermanfaa untuk meningkatkan kinerja bisnis, ibarat pada kasus Berndt yang menggunakan data warehouse untuk melaksanakan identifikasi dan mencari pola dari penyakit yang mempunyai kemungkinan untuk merusak alam. misal lainnya yaitu Ahmad yang menggunakan aplikasi data warehouse untuk membuat sistem DSS yang berkhasiat untuk memmenolong pengambilan keputusan, lebih khususnya digunakan untuk menentukan kawasan tinggal di kompleks perumahan. misal yang ketiga yaitu seseorang berjulukan Park yang mengatakan eksperimen laboratorium yang meningkatkan kemampuan data warehouse untuk mendukung sistem DSS dengan menambahkan data untuk kepentingan pengambilan kpeutusan bisnis. Dan yang terakhir yaitu Griffin yang berargumen bahwa data warehouse sanggup meningkatkan kemampuan perusahaan dengan keunggulan kompetitif lantaran sanggup memmenolong manajer untuk mengambil keputusan.

2. Karakteristik Data Warehouse
Beberapa karakteristik data warehouse berdasarkan Inmon (2005: 34) yaitu :
a) Subject Oriented
Data warehouse berorientasi subjek artinya data warehouse didesain untuk menganalisa data berdasarkan subjek-subjek tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu.

Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan (customers, products, dan sales) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing, stock control, dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan daripada aplikasi yang berorientasi terhadap data.

contohnya dalam perusahaan asuransi data warehouse akan berorientasi pada subyek utama perusahaan antara lain customer, kebijakan, premi, dan klaim sedangkan OLTP lebih berorientasi pada aplikasi-aplikasi operasional perusahaannya antara lain asuransi mobil, asuransi kesehatan, asuransi jiwa, asuransi kecelakaan.

b) Integrated
Karakteristik data warehouse yang kedua yaitu terintegrasi. Dari tiruana karakteristik data warehouse, terintegrasi ialah karakteristik yang paling penting. Terintegrasi maksudnya data warehouse sanggup menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu sama lain. Data tersebut diubah, diformat ulang, disusun ulang, diringkas, dan seterusnya. Hasilnya, data dalam data warehouse sudah ialah satu kesatuan yang bekerjasama dan tidak sanggup terpisahkan lagi.

Misalnya, untuk menggambarkan jenis kelabuin, ada sumber data yang menggunakan istilah M dan F, sumber data lainnya menggunakan istilah 1 dan 0, sedangkan sumber data yang ketiga menggunakan istilah A dan B. Pada data warehouse, harus ada satu citra fisik yang satu kesatuan untuk menggambarkan jenis kelabuin, sehingga data warehouse akan mengambil dan menentukan salah satu istilah saja, contohnya menggunakan M dan F.

c) Non-Volatile
Karakteristik yang ketiga yaitu non-volatile, yang berarti data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. 

Data Warehouse tidak sama dengan database, pada database terdapat tiga operasi, yaitu insert, update, dan delete. Sedangkan pada data warehouse spesialuntuk ada dua operasi data yaitu loading data (mengambil data) dan saluran data (query data). Artinya user spesialuntuk boleh melaksanakan proses read, bukan write. Tujuannya yaitu untuk menjaga keaslian dan integrasi data di dalam sistem, dan ini pula yang membedakan antara data warehouse dengan OLTP.

d) Time Variant
Time Variant maksudnya seluruh data pada data warehouse bekerjasama dengan elemen waktu. Secara umum, sistem operasional tidak mempunyai data historis. Untuk itu, data warehouse menjawaban duduk kasus tersebut dengan mempersembahkan dimensi historis pada data yang sanggup diambil dari database operasional.

Data Warehouse meliputi record-record yang bersifat historis. Record dalam data warehouse berjangka waktu 5-10 tahun, sehingga record yang usang akan tetap berada di dalam sistem. Hal ini digunakan untuk materi analisis bagi pengambil keputusan dalam menentukan isu terkini bisnis yang ada di masa lalu. Namun record yang terlalu usang juga tidak baik disimpan, alasannya sanggup mempersembahkan hasil analisis yang kurang tepat. Dalam OLTP, record yang dimiliki ialah record yang terbaru. OLTP tidak menyimpan data yang lama, dengan maksud untuk mempercepat proses. Semakin sedikit data yang disimpan maka waktu yang dibutuhkan untuk pemrosesan data semakin kecil.

Data dalam data warehouse bekerjasama dengan suatu titik atau point dalam suatu periode tertentu (semester, kuartal, tahun fiskal). Data tersebut ialah data hasil summary. Hal ini memmenolong dalam menentukan performa query data warehouse serta dalam membentuk pengertian bisnis.

3. Granularity
Menurut Inmon (2005: 41), Granularity ialah suatu level dari detail atau ringkasan pada unit data di dalam data warehouse. Semakin banyak detail atau ringkasan pada unit data maka akan semakin rendah level pada granularity.

contohnya yaitu sebuah transaksi yang sederhana akan berada pada tingkat granularity yang rendah, sedangkan keseluruhan dari transaksi dalam satu bulan akan berada pada level granularity yang tinggi.

Granularity ialah permasalahan utama dalam mendesain lingkungan data warehouse lantaran besar lengan berkuasa besar pada volume dari data yang terletak didalam data warehouse.
Granularity mempunyai beberapa keuntungan diantaranya :
1. Dapat digunakan kembali
Dikatakan sanggup digunakan kembali lantaran sanggup digunakan oleh banyak orang dengan aneka macam cara yang tidak sama. contohnya data yang sama sanggup digunakan untuk memenuhi kebutuhan dalam bidang pemamasukan, penjualan dan keuangan. Pemamasukan menginginkan melihat data bulanan berdasarkan area geografi, penjualan ingin melihat data penjualan setiap distributor berdasarkan area geografi tiap minggu, dan keuangan melihat pendapatan setiap kuarter berdasarkan produk.

2. Kemampuan untuk mencocokkan data
Jika mempunyai satu dasar yang sama untuk tiruananya, maka jikalau terjadi perbadaan dalam analisis antara dua atau lebih departemen, proses pencocokan akan menjadi sederhana.

3. Fleksibel
Dimana para pengguna sanggup merubah data sesuai dengan tampilan yang mereka inginkan sehingga pekerjaan sanggup diselesaikan dengan gampang.

4. Granularity terdiri dari sebuah history dari aktifitas-aktifitas dan kejadian perusahaan.
Dalam jangka waktu yang panjang, efisiensi sangat dibutuhkan dalam menyimpan dan mengakses data serta kemampuan dalam menganalisa data dalam detail data yang tepat. Sehingga data warehouse membutuhkan sesuatu yang lebih dari satu tingkat granularity tetapi dua tingkat granularity,

Keuntungan dari granularity dua tingkat yaitu kita sanggup memproses ajakan utama dengan sangat efisien dan sanggup menjawaban aneka macam pertanyaan yang ada. Karena biaya, efisiensi, kemudian dalam mengakses, dan kemampuan dalam menjawaban aneka macam query, dual of level data ialah arsitektur terbaik dalam detail data pada data warheouse.

Kebutuhan yang tidak terang dimasa yang akan hadir sanggup diakomodasi. Saat ada kebutuhan gres dan ada kebutuhan informasi, data warehouse sudah siap untuk melaksanakan analisis dan organisasi disiapkan untuk menangani kebutuhan yang baru.

Arsitektur Data Warehouse
1 Operational Data
Sumber data dari data warehouse sanggup diambil pribadi dari :
  • Mainframe data operasional yang ada dalam jaenteng database
  • Data masing-masing departemen yang disimpan dalam sistem file kepemilikan ibarat VSAM, RMS, dan relational DBMS ibarat Informix dan Oracle.
  • Data pribadi yang tersimpan di dalam workstation dan server pribadi.
  • Sistem eksternal ibarat internet, database komersial, atau database yang bekerjasama dengan supplier dan customer
2 Operational Data Store
Suatu operational data store yaitu suatu media penyimpanan dan pengintegrasian data operasional yang digunakan untuk melaksanakan analisis. ODS menyediakan data dengan cara yang sama ibarat data warehouse, tetapi gotong royong bertindak secara sederhana sebagai kawasan penampungan data secara sementara dipindahkan ke data warehouse. 

Membangun ODS sanggup memmenolong dalam pembuatan data warehouse alasannya suatu ODS sanggup menyediakan data yang sudah di-extract dan di-cleansing dari sistem sumber. Ini berarti bahwa proses integrasi dan restrukturisasi data untuk data warehouse menjadi lebih sederhana.
3 Load Manager
Load Manager disebut juga sebagai fronted component. Tugas load manager yaitu melaksanakan tiruana operasi yang bekerjasama dengan pengambilan dan load data ke dalam data warehouse. Data di-extract secara lansgung dari sumber data atau dari penyimpanan data operasional. Operasi yang dilakukan oleh load manager sanggup meliputi perubahan bentuk yang sederhana untuk mempersiapkan data tersebut semoga sanggup dimasukkan ke dalam warehouse.
4 Warehouse Manager
Warehouse Manager melaksanakan tiruana operasi yang bekerjasama dengan pengelolaan atas data dalam warehouse. Komponen ini dibentuk dengan vendor data management tools dan custom-built programs. Operasi-operasi yang dilaksanakan oleh warehouse manager meliputi :
  • Analisa terhadap data untuk memastikan konsistensi.
  • Transformasi dan penggabungan sumber data dari kawasan penyimpanan sementara menjadi tabel-tabel data warehouse.
  • Pembuatan index dan view berdasarkan tabel-tabel dasar.
  • Menghasilkan denormalisasi (jika diperlukan).
  • Menghasilkan agregasi (jika diperlukan).
  • Backup dan archieve data.
5 Query Manager
Query Manager (disebut juga sebagai backend component) melaksanakan tiruana operasi yang berkaitan dengan pengelolaan dari query user. Komponen ini secara khusus dibangun menggunakan peralatan saluran data end-user, peralatan pengontrol data warehouse, fasilitas database, dan custom-built program. Kompleksitas query manager ditentukan oleh fasilitas yang disediakan oleh tool saluran end-user dan database.

Operasi yang dilakukan komponen ini meliputi pengarahan query pada tabel yang sesuai dan penjadwalan pelaksanaan query. Dalam bebeapa kasus, terkadang query manager juga menghasilkan profil query yang mengijinkan warehouse manager menentukan kesesuaian index dan agregasi.
6 Detailed Data
Area ini menyimpan tiruana data detil di dalam sketsa database, yang bertujuan untuk melengkapkan kumpulan data untuk data warehouse. Dalam banyak kasus, data yang terperinci tidaklah disimpan secara online tetapi sanggup disediakan melalui agregasi data pada tingkatan detil diberikutnya.
7 Lightly and Highly Summarized Data
Area ini menyimpan tiruana lightly and highly summarized (aggregated) data yang dihasilkan oleh warehouse manager. Area ini yaitu kawasan penampungan sementara sebelum dilakukan perubahan secara berkelanjutan untuk merespon perubahan profil query.

Tujuan ringkasan informasi ini yaitu untuk mempercepat penyampaian query. Meskipun biaya operasi akan meningkat sehubungan dengan proses peringkasan data tersebut, ini akan diseimbangkan dengan menghapus keperluan untuk secara terus menerus melakuan operasi ringkasan dalam menjawaban query user. Ringkasan data di-update secara terus menerus saat ada data gres terisi ke dalam warehouse.
8 Archive/Backup Data
Area ini menyimpan tiruana detil dan ringkasan data untuk kepentingan archiving dan backup. Walaupun ringkasan data dihasilkan dari detil data, itu akan mungkin untuk membutuhkan backup ringkasan data secara online jikalau data ini disimpan melebihi periode penyimpanan untuk data yang terinci. Data ditransfer ke arsip penyimpanan ibarat magnetic tape atau optical disk.
9 Metadata
Area ini menyimpan tiruana definisi metadata yang digunakan oleh tiruana proses di dalam data warehouse. Metadata digunakan untuk aneka macam tujuan termasuk :
  • Proses extract dan load atas metadata digunakan untuk memetakan sumber data ke dalam pandangan umum data dalam warehouse.
  • Sebagai proses pengelolan warehouse, metadata digunakan untuk mengotomatisasi pembuatan atas tabel ringkasan.
  • Sebagai potongan proses pengelolaan query, metadata digunakan untuk mengarahkan suatu query dengan sumber data yang tepat.
Menurut Inmon (2005: 500), metadata yaitu data ihwal data, deskripsi dari struktur, isi, kunci, indeks, dan lain-lain dari data.

Menurut Inmon (2005: 261-262), hal-hal penting dari metadata yaitu sebagai diberikut :
  1. ID Dokumen
  2. Tanggal entri ke warehouse
  3. Deskripsi dari dokumen
  4. Sumber dari dokumen
  5. Tanggal sumber dari dokumen
  6. Klasifikasi dokumen
  7. Indeks kata
  8. Pemmembersihkanan Tangga
  9. Lokasi fisikal
  10. Panjang dokumen
  11. Referensi terkait
Menurut Inmon (2005: 102), dalam membuat metadata harus memenuhi syarat-syarat sebagai diberikut :
  • Struktur data yang dikenal programme
  • Struktur data yang dikenal analis DSS
  • Sumber data yang memmenolong data warehouse
  • Transformasi data saat dilewatkan ke data warehouse
  • Model data
  • Hubungan antara model data dan data warehouse
  • History dari extracts
10 End-User Access Tools
Tujuan yang utama dari data warehouse yaitu menyediakan informasi kepada user untuk mendukung pengambilan keputusan. Para user ini diberinteraksi dengan warehouse menggunakan end-user access tools. Menurut para hebat end-user access tools sanggup dikategorikan menjadi 5 kelompok :
1. Reporting dan Query Tools
Reporting tools meliputi pelaporan (production reporting tools) dan penulis laporan (reporting writters). Production reporting tools digunakan untuk menghasilkan laporan operasional reguler, atau daya pemicu kerja yang tinggi. Seperti order customer, invoice, dan penghasilan karyawan.

Query tools untuk relational data warehouse, dirancang untuk mendapatkan SQL dan syntax-nya, untuk query penyimpanan data, untuk data warehouse. Tools ini melindungi end-user dari kompleksitas SQL dan sruktur database.
2. Application Development Tools
Kebutuhan dari end-user, kemampuan membuat informasi yang built-in dan tools query yang tidak mencukupi, lantaran dikarenakan kebutuhan analisis tidak bisa dilakukan, atau lantaran interaksi user membutuhkan tingkat professional yang tinggi.
3. Executive Information System (EIS) Tools
EIS lebih dikenal sebagai ‘Everybody’s information system’ yang tiruanla dikembangkan untuk mendukung taktik kebutuhan tingkat tinggi. Tools EIS mulanya terasosiasi dengan mainframe, sehingga memungkinkan user membuat aplikasi pendukung pengambilan keputusan, dam menyediakan overview data organisasi dan mngakses sumber data eksternal.
4. Online Analitical Processing (OLAP) Tools
Online analytical processing tools berbasis pada konsep basis data multidimensi dan memperbolehkan user untuk menganalisis data menggunakan view yang kompleks dan multidimensional. Tools ini mengasumsikan bahwa data diatur dalam model multidimensi yang didukung oleh special multidimensional database (MDDB) atau oleh basis data relasional yang dirancang untuk mendapatkan multidimensional queries.

5. Data Mining Tools
Data mining yaitu proses untuk menemukan hubungan baru, pola, dan tren dengan cara melaksanakan 'mining' pada data yang berukuran besar menggunakan metode statistik, matematik, dan artificial intelligence (AI). Data mining mempunyai potensi untuk menggantikan kemampuan OLAP tools, sebagai daya tarik utama dari data mining yaitu kemampuannya untuk membangun prediksi dibandingkan dengan model retrospektif.

Aliran Data pada Data Warehouse
Menurut Connolly & Begg (2005: 1161-1165), Data warehouse mempunyai lima arus data primer yaitu :
Arsitektur data warehouse berdasarkan Connolly & Begg (2005:1156-1161), antara lain :

1 Inflow
Inflow yaitu proses yang bekerjasama dengan ekstraksi, pemmembersihkanan, dan loading data dari sistem sumber ke dalam data warehouse. Agar data sanggup masuk ke dalam data warehouse maka data harus direkonstruksi terlebih lampau. Proses rekonstruksi ini melibatkan proses:
  • Pemmembersihkanan data yang kotor
  • Membentuk kembali data semoga sesuai dengan persyaratan data warehouse yang baru, contohnya menambah atau mengurai field dan denormalisasi data.
  • Memastikan sumber data konsisten dengan sumber itu sendiri dan data yang sudah ada di data warehouse
2 Upflow
Upflow yaitu proses yang bekerjasama dengan menambah nilai data di dalam data warehouse melalui merangkum, mempaket, dan mendstribusi data.

Aktivitas yang berhubugan dengan upflow yaitu:

  • Meringkas data dengan memilih, memproyeksikan, menggabungkan, dan mengelompokan data relasional menjadi view yang lebih baik dan berkhasiat untuk pengguna akhir.
  • Membungkus data dengan merubah detil atau ringkasan data menjadi format yang lebih berguna, ibarat spreadsheet, dokumen teks, grafik, tampilan grafik yang lain, database privat, dan animasi
3 Downflow
Downflow yaitu proses yang bekerjasama dengan pengarsipan dan melaksanakan backup data dalam data warehouse menyimpan data usang mempunyai peranan yang penting dalam mempertahankan penampilan dan efektifitas dari warehouse dengan mengirimkan data usang dengan nilai terbatas ke sebuah kawasan penyimpanan ibarat magnetic tape atau optical disc

4 Outflow
Outflow yaitu proses yang berbuhungan dengan pembuatan data semoga tersedia untuk pengguna akhir.
Dua kegiatan kunci yang terlibat dalam outflow meliputi beberapa aspek:

  • Pengaksesan, yang berserius pada kepuasan ajakan pengguna untuk data yang mereka perlukan.
  • Pengiriman, yang berserius dengan pengiriman informasi yang proaktif untuk workstation pengguna akhir.
5 Metaflow
Metaflow yaitu proses yang bekerjasama dengan administrasi metadata. Metadata yaitu klarifikasi dari isi data dari data warehouse, apa yang ada di dalamnya, darimana berasal dan apa yang sudah dilakukan dengan pemmembersihkanan, peringkasan dan integrasi

Anatomi Data Warehouse
1 Data Warehouse Terpusat
Menurut Inmon (2005: 193), sebagian besar organisasi membangun dan memelihara lingkungan data warehouse terpusat tunggal. Pengaturan ini dilakukan lantaran mempunyai beberapa alasan, yaitu :

  1. Data dalam warehouse terintegrasi antar perusahaan dan citra terintegrasi digunakan spesialuntuk pada kantor pusat.
  2. Perusahaan mengoperasikan sebuah model bisnis terpusat.
  3. Volume data dalam data warehouse ibarat sebuah penyimpanan tunggal yang terpusat.
2 Data Warehouse Terdistribusi
Menurut Inmon (2005: 193-194), tiga tipe dari data warehouse terdistribusi :

  • Bisnis terdistribusi secara geografis atau dibedakan berdasarkan garis produk. Oleh lantaran hal tersebut, maka disebutlah data warehouse lokal dan data warehouse global. Data warehouse lokal mewakili data dan proses di lokasi yang terpencil dan data warehouse global mewakili potongan dari bisnis yang diintegrasikan melalui keseluruhan bisnis.
  • Lingkungan data warehouse akan memegang banyak data dan volume data akan didistribusikan melalui beberapa prosesor. Secara logikal spesialuntuk ada satu data warehouse, tetapi secara fisikal terdapat banyak data warehouse yang tiruananya mempunyai hubungan yang akrab tetapi diletakkan pada prosesor yang terpisah. Konfigurasi ini sanggup disebut dengan teknologi data warehouse terdistribusi.
  • Lingkungan data warehouse tumbuh dalam sebuah kebiasaan yang tidak terorganisasi. Data warehouse yang pertama muncul, kemudian diikuti yang lainnya. Kurangnya koordinasi dari pertumbuhan data warehouse yang tidak sama biasanya menghasilkan sebuah perbedaan secara politik dan organisasi. Kasus ini sanggup disebut dengan data warehouse terdistribusi yang secara bebas berkembang.
Istilah-Istilah Data Warehouse
1 Data Mart
Menurut Inmon (2005: 494), data mart yaitu sebuah struktur data yang terbagi-bagi, dimana struktur data tersebut diambil dari data warehouse dan data sudah didenormalisasi berdasarkan kebutuhan informasi pada tiap-tiap potongan perusahaan.

  • Menurut Connolly & Begg (2005: 1171), data mart ialah potongan dari data warehouse yang mendukung kebutuhan dari suatu departemen atau fungsi bisnis tertentu.
  • Menurut Vercellis (2009: 49), data mart yaitu sistem yang mengkumpulkan tiruana data yang dibutuhkan oleh suatu departemen khusus, ibarat marketing atau logistik, untuk dilakukan analisis business intelligence atau data mart sanggup dikatakan sebagai data warehouse fungsional atau departemen yang mempunyai ukuran lebih kecil dan lebih spesifik dibandingkan data warehouse secara keseluruhan.
Berdasarkan teori-teori tersebut sanggup disimpulkan bahwa data mart yaitu potongan dari data warehouse yang dirancang untuk mendukung kebutuhan informasi pada suatu departemen tertentu di dalam perusahaan.

2 Extraction Transformation Loading (ETL)

  • Menurut Inmon (2005: 497), ETL ialah proses mengambil data aplikasi yang dibutuhkan dan mengintegrasikannya ke dalam data warehouse.
  • Menurut Vercellis (2009: 53), ETL merujuk pada tools yang digunakan untuk melaksanakan tiga fungsi diberikut yaitu pengambilan (extraction), perubahan (transformation), dan pemuatan (loading) ke dalam data warehouse.
· Extraction
Menurut Loshin (2003: 246-247), proses ekstraksi yaitu pengambilan data dari sumber data internal dan external yang ada yang dilanjutkan ke database tujuan. Pada dasarnya, tujuan proses ekstraksi ini yaitu menyiapkan data untuk menyiapkan data untuk diproses lebih lanjut pada proses selanjutnya.

Menurut Vercellis (2009: 53), pada tahap pertama data diambil dari sumber internal dan eksternal yang tersedia. Perbedaan logis sanggup dibentuk antara ekstrasi pertama, dimana data yang terhubung pada tiruana periode masa kemudian dimasukkan ke dalam kawasan penyimpanan data kosong, dan ekstraksi secara berlanjut yang mengubah kawasan penyimpanan data dengan data gres yang akan tersedia sepanjang waktu.

· Transformation
Menurut Loshin (2003: 246-247), proses transformasi yaitu proses pengubahan bentuk data semoga sesuai dan seragam dengan tujuan data menjadi lebih terintegrasi satu sama lain, sehingga data dalam database tujuan menjadi konsisten. Sebagai pola yaitu proses transformasi format tanggal, didalam database A, format tanggal yaitu 10-10-10, sedangkan di database B yaitu 10-oct-10, data dari database A dan B akan ditransformasikan sesuai dengan database tujuan, contohnya menjadi 10-Oktober-2010.

Menurut Vercellis (2009: 53), tujuan dari tahap transformasi yaitu untuk meningkatkan kualitas dari data yang diambil dari sumber yang tidak sama, melalui pembetulan ketidak-konsistenan, ketidak-akuratan, dan nilai-nilai yang hilang.

· Loading
Menurut Loshin (2003: 246-247), sehabis data diproses di tahap Extraction dan Transform, data sudah siap untuk dimuat kedalam database tujuan lewat proses Loading, sehingga data sanggup memmenolong dalam proses analisis lebih lanjut ke depannya.

Menurut Vercellis (2009: 54), tahap loading ialah tahap sehabis data diambil dan ditransformasikan, untuk disimpan ke dalam tabel penyimpanan data, yang bertujuan untuk dianalisis juga sebagai aplikasi untuk mendukung keputusan.
3 Fact Table
Menurut Connolly & Begg (2005: 1183), tabel fakta yaitu sebuah tabel pada dimensional model yang isinya ialah composite Primary Key (PK). Jadi, Primary key pada tabel fakta ialah beberapa Foreign Key (FK).

Menurut Kimball & Ross (2002: 16), tabel fakta yaitu sebuah tabel primer dalam model dimensional kawasan perhitungan performa numerik dari sebuah bisnis disimpan. Perhitungan tersebut diambil dari interseksi dari tiruana dimensi yang diperlukan.

Menurut Patel & Patel (2012: 254) tabel fakta yaitu kumpulan item data yang terkait, yang terdiri dari pengukuran dan data konteks. Setiap fakta biasanya ialah representasi item bisnis, transaksi bisnis, atau suatu event yang sanggup digunakan untuk menganalisis proses bisnis. Dalam data warehouse, fakta diimplementasikan ke dalam tabel dimana tiruana data numerik disimpan.

4 Dimension Table
Menurut Connolly & Begg (2005: 1183), tabel dimensi yaitu sekumpulan tabel-tabel yang lebih kecil dari tabel fakta pada dimensional model. Setiap tabel dimensi mempunyai non-composite primary key.

  • Menurut Inmon (2005: 495), tabel dimensi ialah kawasan dimana data pelengkap yang bekerjasama dengan tabel fakta ditempatkan pada sebuah tabel multidimensional.
  • Menurut Kimball & Ross (2002: 19), tabel dimensi yaitu pendamping integral padatabel fakta
Patel & Patel (2012: 254) beropini bahwa tabel dimensi ialah kumpulan dari anggota dari suatu jenis yang mempunyai kesamaan. Dalam model multidimensional, setiap data dalam tabel fakta bekerjasama satu sama lain dengan anggota dari beberapa dimensi. Artinya, dimensi menenetukan latar belakang konsektual pada tabel fakta.

Dimensionality Modeling
Menurut Connolly & Begg (2005: 1183), Dimensionality Modeling yaitu metode logikal design yang bertujuan untuk menghadirkan data dalam bentuk standard dan intuitif yang memungkinkan pengkasesan database dengan performa yang tinggi. Beberapa konsep permodelan data warehouse pada dimensionality modeling, antara lain Star Schema, Snowflake Schema, Starflake Schema
1 Star Schema
Menurut Connolly & Begg (2005: 1183), sketsa bintang yaitu sebuah struktur logikal yang mempunyai tabel fakta di tengahnya, yang terdiri atas data faktual, dan dikelilingi oleh tabel-tabel dimensi yang meliputi tumpuan data. Skema bintang mengeksploitasi karakteristik data faktual ibarat fakta yang digenerasikan oleh events yang muncul pada waktu yang lampau dan tidak berubah. Skema bintang sanggup digunakan untuk mempercepat kinerja query dengan informasi tumpuan denormalisasi ke tabel dimensi tunggal.
2 Snowflake Schema

Menurut Connolly & Begg (2005: 1183), snowflake schema yaitu variasi lain dari star schema dimana tabel dimensi tidak meliputi data yang didenormalisasi. Pada snowflake schema, sebuah tabel dimensi sanggup mempunyai tabel dimensi lainya.
3 Starflake Schema
Menurut Connolly & Begg (2005: 1183), starflake schema ialah struktur adonan antara star schema dan snowflake schema. Beberapa dimensi mungkin menggunakan schema ini untuk memenuhi kebutuhan query yang tidak sama.

Model dimensional mempunyai beberapa kelebihan yang tidak ada dalam lingkungan data warehouse lainnya. Keuntungan model dimensional yaitu :

  • Efisiensi, struktur database yang konsisten sehingga efisien dalam mengakses data dengan menggunakan tool untuk menampilkan data termasuk laporan tertulis dan query.
  • Kemampuan untuk mengatasi perubahan kebutuhan, sketsa bintang sanggup menyesuaikan diri terhadap perubahan kebutuhan pengguna lantaran tiruana tabel dimensi mempunyai kesamaan dalam hal menyediakan saluran ke tabel fakta.
  • Extensibility, model dimensional sanggup dikembangkan. Seperti menambah tabel fakta selama data masih konsisten, menambah tabel dimensi selama ada nilai tunggal di tabel dimensi yang mendefinisikan setiap record tabel fakta yang ada, menambahkan atribut tabel dimensi, dan memecah record tabel dimensi yang ada menjadi level yang lebih rendah daripada level sebelumnya
  • Kemampuan untuk menggambarkan situasi bisnis pada umumnya, pendekatan standar untuk menangani situasi umum di dunia bisnis yang terus bertambah.
  • Proses query yang bisa diprediksi, aplikasi data warehouse yang mencari data dari level yang di bawahnya akan simpel menambahkan jumlah atribut pada tabel dimensi dari sebuah sketsa bintang. Aplikasi yang mencari data dari level yang setara akan menghubungkan tabel fakta yang terpisah melalui tabel dimensi yang sanggup diakses bersama
Metodologi Perancangan Data Warehouse
Terdapat 9 metodologi perancangan data warehouse berdasarkan Kimball yang dikutip oleh Connolly & Begg (2005: 1187) yang dikenal dengan nine-step methodology yaitu :
1. Memilih proses
Proses ini merujuk pada subjek data mart tertentu. Data mart yang dibangun pertama kali haruslah data mart yang sanggup dikerjakan dan selesai sempurna waktu, biaya yang cukup, dan menjawaban pertanyan bisnis paling penting. Pilihan terbaik untuk data mart yang pertama yaitu yang berkaitan dengan penjualan.

2. Memilih grain
Memilih grain berarti kita menetapkan secara sempurna apa yang direpresentasikan oleh record pada tabel fakta. Sebagai contoh, entittas PropertySale merepresentasikan fakta ihwal tiap-tiap penjualan properti dan menjadi tabel fakta dari star schema penjualan properti dan menjadi tabel fakta dari star schema penjualan properti. Oleh lantaran itu, grain dari tabel fakta PropertySale yaitu setiap record penjualan properti. Ketika kita sudah menentukan grain dari tabel fakta, maka kita bisa mengidentifikasikan dimensi-dimensi dari tabel fakta.

3. Identifikasi dan membuat dimensi yang sesuai
Dimensi mengatur konteks untuk mengajukan pertanyaan ihwal fakta-fakta dalam tabel fakta. Dimensi yang dirancang dengan baik membuat data mart lebih simpel dimengerti dan digunakan. Dimensi yang tidak lengkap dan kurang akan menurunkan manfaat dari sebuah data mart bagi perusahaan. Jika terdapat dimensi yang muncul dalam dua data mart, mereka harus ialah dimensi yang persis sama, atau salah satu harus ialah subset matematis dari yang lain. Hanya dengan cara ini, dua data mart sanggup saling membuatkan satu atau lebih dimensi pada aplikasi yang sama. Ketika sebuah dimensi digunakan pada lebih dari satu data mart, maka dimensi itu disebut sedang disesuaikan. Kalau dimensi tersebut tidak disinkronisasi, maka keseluruhan data warehouse akan gagal lantaran kedua data mart tidak akan sanggup digunakan secara bersama-sama.

4. Memilih fakta
Grain pada tabel fakta menentukan fakta mana yang sanggup digunakan dalam data mart. Semua fakta harus diekspresikan pada tingkat yang sudah ditetapkan oleh grain. melaluiataubersamaini kata lain, kalau grain dari tabel fakta yaitu setiap record pada penjualan properti, maka tiruana fakta numerik harus merujuk pada penjualan jenis ini. Dan juga, fakta harus berupa numerik dan hasil penjumlahan.

5. Menentukan data pre-kalkulasi dari tabel fakta
Ketika fakta sudah dipilih, maka masing-masing fakta tersebut harus diperiksa ulang untuk menentukan apakah ada kemungkinan untuk menggunakan pre-kalkulasi. misal umum akan kebutuhan menyimpan pre-kalkulasi terjadi saat terdapat fakta yang terdiri dari pernyataan keuntungan dan rugi. Situasi ini akan sering terjadi saat tabel fakta berdasarkan penjualan atau invoice.

6. Melengkapi tabel dimensi
Pada langkah ini, kita melengkapi tabel dimensi dengan menambahkan keterangan ke dalamnya. Deskripsi ini harus intuitif dan simpel dimengerti oleh pengguna.

7. Memilih durasi basis data
Kita harus menentukan seberapa jauh durasi waktu yang ditampung didalam tabel fakta. Untuk perusahaan ibarat perusahaan asuransi mengharuskan untuk menyimpan data hingga 5 tahun atau lebih. Tabel fakta yang sangat besar mengakibatkan setidaknya dua duduk kasus signifikan pada data warehouse. Pertama, semakin renta suatu data, maka akan ada duduk kasus dalam membaca dan menginterprestasikan file renta tersebut. Kedua, wajib untuk menggunakan versi usang dari dimensi penting, bukan versi yang baru. Ini dikenal sebagai duduk kasus pada slowly changing dimension.

8. Melacak dimensi yang berubah secara perlahan
Ada 3 tipe cara untuk melacak dimensi yang berubah secara perlahan, yaitu :

  • Tipe 1. Perubahan dimensi mengakibatkan data usang di-overwrite.
  • Tipe 2. Perubahan dimensi mengakibatkan pembentukan record baru.
  • Tipe 3. Perubahan dimensi mengakibatkan pembuatan atribut alternatif 
9. Menentukan prioritas dan mode dari query
Pada langkah ini, kita mempertimbangkan duduk kasus desain fisik. Permasalahan desain fisik paling kritis yang mensugesti persepsi pengguna terhadap data mart yaitu urutan fisik dari tabel fakta pada disk dan kehadiran ringkasan atau aggregation yang sudah disimpan

LihatTutupKomentar