Arsitektur Gudang Data



Blog ini menyoroti keseluruhan arsitektur gudang data

Apa itu Data Warehouse?

Gudang Data adalah lokasi pusat di mana data gabungan dari beberapa lokasi disimpan. Gudang Data tidak dimuat setiap kali data baru dibuat tetapi pengguna akhir dapat menilai setiap kali dia membutuhkan beberapa informasi. Ada batas waktu tertentu yang ditentukan oleh bisnis tentang kapan Data Warehouse perlu dimuat baik secara harian, bulanan, atau sekali dalam tiga bulan.





Arsitektur Data Warehouse

Sistem data warehousing yang berbeda memiliki struktur yang berbeda pula. Beberapa mungkin memiliki sejumlah kecil sumber data sementara beberapa mungkin besar.

mergesort di c ++

Ada beberapa sistem transaksional, sumber 1 dan sumber lain seperti yang disebutkan pada gambar. Sumber bisa berupa SAP atau file datar dan karenanya, bisa ada kombinasi sumber. ETL (Extract, Transfer, Load) digunakan untuk memuat data warehouse di data mart. Perbedaan antara data house dan data mart adalah bahwa data warehouse digunakan di seluruh organisasi, sedangkan data mart digunakan untuk pelaporan yang disesuaikan secara individu.



Misalnya, ada beberapa departemen dalam sebuah perusahaan seperti departemen keuangan yang sangat berbeda dengan departemen pemasaran. Mereka semua mengambil data dari sumber yang berbeda dan mereka membutuhkan pelaporan yang disesuaikan. Departemen keuangan lebih memperhatikan statistik sedangkan departemen pemasaran berkaitan dengan promosi. Departemen pemasaran tidak memerlukan informasi apa pun tentang keuangan.

Untuk pelaporan yang disesuaikan, diperlukan subkumpulan data warehouse yang disebut data mart. Ada dua pendekatan untuk memuatnya. Pertama, muat gudang data dan kemudian muat mart atau sebaliknya. Dalam skenario pelaporan yang merupakan lapisan akses data, pengguna mengakses gudang data dan membuat laporan. Semua alat pelaporan ini dimaksudkan untuk membuat antarmuka depan sangat mudah bagi konsumen karena orang-orang di tingkat pengambilan keputusan tidak peduli dengan informasi teknis. Mereka terutama berkaitan dengan laporan yang dapat digunakan dengan rapi.

Oleh karena itu, semua alat pelaporan ini bekerja di bagian depan tetapi di bagian belakang, alat-alat tersebut menghasilkan kueri dan mencapai database dan pengguna mendapatkan laporan tepat pada waktunya. Alat pelaporan ini dapat menjadwalkan pekerjaan untuk dijalankan dan menghasilkan laporan.



Ada pertanyaan untuk kami? Harap sebutkan di bagian komentar dan kami akan menghubungi Anda kembali.

Posting terkait:

__init__ dengan python