Tinjauan Arsitektur Penyimpanan HBase



Ada arsitektur Penyimpanan HBase terdiri dari banyak komponen. Mari kita lihat fungsi dari komponen-komponen ini dan ketahui bagaimana data ditulis.

Apache HBase adalah database open-source, terdistribusi, non-relasional yang dimodelkan setelah Bigtable Google dan ditulis di Java. Ini memberikan kemampuan yang mirip dengan Bigtable di atas Hadoop dan HDFS (Hadoop Distributed Filesystem) yaitu menyediakan cara yang toleran terhadap kesalahan untuk menyimpan data jarang dalam jumlah besar, yang umum dalam banyak kasus penggunaan data besar. HBase digunakan untuk akses baca / tulis waktu nyata ke Big Data.





Arsitektur Penyimpanan HBase terdiri dari banyak komponen. Mari kita lihat fungsi dari komponen ini dan mengetahui bagaimana data ditulis.

HFiles:



HFiles membentuk arsitektur HBase tingkat rendah. HFiles adalah file penyimpanan yang dibuat untuk menyimpan data HBase dengan cepat dan efisien.

panjang javascript dari sebuah array

HMaster:

HMaster bertanggung jawab untuk menetapkan wilayah ke setiap HRegionServer saat HBase dimulai. Ini bertanggung jawab untuk mengelola segala sesuatu yang berhubungan dengan baris, tabel dan kegiatan koordinasi mereka. Hmaster juga memiliki rincian metadata.



Komponen dari HBase:

HBase memiliki komponen berikut:

  • Tabel - Terdiri dari Wilayah
  • Region - Rentang baris yang disimpan bersama
  • Server Wilayah - Melayani satu atau lebih wilayah
  • Master Server - Daemon bertanggung jawab untuk mengelola cluster HBase

HBase menyimpan data langsung ke HDFS dan sangat bergantung pada Ketersediaan Tinggi dan Toleransi Kesalahan HDFS.

Arsitektur Penyimpanan HBase:

Arsitektur Penyimpanan HBase

Alur umumnya adalah bahwa Klien menghubungi Zookeeper terlebih dahulu untuk menemukan kunci baris tertentu. Itu dilakukan dengan mengambil nama server dari Zookeeper. Dengan informasi ini sekarang dapat meminta server tersebut untuk mendapatkan server yang menyimpan metatabel. Kedua detail ini disimpan dalam cache dan hanya dicari sekali. Terakhir, ia dapat meminta metaserver dan mengambil server yang memiliki baris yang dicari klien.

Setelah mengetahui di wilayah mana baris tersebut berada, ia juga menyimpan informasi ini dan menghubungi HRegionServer secara langsung. Jadi seiring waktu, Klien memiliki informasi lengkap tentang dari mana mendapatkan baris tanpa perlu menanyakan metaserver lagi. Ketika HRegion dibuka, ia menyiapkan instance Store untuk setiap HColumnFamily untuk setiap tabel. Data ditulis ketika Klien mengeluarkan permintaan ke HRegionServer yang memberikan detail ke mesin virtual HRegion yang cocok. Langkah pertama adalah kita harus memutuskan apakah data harus terlebih dahulu ditulis ke 'Write-Ahead-Log' (WAL) yang diwakili oleh kelas HLog. Keputusan didasarkan pada bendera yang ditetapkan oleh klien.
Setelah data ditulis ke WAL, data tersebut ditempatkan di MemStore. Pada saat yang sama, Memstore akan diperiksa apakah penuh dan dalam hal ini pengosongan ke disk diminta. Kemudian data tersebut ditulis ke HFile.

Ada pertanyaan untuk kami? Sebutkan mereka di bagian komentar dan kami akan menghubungi Anda kembali.

posting terkait

Wawasan tentang Arsitektur HBase