Instalasi Apache Pig di Linux



Blog ini adalah panduan langkah demi langkah untuk Instalasi Apache Pig di lingkungan Linux. Kami akan menginstal Apache Pig 0.16.0 dan menjalankannya dalam mode yang berbeda.

Dalam posting ini, saya akan berbicara tentang Instalasi Apache Pig di Linux . Mari kita mulai dengan definisi dasar Apache Pig dan Pig Latin.

Apache Pig adalah alat / platform untuk membuat dan menjalankan program Map Reduce yang digunakan dengan Hadoop. Ini adalah alat / platform untuk menganalisis kumpulan data yang besar. Anda dapat mengatakan, Apache Pig adalah abstraksi dari MapReduce. Programmer yang tidak begitu pandai Java biasanya kesulitan mengerjakan Hadoop, terutama saat menulis pekerjaan MapReduce.Jadi, ini adalah topik penting untuk dipelajari dan dikuasai .Apache Pig memiliki bahasanya sendiri Pig Latin yang merupakan keuntungan bagi programmer yang buruk.





Pengenalan dasar Pig Latin akan membantu Anda memahami dengan lebih baik:

Bahasa prosedural tingkat tinggi yang digunakan dalam platform Apache Pig disebut Pig Latin . Apache Pig menampilkan 'Pig Latin' yang merupakan bahasa yang relatif lebih sederhana yang dapat dijalankan di atas kumpulan data terdistribusi di Hadoop File System (HDFS). Di Apache Pig, Anda perlu menulis skrip Pig menggunakan bahasa Pig Latin, yang akan dikonversi ke pekerjaan MapReduce saat Anda menjalankan skrip Pig. Apache Pig memiliki berbagai operator yang digunakan untuk melakukan tugas-tugas seperti membaca, menulis, memproses data. Untuk mempelajari tentang operator Apache Pig, buka blog kami “ Operator di Apache Pig: Bagian 1- Operator Relasional '.

Sekarang setelah Anda memiliki pemahaman dasar tentang Apache Pig, mari kita mulai dengan Instalasi Apache Pig di Linux.



Instalasi Apache Pig di Linux:

Berikut adalah langkah-langkah untuk Instalasi Apache Pig di Linux (ubuntu / centos / windows menggunakan Linux VM). Saya menggunakan Ubuntu 16.04 di pengaturan di bawah ini.

Langkah 1: Unduh Babi ter mengajukan.

Perintah: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



Unduh Pig - Instalasi Babi - Edureka

Langkah 2: Ekstrak file ter file menggunakan perintah tar. Di bawah perintah tar, x berarti mengekstrak file arsip, dengan berarti memfilter arsip melalui gzip, f Berarti nama file dari file arsip.

apa contoh kelas di java

Perintah: tar -xzf pig-0.16.0.tar.gz

Perintah: ls

Langkah 3: Edit ' .bashrc ”Untuk memperbarui variabel lingkungan Apache Pig. Kami mengaturnya sehingga kami dapat mengakses pig dari direktori mana pun, kami tidak perlu pergi ke direktori pig untuk menjalankan perintah pig. Selain itu, jika ada aplikasi lain yang mencari Pig, ia akan mengetahui jalur Apache Pig dari file ini.

Perintah: sudo gedit .bashrc

Tambahkan yang berikut ini di akhir file:

# Setel PIG_HOME

ekspor PIG_HOME = / home / edureka / pig-0.16.0
ekspor PATH = $ PATH: /home/edureka/pig-0.16.0/bin
ekspor PIG_CLASSPATH = $ HADOOP_CONF_DIR

Selain itu, pastikan jalur hadoop juga disetel.

Jalankan perintah di bawah ini untuk membuat perubahan diperbarui di terminal yang sama.

Perintah: sumber .bashrc

Langkah 4: Periksa versi babi. Ini untuk menguji apakah Apache Pig diinstal dengan benar. Jika Anda tidak mendapatkan versi Apache Pig, Anda perlu memverifikasi apakah Anda telah mengikuti langkah-langkah di atas dengan benar.

bagaimana menginstal php 7

Perintah: babi -versi

LANGKAH 5 :Periksa bantuan babi untuk melihat semua opsi perintah babi.

Perintah: babi -membantu

LANGKAH 6 :Jalankan Pig untuk memulai cangkang kasar. Grunt shell digunakan untuk menjalankan skrip Pig Latin.

Perintah: babi

jenis fungsi di sql

Jika Anda melihat gambar di atas dengan benar, Apache Pig memiliki dua mode yang dapat dijalankan, secara default memilih mode MapReduce. Mode lain di mana Anda dapat menjalankan Pig adalah mode Lokal. Biar saya ceritakan lebih banyak tentang ini.

Mode eksekusi di Apache Pig:

  • Mode MapReduce - Ini adalah mode default, yang memerlukan akses ke cluster Hadoop dan instalasi HDFS. Karena, ini adalah mode default, tidak perlu menentukan -x flag (Anda bisa mengeksekusi babi ATAU babi -x mapreduce ). Input dan output dalam mode ini ada di HDFS.
  • Mode lokal - Dengan akses ke satu mesin, semua file diinstal dan dijalankan menggunakan host lokal dan sistem file. Di sini mode lokal ditentukan menggunakan '-x flag' ( babi -x lokal ). Input dan output dalam mode ini ada di sistem file lokal.

Perintah: babi -x lokal

Anda dapat melihat video di bawah ini untuk menonton Instalasi Apache Pig di Linux:

Instalasi Apache Pig | Instalasi Pig di Linux | Edureka

Sekarang Anda telah selesai dengan Instalasi Apache Pig di Linux, langkah selanjutnya adalah mencoba beberapa operator Pig relasional pada shell Pig Grunt. Karenanya, blog berikutnya ' Operator di Apache Pig: Bagian 1- Operator Relasional ”Akan membantu Anda menguasai operator Pig.

Sekarang Anda telah menginstal Apache Pig di Linux, lihat file oleh Edureka, perusahaan pembelajaran online tepercaya dengan jaringan lebih dari 250.000 pelajar yang puas dan tersebar di seluruh dunia. Kursus Pelatihan Sertifikasi Edureka Big Data Hadoop membantu peserta didik menjadi ahli dalam domain HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume, dan Sqoop menggunakan kasus penggunaan waktu nyata pada Ritel, Media Sosial, Penerbangan, Pariwisata, domain Keuangan.

Ada pertanyaan untuk kami? Harap sebutkan di bagian komentar dan kami akan menghubungi Anda kembali.