Posting ini berisi langkah-langkah yang diperlukan untuk membuat UDF di Apache Pig. Semua UDF harus memperluas fungsi Filter dan harus berisi metode yang disebut exec, yang berisi Tuple. Logika yang diterapkan di sini adalah jika Tuple adalah null atau nol, itu akan memberi Anda nilai Boolean: True atau False. Dan 'IsofAge' untuk memeriksa apakah usia yang diberikan benar atau tidak. Logika dari User Defined Function ditulis dalam kode Java, di mana file JAR akan dibuat dan kemudian diekspor. File JAR kemudian didaftarkan. File JAR ini ditemukan di file perpustakaan Apache Pig pada saat pemuatan.
public class IsOfAge extends FilterFunc { @Mengesampingkan publicBoolean exec (Tuple tuple) throwsIOException { jika (tuple == null || tuple.size () == 0) { returnfalse } mencoba{ Objek objek = tuple.get (0) if (object == null) { returnfalse } inti = objek (Integer) jika (i == 18 || saya == 19 || saya == 21 || saya == 23 || saya == 27) { returntrue } lain{ returnfalse }} tangkap (ExecExceptione) { thrownewIOException (e) }}}
Bagaimana cara memanggil UDF Babi?
Setelah UDF dibuat, perintah berikut harus digunakan untuk mendaftarkan file JAR.
register myudf.jar X = filter A oleh IsOfAge (umur)
Langkah-langkah untuk Membuat UDF di Pig:
Ada beberapa fungsi standar di Apache Pig. Kami juga memiliki fitur untuk membuat fungsi kami sendiri yaitu User Defined Function (UDF). Pig UDF ditulis di Java dan ini membutuhkan Pig Library untuk menggunakan kelas yang telah ditentukan. Perpustakaan Apache Pig babi-0.8.0-cdh3u0-core.jar dapat diunduh dari internet.
Klik di sini untuk langkah-langkah membuat skrip Pig dengan UDF dalam Mode HDFS.
Ada pertanyaan untuk kami? Sebutkan mereka di bagian komentar dan kami akan menghubungi Anda kembali.
Posting terkait:
Apache Pig Script Dengan UDF dalam Mode HDFS
Operator di Apache Pig: Bagian 1- Operator Relasional
Operator di Apache Pig: Bagian 2 - Operator Diagnostik
apa paket di java