4 Alasan Praktis untuk Mempelajari Hadoop 2.0



4 alasan untuk meningkatkan ke Hadoop 2.0 ini berbicara tentang pasar kerja Hadoop dan bagaimana hal itu dapat membantu Anda mempercepat karier dengan membuat Anda terbuka terhadap peluang kerja yang besar.

Ketika saya masih muda saya dulu menyukai film seri Star Wars. Saya sangat menyukainya sehingga saya memiliki kaset video ini masing-masing dan semuanya. Saya biasa mengawasi mereka berulang kali. Kemudian datanglah waktu pemutar DVD dan saya harus mendapatkan film-film ini lagi dalam bentuk DVD. Saya tidak ragu untuk membeli seluruh set lagi dalam DVD karena saya ingin merasakan teknologi baru dan terus menikmati film favorit saya juga. Hal-hal hebat sampai teknologi baru lainnya, Blu-ray muncul. Setelah membeli film dua kali, saya tidak ingin membelinya lagi. Untuk beberapa waktu saya tidak berusaha untuk 'memperbarui' diri saya, berpikir bahwa saya akan baik-baik saja tanpa teknologi ini. Dan saya melakukannya dengan baik. Lagipula itu tidak mempengaruhi hidup saya. Tetapi saya dapat melihat perubahan tren dan tidak dapat membagikan film saya dengan teman-teman saya, seperti yang mereka lakukan satu sama lain. Saya benar-benar merasa tersisih.





Saya akhirnya keluar dan mendapatkan film dalam Blu-ray. Saya mengingatnya bukan karena saya suka filmnya, tetapi karena fakta bahwa kualitas videonya luar biasa. Dan yang terpenting, saya mendapatkan seluruh rangkaian film dalam satu Disk Blu-ray.

Kebutuhan atau dorongan untuk selalu diperbarui adalah yang paling kuat dalam hal profesi kami karena risikonya lebih besar. Menjadi penting untuk tetap di atas permainan Anda.



4 Alasan Praktis untuk Mempelajari Hadoop 2.0:

Meskipun tidak dapat dihindari, tetap mengikuti perkembangan pekerjaan kita telah menjadi bagian penting dari kehidupan kita. Walaupun kedengarannya menakutkan, Anda tidak perlu khawatir karena teknologi tidak benar-benar berubah secepat atau secara drastis. Tetapi pembicaraan dan informasi tentang teknologi ini dan hal-hal yang dapat kita lakukan dengannya semakin terlihat. Berikut beberapa alasan mengapa Anda harus selalu mendapatkan informasi terbaru:

# 1: Jangan Tertangkap

Alasan Mempelajari Hadoop 2.0



Tidak memperhatikan pembaruan terkini dalam suatu teknologi dapat membuat Anda terlihat seperti rusa yang terjebak dalam lampu depan. Bukan gambaran yang jelas tentang kemampuan profesional Anda. Menjadi up-to-date akan membuat Anda dihormati oleh rekan-rekan Anda karena keterampilan profesional Anda. Mungkin tidak ada kebutuhan untuk menerapkan setiap hal baru yang Anda pelajari tetapi menyadari pembaruan itu sangat penting.

Misalnya, saat ada pembicaraan di Hadoop, Anda dapat memberi tahu rekan Anda bahwa Hadoop 2.5.0 memiliki peningkatan otentikasi saat menggunakan server proxy HTTP. Dan juga di versi Hadoop yang sama, ada ketentuan untuk menulis langsung ke Graphite.

Menjadi penting untuk mengetahui pembaruan terkini ketika organisasi berpikir untuk bermigrasi ke Hadoop. Dan 'mengetahui' dapat membuat perbedaan besar pada karier Anda.

# 2: Memiliki Keunggulan Kompetitif

Profesional yang terampil di bidangnya dihormati. Dan tetap up-to-date adalah cara terbaik untuk menjadi yang teratas. Kebutuhan Anda untuk tetap diperbarui mencerminkan hasrat Anda terhadap pekerjaan Anda. Dengan mengembangkan keahlian dalam pekerjaan dan industri Anda, Anda akan mendapatkan kepercayaan dan rasa hormat dari orang-orang di sekitar Anda. Dari perspektif kepemimpinan, ini sangat berharga!

Bahkan jika organisasi Anda masih bekerja dengan Hadoop 1.0, mengetahui semua fitur terbaru dari Hadoop 2 akan membuat Anda tetap pada jalurnya karena relatif baru dan pasti lebih baik. Menjadi orang pertama yang mempelajari ini akan memberi Anda keunggulan atas teman-teman Anda.

# 3: Peluang Baru

Sungguh kenyataan yang menyedihkan bahwa peran kami saat ini terus berubah. Seiring waktu datang tanggung jawab dan kesempatan tambahan untuk melakukan tugas-tugas baru. Dengan terus mengikuti perkembangan tren industri, Anda berada di posisi terbaik untuk memanfaatkan peluang ini.

Perusahaan seperti Macy's, Lockheed Martin, California Creative Solutions, Capital One, CSpring, CACI International Inc., Oracle, Yahoo !, American Express, BlueHawk, Aetna, Lawrence Livermore National Laboratory, dan banyak lagi mencari orang yang ahli dalam fitur terbaru dari Hadoop 2, seperti YARN.

# 4: Buat Keputusan yang Lebih Baik

Informasi tambahan akan memungkinkan Anda membuat pilihan berdasarkan informasi dan keputusan yang lebih baik. Ini akan membantu Anda mengenali peluang dan menambah nilai pada strategi organisasi Anda.

system.exit (0)

Hadoop 2 memiliki fitur yang meningkatkan kecepatan sekaligus menghemat biaya. Menyarankan opsi untuk meningkatkan kinerja dan meningkatkan kecepatan pasti dapat meningkatkan produktivitas organisasi. Berikut adalah beberapa fitur Hadoop 2 yang akan menguntungkan organisasi dan menyarankan fitur tersebut untuk meningkatkan karier Anda juga.

  • Dukungan untuk menjalankan Hadoop di Microsoft Windows

  • Distribusi biner MapReduce yang disederhanakan melalui HDFS di YARN Distributed Cache.

  • Peningkatan dukungan untuk aplikasi baru di YARN dengan Application History Server dan Application Timeline Server

  • Dukungan HTTPS lengkap dalam HDFS

  • Integrasi Kerberos untuk penyimpanan timeline YARN.

  • Dukungan untuk hierarki Penyimpanan heterogen di HDFS.

  • Cache dalam memori untuk data HDFS dengan administrasi dan manajemen terpusat.

  • Distribusi biner MapReduce yang disederhanakan melalui HDFS di YARN Distributed Cache.

Ada lebih dari sekadar alasan praktis untuk tetap diperbarui. Ada juga alasan teknis. Hadoop memiliki banyak fitur yang bermanfaat bagi organisasi. Melihat lebih dalam pada mereka akan memberi Anda gambaran yang jelas tentang apa yang menguntungkan.

Apa pembaruan terbaru di Hadoop?

Setiap produk melewati berbagai tahap rilis dan menghasilkan versi yang berbeda-beda. Hadoop tidak terkecuali dan telah hadir dengan Hadoop 2.0. Yayasan Apache telah menghasilkan versi Hadoop berikutnya seperti Hadoop 2.1.0, Hadoop 2.4.0 dan telah mencapai Hadoop 2.5.1, yang merupakan versi terbaru yang dirilis pada September 2014.

Mengapa Hadoop 2 dirilis?

Dengan versi baru hadir fitur tambahan dan bug yang diperbaiki. Jadi setiap kali Anda menggunakan versi Hadoop tertentu dan berpikir bahwa fitur tertentu dapat ditambahkan atau beberapa bug perlu diperbaiki, Anda memberi tahu orang-orang di yayasan Apache tentangnya. Orang-orang ini pada gilirannya mengerjakannya dan memberi Anda produk yang lebih baik di versi berikutnya.

Hadoop 2 - Bukan Hanya Angka

Hadoop 2 bukan hanya versi terbaru dari Hadoop. Pada umumnya, ini adalah arsitektur generasi kedua. Arun Murthy, pendiri dan arsitek di distributor Hadoop, Hortonworks, menegaskan bahwa perbedaan itu penting karena jumlah rekayasa ulang yang diperlukan untuk memindahkan Hadoop melampaui pemrosesan batch dan ke dunia analitik waktu nyata sangat besar.

Mari kita bahas betapa berbedanya Hadoop 2.0 dari pendahulunya Hadoop 1.0. Jelas, versi rilis yang lebih baru akan lebih unggul daripada rilis sebelumnya. Berikut ini adalah empat peningkatan utama dalam Hadoop 2.0 dibandingkan Hadoop 1.x:

  • Federasi HDFS - Skalabilitas horizontal NameNode

  • Ketersediaan Tinggi NameNode - NameNode bukan lagi Titik Kegagalan Tunggal

  • YARN - Kemampuan untuk memproses Terabytes dan Petabytes data yang tersedia di HDFS menggunakan aplikasi Non-MapReduce seperti MPI, GIRAPH

  • Resource Manager - Membagi dua fungsi utama JobTracker yang terbebani (manajemen sumber daya dan penjadwalan / pemantauan pekerjaan) menjadi dua daemon terpisah: Manajer Sumber Daya global dan ApplicationMaster per aplikasi

Ada fitur tambahan seperti Penjadwal Kapasitas (Aktifkan dukungan Multi-tenancy di Hadoop), Snapshot Data, Dukungan untuk Windows, akses NFS, yang memungkinkan peningkatan adopsi Hadoop di Industri untuk memecahkan masalah Big Data.

Hadoop 2.X Vs Hadoop 1.X

Mari kita lakukan perbandingan kecil dan lihat dalam hal apa Hadoop 2.0 lebih baik dan berbeda dari Hadoop 1.0

Mengapa Hadoop 2 lebih disukai daripada Hadoop 1.0?

Hadoop 2.0 menawarkan peningkatan kinerja yang menguntungkan teknologi terkait di ekosistem Hadoop. Selain fitur-fitur inovatif dari HDFS dan arsitektur generasi kedua (YARN), ada alasan yang semakin banyak untuk memilih Hadoop 2 daripada Hadoop 1.0:

  • Hadoop 2 tidak lagi memiliki batasan bahasa. Artinya, berbagai profesional sekarang dapat menggunakan Hadoop.

  • Dengan Hadoop 2, kendala seperti kekurangan pembuat kode MapReduce teratasi.

  • 2 kali lebih cepat dari Hadoop 1.0

  • 2 kali ROI dengan perangkat keras yang ada.

  • Dengan YARN, antarmuka pemrograman aplikasi jauh lebih terbuka dan fleksibel.

  • Hadoop 2 memperluas kemungkinan penggunaan Hadoop dalam proyek Big Data.

  • Dengan Hadoop 2, developer sekarang dapat melakukan berbagai macam tugas pemrosesan data, di luar cakupan pemrosesan batch Hadoop sebelumnya.

  • Menawarkan peluang baru untuk manajer informasi dan mengatasi kekurangan di versi sebelumnya.

  • Rilis baru ini memiliki fitur unik dalam menjalankan beberapa beban kerja di cluster Hadoop yang sama.

  • Hadoop tidak lagi dibatasi pada satu fitur. Aplikasinya sekarang melampaui HDFS dan MapReduce.

Manfaat Utama BENANG

Kami menyadari YARN adalah arsitektur generasi kedua, mari kita lihat apa yang membuatnya begitu hebat.

  • Skala

  • Model dan layanan Pemrograman baru

  • Penggunaan cluster yang ditingkatkan

  • Kelincahan

  • Lebih dari Jawa

  • Dan masih banyak lagi

Permintaan Keterampilan Hadoop 2

Organisasi sekarang meluncurkan atau bereksperimen dengan Hadoop 2. Akibatnya, ada kebutuhan akan tenaga profesional yang ahli dalam Hadoop 2. Banyak organisasi telah mulai mencari secara internal orang untuk bekerja dengan Hadoop. Ada indikasi jelas bahwa YARN sedang naik daun dan pada akhirnya akan menggantikan permintaan akan skill MapReduce.

Berikut adalah beberapa pandangan tentang permintaan saat ini dan yang diproyeksikan untuk keterampilan Hadoop:

  • Menurut analis dari Gartner, Hadoop 2 adalah perkembangan penting karena perusahaan besar di seluruh dunia telah menganggap Hadoop sebagai pengubah permainan dalam manajemen Big Data mereka.

  • Menurut Eric Kavanagh, dari grup Bloor, Hadoop 2.0 telah mendapatkan daya tarik di antara pekerja informasi yang berusaha untuk melawan Big Data.

  • Adopsi Hadoop 2.0 terus meningkat dan kini memasuki tahap kedewasaan.

  • Organisasi menyadari manfaat YARN dan bersemangat karenanya.

Berikut adalah cuplikan lowongan pekerjaan untuk Hadoop 2.0 / YARN masuk Memang.com

Siapa yang pindah ke Hadoop 2 atau sudah punya?

Yahoo:

Yahoo! , pemimpin dalam segala hal yang telah diterapkan Hadoop YARN (0.23.x). Menurut Murthy, 35.000 node cluster Yahoo sekarang memproses 130-150 pekerjaan per hari dibandingkan dengan 50-60 sebelum YARN.

Saat berbicara tentang kinerja luar biasa, Murthy mengutip, 'Ketika Anda mendapatkan 2x lebih dari 35.000 hingga 40.000 node, itu fenomenal'. Dia juga menambahkan, 'Ini adalah cerita yang cukup menarik untuk memberi tahu CIO bahwa jika Anda hanya meningkatkan perangkat lunak Anda dari Hadoop 1 ke Hadoop 2, Anda akan melihat 2 kali peningkatan throughput dalam pekerjaan Anda.'

eBay:

eBay memiliki salah satu cluster Hadoop terbesar di industrinya, dengan datanya dalam petabyte. Mereka juga telah memigrasikan clusternya ke Hadoop 2.

Kesimpulan:

Dengan Hadoop 2 yang matang dan lebih mudah diterapkan, mereka bahkan meyakinkan para skeptis dan semakin banyak organisasi yang bermigrasi ke Hadoop 2.0. Ada alasan yang valid untuk menghindari versi 1.x. Tetapi dengan Hadoop 2, bahkan orang-orang kafir pun mempertimbangkannya karena dapat digunakan untuk berbagai kegunaan. Mempelajari Hadoop 2.0 dan menerapkannya untuk melakukan penghitungan pada Big Data, Anda akan membuka gerbang menuju karier yang maju secara teknis dan menguntungkan secara finansial.

Ada pertanyaan untuk kami? Harap sebutkan di bagian komentar dan kami akan menghubungi Anda kembali.

Posting terkait:

Seberapa penting pelatihan Hadoop?