Pembelajaran Terbimbing Di Apache Mahout



Supervised Learning adalah teknik machine learning, yang fungsinya disimpulkan dari contoh data pelatihan yang berlabel.

Supervised Learning adalah metode dimana data pelatihan mencakup baik masukan maupun hasil yang diinginkan. Melatih sistem dengan contoh-contoh disebut pembelajaran yang diawasi. Atau, melatih algoritme dengan guru juga dapat dianggap sebagai pembelajaran yang diawasi. Setelah melatih algoritme dengan semua data sampel atau data berlabel, yang memiliki prediktor pada variabel target, seseorang dapat melatih algoritme dan menggunakan contoh yang tidak terlihat untuk klasifikasi lebih lanjut.





Berikut adalah beberapa fitur penting dari Supervised Learning di Mahout:

  • Pembangunan set pelatihan, validasi, dan pengujian (Bok) yang tepat sangat penting.
  • Metode ini biasanya cepat dan akurat.
  • Metode Supervised Learning harus bisa digeneralisasikan.
  • Mereka memberikan hasil yang benar, ketika data baru diberikan di input tanpa mengetahui aprioritarget.
  • Dalam beberapa kasus, hasil (target) yang benar diketahui dan dimasukkan ke dalam model selama proses pembelajaran.

Contoh Supervised Learning

Jika Anda ingin melatih misi dan Anda diberikan dua kelompok gambar yang berbeda bersama dengan data berlabel, mis. Pada gambar di atas, satu kelompok memiliki gambar gajah dan kelompok lainnya memiliki gambar singa. Data berlabel menyiratkan setiap kumpulan data memiliki nilai target. Pada contoh di atas, kumpulan data adalah gambar gajah, sedangkan label yang diberikan padanya, yaitu 'Gajah' adalah nilai target kumpulan data. Kumpulan data berlabel seperti itu digunakan untuk proses pelatihan, sehingga algoritme pelatihan dapat memanfaatkan kumpulan data ini dan membangun beberapa model, yang selanjutnya dapat digunakan untuk mengklasifikasikan contoh yang tidak terlihat tanpa data berlabel, atau variabel target.



Mari kita identifikasi fitur yang membantu dalam mengidentifikasi objek sebagai gajah atau singa:

Fitur-fitur bisa jadi - ukuran, warna, tinggi, ukuran tongkol, batang, gading

Ini bisa disebut kumpulan fitur, yang akan digunakan untuk tujuan pelatihan. Kumpulan fitur ini akan memengaruhi variabel target akhir. Variabel ini dikenal sebagai variabel prediktor , karena mereka membantu kami dalam menentukan variabel target akhir . Variabel terakhir juga bisa disebut label. Variabel terakhir di sini adalah Gajah / Singa.



table-word

Dalam contoh ini, setiap record dalam kategori, size, color, height, ear size, trunk dan tusk merupakan variabel prediktor, sedangkan Elephant dan Lion adalah variabel target. Variabel ini masing-masing dapat diperlakukan sebagai contoh pelatihan dan set data pelatihan.

Jadi, Supervised Learning adalah sebuah cara, di mana Anda berlatih bersama dengan label, di mana Anda meminta algoritme untuk mengekstrak fitur tertentu darinya, dan berdasarkan itu, setiap kali Anda melihat contoh yang tidak terlihat, algoritme akan dapat mengklasifikasikannya ke kelas yang tepat.

Ada pertanyaan untuk kami? Sebutkan mereka di bagian komentar dan kami akan menghubungi Anda kembali.

pivot dan univot di server sql

Posting terkait: