Apa Itu Bias-Varians Dalam Pembelajaran Mesin?



Artikel ini membahas konsep bias dan varians dalam pembelajaran mesin dengan hubungan di antara keduanya yang menentukan akurasi prediksi model.

Di , performa model didasarkan pada prediksinya dan seberapa baik model tersebut digeneralisasikan ke arah data independen yang tidak terlihat. Salah satu cara untuk mengukur akurasi model adalah dengan memperhitungkan bias dan varians dalam model tersebut. Dalam artikel ini, kita akan mempelajari bagaimana bias-variance memainkan peran penting dalam menentukan keaslian model. Topik berikut dibahas dalam artikel ini:

Kesalahan Tidak Dapat Disederhanakan

Model apa pun di dinilai berdasarkan kesalahan prediksi pada kumpulan data baru yang independen dan tidak terlihat. Kesalahan tidak lain adalah perbedaan antara keluaran aktual dan keluaran yang diprediksi. Untuk menghitung kesalahan, kita melakukan penjumlahan dari kesalahan yang dapat direduksi dan tidak dapat direduksi a.k.a dekomposisi bias-varians.





Kesalahan yang tidak dapat dipulihkan tidak lain adalah kesalahan yang tidak dapat dikurangi apa pun yang Anda gunakan dalam model. Hal tersebut disebabkan oleh variabel luar biasa yang memiliki pengaruh langsung terhadap variabel keluaran. Jadi untuk membuat model Anda efisien, kami memiliki kesalahan yang dapat direduksi yang harus kami optimalkan dengan segala cara.

Kesalahan yang dapat direduksi memiliki dua komponen - Bias dan Varians , adanya bias dan varians memengaruhi keakuratan model dalam beberapa cara seperti overfitting, underfitting , dll.Mari kita lihat bias dan varians untuk memahami bagaimana menangani kesalahan yang dapat direduksi dalam .



Apa Bias Dalam Pembelajaran Mesin?

Bias pada dasarnya adalah seberapa jauh kita telah memprediksikan nilai dari nilai sebenarnya. Kami mengatakan bias terlalu tinggi jika prediksi rata-rata jauh dari nilai sebenarnya.

Bias yang tinggi akan menyebabkan algoritme kehilangan pola atau hubungan dominan antara variabel masukan dan keluaran. Ketika bias terlalu tinggi, diasumsikan bahwa model tersebut cukup sederhana dan tidak memahami kompleksitas kumpulan data untuk menentukan hubungan dan dengan demikian,menyebabkan underfitting.

Varians Dalam Model Pembelajaran Mesin?

Di kumpulan data independen yang tidak terlihat atau kumpulan validasi. Jika model tidak bekerja sebaik yang dilakukannya dengan kumpulan data yang dilatih, ada kemungkinan model tersebut memiliki varians. Ini pada dasarnya memberi tahu seberapa tersebar nilai prediksi dari nilai sebenarnya.



Varians tinggi dalam kumpulan data berarti bahwa model telah dilatih dengan banyak noise dan data yang tidak relevan. Sehingga menyebabkan terjadinya overfitting pada model. Jika model memiliki varian yang tinggi, model tersebut menjadi sangat fleksibel dan membuat prediksi yang salah untuk titik data baru. Karena telah menyetel dirinya sendiri ke titik data set pelatihan.

Mari kita juga mencoba memahami konsep bias-variance secara matematis. Misalkan variabel yang kita prediksi menjadi Y dan variabel independen lainnya menjadi X. Sekarang mari kita asumsikan ada hubungan antara kedua variabel sedemikian rupa sehingga:

Y = f (X) + e

Dalam persamaan di atas, Sini aku s adalah perkiraan kesalahan dengan nilai rata-rata 0. Ketika kita membuat pengklasifikasi menggunakan algoritma seperti regresi linier , , dll., kesalahan kuadrat yang diharapkan pada titik x akan menjadi:

err (x) = Bias2+ Varians + kesalahan yang tidak dapat direduksi

pl tutorial pengembang sql untuk pemula

Mari kita juga memahami bagaimana Bias-Varians akan mempengaruhi a Pembelajaran mesin kinerja model.

cara menggunakan replace di java

Bagaimana Pengaruhnya terhadap Model Machine Learning?

Kita dapat menempatkan hubungan antara bias-variance dalam empat kategori yang tercantum di bawah ini:

  1. Varians Tinggi-Bias Tinggi - Model rata-rata tidak konsisten dan juga tidak akurat
  2. Varians Rendah-Bias Tinggi - Model konsisten tetapi rata-rata rendah
  3. Varians Tinggi-Bias Rendah - Rata-rata agak akurat tetapi tidak konsisten
  4. Varians Rendah-Bias Rendah - Ini adalah skenario ideal, model rata-rata konsisten dan akurat.

bias-variance dalam pembelajaran mesin-edureka

Meskipun mendeteksi bias dan varians dalam suatu model cukup jelas. Model dengan varian tinggi akan memiliki kesalahan pelatihan rendah dan kesalahan validasi tinggi. Dan dalam kasus bias tinggi, model akan memiliki kesalahan pelatihan tinggi dan kesalahan validasi sama dengan kesalahan pelatihan.

Meskipun pendeteksian tampaknya mudah, tugas sebenarnya adalah menguranginya seminimal mungkin. Dalam hal ini, kita dapat melakukan hal berikut:

  • Tambahkan lebih banyak fitur masukan
  • Lebih banyak kerumitan dengan memperkenalkan fitur polinomial
  • Kurangi istilah regularisasi
  • Mendapatkan lebih banyak data pelatihan

Sekarang kita tahu apa itu bias dan varians dan bagaimana pengaruhnya terhadap model kita, mari kita lihat trade-off bias-variance.

Trade-Off Bias-Varians

Menemukan keseimbangan yang tepat antara bias dan varians model disebut trade-off Bias-Varians. Ini pada dasarnya adalah cara untuk memastikan model tidak terlalu pas atau kurang pas dalam hal apa pun.

Jika model terlalu sederhana dan memiliki sangat sedikit parameter, model akan mengalami bias tinggi dan varians rendah. Di sisi lain, jika model memiliki parameter dalam jumlah besar, model tersebut akan memiliki varian yang tinggi dan bias yang rendah. Pertukaran ini harus menghasilkan hubungan yang sangat seimbang antara keduanya. Idealnya, bias rendah dan varian rendah adalah target untuk model Pembelajaran Mesin apa pun.

Kesalahan Total

Dalam model Machine Learning apa pun, keseimbangan yang baik antara bias dan varians berfungsi sebagai skenario sempurna dalam hal akurasi prediksi dan menghindari overfitting, underfitting sama sekali. Keseimbangan optimal antara bias dan varians, dalam hal kompleksitas algoritme, akan memastikan bahwa model tidak pernah overfitted atau underfitted sama sekali.

Rata-rata kesalahan kuadrat dalam model statistik dianggap sebagai jumlah dari bias kuadrat dan varians dan varians kesalahan. Semua ini dapat dimasukkan ke dalam kesalahan total di mana kita memiliki bias, varians, dan kesalahan yang tidak dapat direduksi dalam model.

Mari kita pahami bagaimana kita bisa mengurangi total error dengan bantuan implementasi praktis.

Kami telah membuat pengklasifikasi regresi linier dalam Regresi Linier dalam Pembelajaran Mesin artikel tentang Edureka menggunakan kumpulan data diabetes dalam modul dataset scikit belajar Perpustakaan.

seri fibonacci rekursi di Jawa

Ketika kami mengevaluasi kesalahan kuadrat rata-rata dari pengklasifikasi, kami mendapatkan kesalahan total sekitar 2500.

Untuk mengurangi kesalahan total, kami memasukkan lebih banyak data ke pengklasifikasi dan sebagai imbalannya, kesalahan kuadrat rata-rata dikurangi menjadi 2000.

Ini adalah implementasi sederhana untuk mengurangi total error dengan memasukkan lebih banyak data pelatihan ke model. Demikian pula, kita dapat menerapkan teknik lain untuk mengurangi kesalahan dan menjaga keseimbangan antara bias dan varians untuk model Machine Learning yang efisien.

Ini membawa kita ke akhir artikel ini di mana kita telah mempelajari Bias-Varians di Machine Learning dengan implementasi dan use case-nya. Saya harap Anda jelas dengan semua yang telah dibagikan dengan Anda dalam tutorial ini.

Jika Anda merasa artikel tentang 'Bias-Varians Dalam Pembelajaran Mesin' ini relevan, lihat perusahaan pembelajaran online tepercaya dengan jaringan lebih dari 250.000 pelajar puas yang tersebar di seluruh dunia.

Kami di sini untuk membantu Anda dengan setiap langkah dalam perjalanan Anda dan menghasilkan kurikulum yang dirancang untuk siswa dan profesional yang ingin menjadi . Kursus ini dirancang untuk memberi Anda permulaan dalam pemrograman Python dan melatih Anda untuk konsep inti dan lanjutan Python bersama dengan berbagai Suka , , dll.

Jika Anda menemukan pertanyaan, silakan ajukan semua pertanyaan Anda di bagian komentar 'Bias-Varians Dalam Pembelajaran Mesin' dan tim kami akan dengan senang hati menjawabnya.