Apa Prasyarat Untuk Pembelajaran Mesin?



Blog tentang prasyarat untuk Machine Learning ini akan membantu Anda memahami konsep dasar yang perlu Anda ketahui sebelum memulai Machine Learning.

Machine Learning tidak diragukan lagi adalah teknologi yang paling banyak diminati saat ini! Jika Anda seorang pemula yang memulai dengan Machine Learning, Anda harus mengetahui prasyarat untuk Machine Learning. Blog ini akan membantu Anda memahami berbagai konsep yang perlu Anda ketahui sebelum memulai Machine Learning.

Untuk mendapatkan pengetahuan mendalam tentang Kecerdasan Buatan dan Pembelajaran Mesin, Anda dapat mendaftar secara langsung oleh Edureka dengan dukungan 24/7 dan akses seumur hidup.





Berikut daftar topiknya tercakup dalam blog ini:

  1. Prasyarat untuk Machine Learning
  2. Memahami Machine Learning dengan kasus penggunaan

Prasyarat Untuk Pembelajaran Mesin

Untuk memulaiPembelajaran Mesin, Anda harus terbiasa dengan konsep berikut:



  1. Statistik
  2. Aljabar linier
  3. Kalkulus
  4. Kemungkinan
  5. Bahasa pemrograman

Statistik

Statistik berisi alat yang dapat digunakan untuk mendapatkan beberapa hasil dari data. Ada statistik deskriptif yang digunakan untuk mengubah data mentah menjadi beberapa informasi penting. Selain itu, statistik inferensial dapat digunakan untuk mendapatkan informasi penting dari sampel data daripada menggunakan kumpulan data lengkap.

Untuk mempelajari lebih lanjut tentang Statistik Anda dapat melalui blog berikut:

Aljabar linier

Kesepakatan aljabar linierdengan vektor, matriks, dan transformasi linier. Ini sangat penting dalam pembelajaran mesin karena dapat digunakan untuk mengubah dan melakukan operasi pada kumpulan data.



Kalkulus

Kalkulus adalah bidang penting dalam matematika dan memainkan peran integral dalam banyak algoritme pembelajaran mesin. Kumpulan data yang memiliki banyak fitur adalahdigunakan untuk membangun model pembelajaran mesin sebagai fitur beberapa kalkulus multivariabel memainkan peran penting untuk membangun model pembelajaran mesin. Integrasi dan Diferensiasi adalah suatu keharusan.

Kemungkinan

Probabilitas membantu memprediksi kemungkinan kejadian, Ini membantu kita untuk bernalar situasi mungkin atau mungkin tidak terjadi lagi. Untuk pembelajaran mesin, probabilitas adalah a dasar.

Mathematics

cara menggunakan metode tostring di java

Untuk mempelajari lebih lanjut tentang Probabilitas, Anda dapat melalui ini Blog.

Bahasa pemrograman

Sangat penting untuk mengetahui bahasa pemrograman seperti R dan Python untuk mengimplementasikan seluruh proses Machine Learning. Python dan R keduanya menyediakan pustaka bawaan yang membuatnya sangat mudah untuk mengimplementasikan algoritma Pembelajaran Mesin.

Selain memiliki pengetahuan pemrograman dasar, penting juga bagi Anda untuk mengetahui cara mengekstrak, memproses, dan menganalisis data. Ini adalah salah satu keterampilan terpenting yang dibutuhkan untuk Pembelajaran Mesin.

Untuk mempelajari lebih lanjut tentang pemrograman bahasa untuk Machine Learning, Anda dapat mengunjungi blog berikut:

  1. Library Python Terbaik Untuk Ilmu Data Dan Pembelajaran Mesin

Kasus Penggunaan Machine Learning

Pembelajaran mesin adalah tentang membuat algoritma yang dapat belajar dari data untuk membuat prediksi seperti jenis objek yang ada di gambar, atau mesin rekomendasi, kombinasi obat terbaik untuk menyembuhkan penyakit tertentu atau penyaringan spam.

Pembelajaran mesin dibangun di atas prasyarat matematika dan jika Anda tahu mengapa matematika digunakan dalam pembelajaran mesin, itu akan membuatnya menyenangkan. Anda perlu mengetahui matematika di balik fungsi yang akan Anda gunakan dan model mana yang cocok untuk data dan mengapa.

Jadi mari kita mulai dengan masalah menarik tentang memprediksi harga rumah, memiliki kumpulan data yang berisi riwayat berbagai fitur dan harga, untuk saat ini, kita akan mempertimbangkan luas ruang hidup dalam kaki persegi dan harga.

Sekarang kami memiliki kumpulan data yang berisi dua kolom seperti yang ditunjukkan di bawah ini:

Harus ada korelasi antara kedua variabel ini untuk mengetahui bahwa kita perlu membangun model yang dapat memprediksi harga rumah, bagaimana kita melakukannya?

Mari buat grafik data ini dan lihat bagaimana tampilannya:

Di sini sumbu X adalah harga per kaki persegi ruang hidup dan sumbu Y adalah harga rumah. Jika kita memplot semua titik data kita akan mendapatkan sebar plot yang dapat diwakili oleh garis seperti yang ditunjukkan pada gambar di atas dan jika kita memasukkan beberapa data maka akan memprediksi beberapa hasil. Idealnya, kita harus menemukan garis yang akan memotong titik data maksimum.

Di sini kami mencoba membuat garis yang disebut sebagai:

Y = mX + c

Metode memprediksi hubungan linier antara target (variabel terikat) dan variabel prediktor (variabel bebas) disebut sebagai regresi linier. Ini memungkinkan kita untuk mempelajari dan meringkas hubungan antara dua variabel.

  • X = Variabel independen
  • Y = Variabel terikat
  • c = perpotongan y
  • m = Slop garis

Jika kita mempertimbangkan persamaan, kita memiliki nilai X yang merupakan variabel independen, jadi yang harus kita lakukan adalah menghitung nilai m dan c untuk memprediksi nilai Y.

Jadi bagaimana kita menemukan variabel-variabel ini?

Untuk menemukan variabel ini, kita dapat mencoba sekumpulan nilai dan mencoba menemukan garis yang memotong jumlah maksimum titik data. Tapi, bagaimana kita bisa menemukan garis yang paling cocok?

Jadi untuk mencari garis yang paling sesuai, kita dapat menggunakan fungsi kesalahan kuadrat terkecil yang akan menemukan kesalahan antara nilai riil y dan nilai prediksi y`.

Fungsi error kuadrat terkecil dapat direpresentasikan menggunakan persamaan berikut:

Dengan menggunakan fungsi ini kita dapat mengetahui kesalahan untuk setiap titik data yang diprediksi dengan membandingkannya dengan nilai titik data yang sebenarnya. Anda kemudian mengambil penjumlahan dari semua kesalahan ini dan mengkuadratkannya untuk mencari penyimpangan dalam prediksi.

Jika kita menambahkan sumbu ketiga ke grafik kita yang berisi semua kemungkinan nilai kesalahan dan memplotnya dalam ruang 3-Dimensi, akan terlihat seperti ini:

Pada gambar di atas, nilai ideal berada di bagian hitam bawah yang akan memprediksi harga mendekati titik data aktual. Langkah selanjutnya adalah mencari nilai terbaik untuk m dan c. Ini dapat dilakukan dengan menggunakan teknik pengoptimalan yang disebut penurunan gradien.

Penurunan gradien adalah metode berulang, di mana kita mulai dengan menginisialisasi beberapa set nilai untuk variabel kita dan memperbaikinya secara perlahan dengan meminimalkan kesalahan antara nilai aktual dan nilai prediksi.

Sekarang jika kita berpikir secara praktis harga apartemen tidak terlalu bergantung hanya pada harga per kaki persegi, ada banyak faktor seperti jumlah kamar tidur, kamar mandi, dll. Jika kita mempertimbangkan fitur-fitur itu juga maka persamaannya akan terlihat. seperti ini

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

apa yang bersambung di java

Ini adalah regresi multilinear yang termasuk dalam aljabar linier, di sini kita dapat menggunakan matriks berukuran mxn dimana m adalah fitur dan n adalah titik data.

Mari kita pertimbangkan situasi lain dimana kita dapat menggunakan probabilitas untuk mengetahui kondisi rumah untuk mengklasifikasikan rumah berdasarkan kondisinya baik atau buruk. Untuk ini, untuk bekerja kita harus menggunakan teknik yang disebut Regresi Logistik yang bekerja pada kemungkinan kejadian yang diwakili oleh fungsi sigmoid.

Dalam artikel ini, kami membahas prasyarat machine learning dan cara penerapannya dalam machine learning. Jadi pada dasarnya terdiri dari statistika, kalkulus, aljabar linier, dan teori probabilitas. Kalkulus memiliki teknik yang digunakan untuk pengoptimalan, aljabar linier memiliki algoritme yang dapat bekerja pada kumpulan data yang sangat besar, dengan probabilitas kami dapat memprediksi kemungkinan kemunculan dan statistik membantu kami menyimpulkan wawasan yang berguna dari sampel kumpulan data.

Setelah Anda mengetahui Prasyarat untuk Machine Learning, saya yakin Anda penasaran untuk mempelajari lebih lanjut. Berikut beberapa blog yang akan membantu Anda memulai Ilmu Data:

Jika Anda ingin mendaftar untuk kursus lengkap tentang Kecerdasan Buatan dan Pembelajaran Mesin, Edureka memiliki kurasi khusus yang akan membuat Anda mahir dalam teknik-teknik seperti Supervised Learning, Unsupervised Learning, dan Natural Language Processing. Ini mencakup pelatihan tentang kemajuan terbaru dan pendekatan teknis dalam Kecerdasan Buatan & Pembelajaran Mesin seperti Pembelajaran Mendalam, Model Grafis, dan Pembelajaran Penguatan.