Teknik Pemodelan dalam Analisis Bisnis dengan R



Blog ini memberikan pengantar singkat tentang Teknik Pemodelan dalam Analisis Bisnis dengan R.

Teknik Pemodelan yang Berbeda:

Kami dapat membagi masalah apa pun menjadi proses yang lebih kecil:





Klasifikasi - adalah, tempat kami mengklasifikasikan data. Misalnya. penyakit semua penyakit menunjukkan perilaku tertentu, dan kita dapat mengklasifikasikannya lebih lanjut.

Misalnya: penyakit yang menurunkan kekebalan tubuh, penyakit yang menimbulkan sakit kepala, dll.



Regresi - melibatkan mencari tahu hubungan antara banyak variabel.

Misalnya: bagaimana berat badan manusia dikaitkan dengan tinggi badannya.

AnomolyDeteksi - pada dasarnya adalah fluktuasi.



Misalnya: Dalam kasus tegangan tinggi atau tegangan rendah.

Contoh lain dapat mencakup perilaku yang diatur yang melibatkan mengemudi di sisi kanan atau kiri berdasarkan negara. Anomolinya di sini adalah seseorang yang mengemudi dari arah berlawanan.

cara menerapkan aplikasi java di aws

Contoh lain bisa jadi intrusi jaringan. Di sini, pengguna yang diautentikasi masuk ke situs web perusahaan Anda, dan kemudian jika seseorang yang tidak diautentikasi masuk, itu adalahAn0moly.

Atribut Pentingnya - Ini pada dasarnya memberikan beberapa atribut, seperti tinggi, berat, suhu, detak jantung. Hal yang perlu diperhatikan adalah bahwa semua atribut ini penting untuk suatu tugas.

daftar tertaut dalam program c

Misal: Seseorang sedang mencoba meramal, jam berapa seseorang akan sampai di kantor. Setiap atribut memainkan peran penting tetapi tidak semua atribut itu penting.

Aturan Asosiasi - Dalam istilah yang lebih sederhana, ini adalah untuk menganalisis atau memprediksi perilaku selanjutnya, yang berputar di sekitar mesin rekomendasi.

Misalnya: Seseorang yang membeli roti juga dapat membeli susu. Jika kita menganalisis perilaku belanja masa lalu, semua item dalam keranjang memiliki keterkaitan. Dalam hal ini, ada kemungkinan bahwa orang yang membeli roti juga akan membeli susu.

Kekelompokan - Ini adalah salah satu teknik tertua dalam statistik. Faktanya, seseorang selalu dapat memodelkan masalah apa pun, baik itu klasifikasi atau pengelompokan, yang berarti mengelompokkan entitas yang serupa.

Sebagai contoh:

1) Ambil sekeranjang apel dan jeruk, di mana kita bisa memisahkan apel dari jeruk.

2) Kasus penggunaan penting untuk pengelompokan adalah perawatan kesehatan. Hampir semua statistik dan analisis dimulai dengan kasus penggunaan perawatan kesehatan. Untuk lebih mendalamnya, ada istilah clustering yang disebut cohort (orang dengan penyakit serupa), sehingga bisa dipelajari secara terpisah dari pelanggan yang sudah ada. Misalnya, jika 10 orang menderita demam dan 10 orang sakit kepala lainnya, kami akan menemukan kesamaan di antara mereka dan menghasilkan obat.

Ekstraksi Fitur - Dalam akurasi ekstraksi fitur, validitas dan kegagalan cukup relevan. Dengan kata lain, ekstraksi ciri dapat disebut sebagai pengenalan pola.

Sebagai contoh:

Dalam pencarian Google, ketika pengguna memasukkan istilah, itu muncul dengan hasil. Sekarang, pertanyaan penting untuk ditanyakan adalah bagaimana mereka tahu, halaman mana yang relevan dan tidak relevan dengan istilah tersebut? Ini dapat dijawab dengan ekstraksi fitur dan pengenalan pola, yang menambahkan fitur yang menonjol. Misalkan ada foto, kamera tertentu mendeteksi wajah, menyorot wajah untuk menghasilkan gambar yang indah, yang juga menggunakan fitur pengenalan.

Pembelajaran yang Diawasi vs Pembelajaran Tanpa Pengawasan

untuk) Kategori Prediksi - Teknik tersebut meliputi regresi, logistik, jaringan saraf dan pohon keputusan. Beberapa contoh termasuk deteksi penipuan (di mana komputer mempelajari dan memprediksi penipuan berikutnya dari riwayat penipuan sebelumnya). Dalam pembelajaran tanpa pengawasan, seseorang tidak dapat memprediksi dengan contoh karena tidak ada data historis.

b) Kategori Klasifikasi - Mencontohkan transaksi tersebut curang atau tidak masuk kategori klasifikasi. Di sini, kami mengambil data historis dan mengklasifikasikannya dengan pohon keputusan atau jika kami tidak mengambil data historis sama sekali, kami langsung memulai data dan mencoba mengeksploitasi fitur sendiri. Misalnya, jika kita perlu mengetahui karyawan, yang kemungkinan besar akan meninggalkan organisasi atau kemungkinan akan tetap tinggal. Jika ini adalah organisasi baru, di mana kami tidak dapat menggunakan data historis, kami selalu dapat menggunakan pengelompokan untuk ekstraksi data.

c) Kategori Eksplorasi - Ini adalah metode langsung, yang akan datang, apa arti data besar. Dalam unsupervised learning disebut komponen prinsip dan clustering.

d) Kategori Afinitas - di sini beberapa elemen dilibatkan seperti cross-sell / up sell, analisis keranjang pasar. Dalam analisis keranjang, tidak ada pembelajaran terbimbing karena tidak ada data historis. Jadi kami mengambil data secara langsung dan menemukan asosiasi, pengurutan, dan analisis faktor.

apa perbedaan antara c ++ dan java

Ada pertanyaan untuk kami? Sebutkan mereka di bagian komentar dan kami akan menghubungi Anda kembali.

Posting terkait: