Pengelompokan Fuzzy K-Means di Mahout



Blog ini memberikan pengenalan tentang pengelompokan Fuzzy K-Means di Apache Mahout.

Fuzzy K-Means adalah algoritma yang persis sama dengan K-means, yang merupakan teknik clustering sederhana yang populer. Satu-satunya perbedaan adalah, alih-alih menetapkan titik secara eksklusif hanya ke satu kluster, ia dapat memiliki semacam ketidakjelasan atau tumpang tindih antara dua kluster atau lebih. Berikut ini adalah poin-poin penting yang menjelaskan tentang Fuzzy K-Means:





  • Tidak seperti K-Means, yang mencari hard cluster, di mana setiap titik termasuk dalam satu cluster, Fuzzy K-Means mencari cluster yang lebih lembut untuk tumpang tindih.
  • Satu titik dalam kelompok lunak dapat dimiliki oleh lebih dari satu kelompok dengan nilai afinitas tertentu terhadap masing-masing titik.
  • Afinitas sebanding dengan jarak titik tersebut dari pusat gugus.
  • Mirip dengan K-Means, Fuzzy K-Means bekerja pada objek yang memiliki ukuran jarak yang ditentukan dan dapat direpresentasikan di n- ruang vektor dimensi.

Fuzzy K-Means MapReduce Flow

Tidak banyak perbedaan antara aliran MapReduce dari K-Means dan Fuzzy K-Means. Penerapan keduanya di Mahout serupa.

jelaskan arsitektur mvc di java dengan contoh

Berikut ini adalah parameter penting untuk implementasi Fuzzy K-Means:



  • Anda membutuhkan kumpulan data Vektor untuk input.
  • Harus ada RandomSeedGenerator untuk menyemai kluster k awal.
  • Untuk mengukur jarak diperlukan SquaredEuclideanDistanceMeasure.
  • Nilai ambang batas konvergensi yang besar, seperti -cd 1.0, jika nilai kuadrat dari pengukur jarak telah digunakan
  • Nilai untuk maxIterations nilai default -x 10.
  • Koefisien normalisasi atau faktor ketidakjelasan, dengan nilai lebih besar dari -m 1,0

Ada pertanyaan untuk kami? Sebutkan mereka di bagian komentar dan kami akan menghubungi Anda kembali.

pl sql untuk pemula dengan contoh

posting terkait



perbedaan antara pascasarjana dan master

Pembelajaran Terbimbing di Apache Mahout