Proyek Pembelajaran Mesin Terbaru untuk Dicoba pada 2019



Artikel ini akan memberi Anda pengetahuan komprehensif tentang Proyek Pembelajaran Mesin di industri dan terobosan yang dibuat di bidang ini.

jelas merupakan bidang yang mengalami kemajuan luar biasa dalam beberapa tahun terakhir. Tren dan kemajuan ini telah menciptakan banyak peluang kerja di industri ini. Kebutuhan untuk Insinyur Pembelajaran Mesin banyak diminati dan lonjakan ini disebabkan oleh teknologi yang berkembang dan generasi data dalam jumlah besar alias Big Data. Jadi, dalam artikel ini, saya akan membahas Proyek Machine Learning paling menakjubkan yang harus diketahui dan dikerjakan oleh seseorang, dalam urutan berikut:

Apa itu Pembelajaran Mesin?

Pembelajaran Mesin adalah konsep yang memungkinkan mesin untuk belajar dari contoh dan pengalaman, dan itu juga tanpa diprogram secara eksplisit. Jadi, alih-alih Anda menulis kode, yang Anda lakukan adalah memasukkan data ke algoritme generik, dan algoritme / mesin membangun logika berdasarkan data yang diberikan.





Siapakah Engineer ML

Langkah Pembelajaran Mesin

Semua Algoritma Pembelajaran Mesin mengikuti pola atau langkah umum.



Mengumpulkan data: Tahap ini melibatkan pengumpulan semua data yang relevan dari berbagai sumber

Perselisihan Data: Ini adalah proses pembersihan dan mengubah 'Data Mentah' ke dalam format yang memungkinkan konsumsi yang nyaman

Menganalisis data: Data dianalisis untuk memilih dan menyaring data yang diperlukan untuk menyiapkan model



Latih Algoritma: Algoritme dilatih pada set data pelatihan, di mana algoritme tersebut memahami pola dan aturan yang mengatur data

Model Tes: Dataset pengujian menentukan keakuratan model kami.

Penyebaran: Jika kecepatan dan keakuratan model dapat diterima, maka model tersebut harus diterapkan di sistem nyata. Setelah model diterapkan berdasarkan performanya, model akan diperbarui dan ditingkatkan jika ada penurunan performa, model akan dilatih ulang.

Jenis Pembelajaran Mesin

Pembelajaran Mesin dikategorikan menjadi tiga jenis:

Pembelajaran yang Diawasi: Ini adalah di mana Anda memiliki variabel input (x) dan variabel output (Y) dan Anda menggunakan algoritma untuk mempelajari fungsi pemetaan dari input ke output.

Pembelajaran Tanpa Pengawasan: Terkadang data yang diberikan tidak terstruktur dan tidak berlabel. Sehingga menjadi sulit untuk mengklasifikasikan data tersebut ke dalam kategori yang berbeda. Pembelajaran tanpa pengawasan membantu memecahkan masalah ini. Pembelajaran ini digunakan untuk mengelompokkan data masukan dalam kelas berdasarkan sifat statistiknya.

Pembelajaran Penguatan: Ini semua tentang mengambil tindakan yang tepat untuk memaksimalkan hadiah dalam situasi tertentu.
ketika datang ke pembelajaran penguatan, tidak ada keluaran yang diharapkan. Agen penguatan memutuskan tindakan apa yang harus diambil untuk melakukan tugas yang diberikan. Jika tidak ada set data pelatihan, ia pasti akan belajar dari pengalamannya.

Sekarang, mari kita lihat beberapa Proyek Pembelajaran Mesin di Kehidupan Nyata yang dapat membantu perusahaan menghasilkan keuntungan.

Kasus Penggunaan Industri

1. STUDIO GERAK

Domain: Setengah

Fokus: Optimalkan Proses Seleksi

perbandingan alat otomasi proses robotik

Tantangan Bisnis: Motion Studio adalah rumah produksi Radio terbesar di Eropa. Memiliki pendapatan lebih dari satu Miliar Dolar, perusahaan telah memutuskan untuk meluncurkan reality show baru: RJ Star. Tanggapan untuk pertunjukan ini belum pernah terjadi sebelumnya dan perusahaan dibanjiri klip suara. Anda sebagai ahli ML harus mengklasifikasikan suara sebagai pria / wanita agar penyaringan tingkat pertama lebih cepat.

Masalah kunci: Sampel suara melintasi aksen.

Manfaat Bisnis: Sejak RJ Star adalah reality show, waktu untuk memilih kandidat sangat singkat. Seluruh kesuksesan pertunjukan dan karenanya keuntungannya tergantung pada eksekusi yang cepat dan lancar

import panda sebagai pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns% matplotlib inline import warnings warnings.filterwarnings ('ignore') df = pd.read_csv ('voice-klasifikasi.csv') df.head ()

# Periksa no. dari catatan df.info () df.describe () df.isnull (). sum ()

print ('Bentuk Data:', df.shape) print ('Jumlah total label: {}'. format (df.shape [0])) print ('Jumlah pria: {}'. format (df [ df.label == 'male']. shape [0])) print ('Jumlah wanita: {}'. format (df [df.label == 'female']. shape [0]))

X = df.iloc [:,: -1] cetak (bentuk df) cetak (bentuk X)

dari sklearn.preprocessing impor LabelEncoder y = df.iloc [:, - 1] gender_encoder = LabelEncoder () y = gender_encoder.fit_transform (y) y dari sklearn.preprocessing import StandardScaler scaler = StandardScaler () scaler.fit (X) X = scaler.transform (X) dari sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.3, random_state = 100) dari sklearn.svm impor SVC dari klasifikasi impor sklearn.metrics dari sklearn.metrics , confusion_matrix svc_model = SVC () svc_model.fit (X_train, y_train) y_pred = svc_model.predict (X_test) print ('Skor Akurasi:') print (metrics.accuracy_score (y_test, y_pred))

print (confusion_matrix (y_test, y_pred))

2. LITHIONPOWER

Domain: Otomotif

Fokus: Berikan insentif kepada Pengemudi

Tantangan Bisnis: Lithionpower adalah penyedia baterai kendaraan listrik (e-vehicle) terbesar. Pengemudi biasanya menyewa aki selama sehari dan kemudian menggantinya dengan aki yang sudah terisi dari perusahaan. Lithionpower memiliki model harga variabel berdasarkan riwayat mengemudi pengemudi. Karena masa pakai baterai bergantung pada faktor-faktor seperti kecepatan berlebih, jarak tempuh per hari, dll. Anda sebagai pakar ML harus membuat model kluster tempat pengemudi dapat dikelompokkan berdasarkan data mengemudi.

Masalah kunci: Pengemudi akan diberi insentif berdasarkan cluster, jadi pengelompokan harus akurat.

Manfaat Bisnis: Peningkatan keuntungan, hingga 15-20% karena pengemudi dengan riwayat buruk akan dikenakan biaya lebih.

import panda sebagai pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns sns.set () # untuk plot styling% matplotlib inline import warnings warnings.filterwarnings ('ignore') import matplotlib.pyplot as plt plt.rcParams [ 'figure.figsize'] = (12, 6) df = pd.read_csv ('driver-data.csv') df.head ()

df.info () df.describe ()

dari sklearn.cluster import KMeans #Mengambil 2 cluster kmeans = KMeans (n_clusters = 2) df_analyze = df.drop ('id', axis = 1) kmeans.fit (df_analyze)

kmeans.cluster_centers_

cetak (kmeans.labels_) print (len (kmeans.labels_))

print (type (kmeans.labels_)) unique, counts = np.unique (kmeans.labels_, return_counts = True) print (dict (zip (unique, counts)))

df_analyze ['cluster'] = kmeans.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, aspek = 1, fit_reg = Salah)

#Sekarang, Mari kita periksa cluster, ketika n = 4 kmeans_4 = KMeans (n_clusters = 4) kmeans_4.fit (df.drop ('id', axis = 1)) kmeans_4.fit (df.drop ('id', axis = 1)) print (kmeans_4.cluster_centers_) unique, counts = np.unique (kmeans_4.labels_, return_counts = True) kmeans_4.cluster_centers_ print (dict (zip (unique, counts)))

df_analyze ['cluster'] = kmeans_4.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, aspek = 1, fit_reg = Salah)

3. BluEx

Domain: Logistik

Fokus: Jalur Optimal

Tantangan Bisnis: BluEx adalah perusahaan logistik terkemuka di India. Itu dikenal karena pengiriman paket yang efisien kepada pelanggan. Namun, BluEx menghadapi tantangan di mana pengemudi vannya mengambil jalur pengiriman yang kurang optimal. Hal ini menyebabkan keterlambatan dan biaya bahan bakar yang lebih tinggi. Anda sebagai ahli ML harus membuat model ML dengan menggunakan Reinforcement Learning sehingga ditemukan jalur yang efisien melalui program tersebut.

Masalah kunci: Data memiliki banyak atribut dan klasifikasi bisa jadi rumit.

Manfaat Bisnis: Hingga 15% biaya bahan bakar dapat dihemat dengan mengambil jalur yang optimal.

import numpy as np import pylab as plt import networkx as nx #Initializing points points_list = [(0,1), (1,5), (5,6), (5,4), (1,2), (2 , 3), (2,7)] tujuan = 7 pemetaan = {0: 'Mulai', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-Destination '} G = nx.Graph () G.add_edges_from (points_list) pos = nx.spring_layout (G, k = .5, center = points_list [2]) nx .draw_networkx_nodes (G, pos, node_color = 'g') nx.draw_networkx_edges (G, pos, edge_color = 'b') nx.draw_networkx_labels (G, pos) plt.show ()

NO_OF_POINTS = 8 #Inititlaizing R Matrix R = np. Matriks (np.ones (shape = (NO_OF_POINTS, NO_OF_POINTS))) R * = -1 untuk titik dalam points_list: cetak (titik) jika titik [1] == tujuan: R [poin] = 150 lainnya: R [poin] = 0 jika poin [0] == tujuan: R [poin [:: - 1]] = 150 lainnya: # kebalikan dari poin R [poin [:: - 1]] = 0

R [tujuan, sasaran] = 150 R

Q = np.matriks (np.zeros ([NO_OF_POINTS, NO_OF_POINTS])) # Parameter pembelajaran gamma = 0.8 initial_state = 1 def available_actions (state): current_state_row = R [state,] av_act = np.where (current_state_row & ampampampgt = 0 ) [1] kembalikan av_act available_act = available_actions (kondisi_awal) def sample_next_action (available_actions_range): next_action = int (np.random.choice (available_act, 1)) return next_action action = sample_next_action (available_act) def update (current_state, action, gamma) : max_index = np.where (Q [action,] == np.max (Q [action,])) [1] if max_index.shape [0] & ampampampgt 1: max_index = int (np.random.choice (max_index, size = 1)) else: max_index = int (max_index) max_value = Q [action, max_index] Q [current_state, action] = R [current_state, action] + gamma * max_value print ('max_value', R [current_state, action] + gamma * max_value) if (np.max (Q) & ampampampgt 0): return (np.sum (Q / np.max (Q) * 100)) lain: return (0) update (status_awal, aksi, gamma)

skor = [] untuk saya dalam rentang (700): kondisi_kini = np.random.randint (0, int (bentuk Q [0])) tindakan_tersedia = tindakan_tersedia (kondisi_sini) tindakan = tindakan_sampel_berikutnya (tindakan_kini) skor = perbarui (kondisi_sini tindakan, gamma) skor. tambahkan (skor) cetak ('Skor:', str (skor)) cetak ('Matriks Q terlatih:') cetak (Q / np.max (Q) * 100) # Menguji kondisi_sini = 0 langkah = [kondisi_sekarang] sementara kondisi_sekarang! = 7: berikutnya_step_indeks = np. di mana (Q [kondisi_sekarang,] == np.maks (Q [kondisi_sekarang,])) [1] jika langkah_baju_indeks.bentuk [0] & ampampampgt 1: (np.random.choice (next_step_index, size = 1)) lain: next_step_index = int (next_step_index) steps.append (next_step_index) current_state = next_step_index

print ('Jalur paling efisien:') print (langkah) plt.plot (skor) plt.show ()

Proyek Pembelajaran Mesin Sumber Terbuka pada 2019

Detectron : Detectron adalah sistem perangkat lunak Facebook AI Research yang menerapkan algoritme deteksi objek yang canggih. Itu ditulis dengan Python dan didukung oleh kerangka kerja pembelajaran mendalam Caffe2.

Tujuan Detectron adalah menyediakan basis kode berkinerja tinggi dan berkualitas tinggi untuk penelitian deteksi objek. Ini dirancang agar fleksibel untuk mendukung implementasi dan evaluasi cepat penelitian baru. Ini berisi lebih dari 50 model Pra-terlatih.

Denspose : Estimasi pose manusia padat bertujuan untuk memetakan semua piksel manusia dari gambar RGB ke permukaan 3D tubuh manusia. DensePose-RCNN diimplementasikan dalam kerangka kerja Detectron.

TensorFlow.js : Ini adalah pustaka untuk mengembangkan dan melatih model ML dan menerapkannya di browser. Ini menjadi rilis yang sangat populer sejak dirilis awal tahun ini dan terus memukau dengan fleksibilitasnya. Dengan ini Anda bisa

  • Kembangkan ML di Browser: Gunakan API yang fleksibel dan intuitif untuk membangun model dari awal menggunakan pustaka aljabar linier JavaScript tingkat rendah atau API lapisan tingkat tinggi.
  • Jalankan model yang ada : Gunakan konverter model TensorFlow.js untuk menjalankan model TensorFlow yang sudah ada langsung di browser.
  • Latih kembali model yang Ada: Latih kembali model ML yang sudah ada menggunakan data sensor yang terhubung ke browser, atau data sisi klien lainnya.

Gelombang pijar: Machine Learning juga melakukan kemajuan besar dalam pemrosesan audio dan tidak hanya menghasilkan musik atau klasifikasi. WaveGlow adalah Jaringan Generatif Berbasis Aliran untuk Sintesis Ucapan oleh NVIDIA. Para peneliti juga telah membuat daftar langkah-langkah yang dapat Anda ikuti jika Anda ingin melatih model Anda sendiri dari awal.

Gambar Outpainting : Bayangkan Anda memiliki setengah gambar dari sebuah adegan dan Anda menginginkan pemandangan penuh, itulah yang dapat dilakukan oleh outpainting untuk Anda. Proyek ini adalah implementasi Keras dari makalah Gambar Outpainting Stanford. Model dilatih dengan 3500 data pantai yang dihilangkan dengan total argumentasi hingga 10.500 gambar untuk 25 zaman .

apa itu manajemen pengadaan proyek

Ini adalah makalah yang luar biasa dengan penjelasan langkah demi langkah yang terperinci. Contoh yang harus dicoba untuk semua Penggemar Machine Learning. Secara pribadi, ini adalah proyek Pembelajaran Mesin favorit saya.

Harmonisasi Pelukis yang Dalam : Nah, bicara soal gambar, yang satu ini adalah mahakarya. Apa yang dilakukan algoritme ini adalah, mengambil gambar sebagai input dan kemudian jika Anda menambahkan elemen eksternal ke gambar, elemen itu akan digabungkan ke lingkungan seolah-olah itu adalah bagian darinya.

Bisakah Anda membedakannya? Tidak, bukan? Nah, ini menunjukkan kepada kita seberapa jauh kita telah berhasil dalam hal Pembelajaran Mesin.

DeepMimic: Sekarang, perhatikan lebih dekat gambar di sini, Anda melihat sosok tongkat melakukan tendangan berputar, membalikkan punggung, dan meroda. Bahwa teman saya sedang belajar penguatan dalam tindakan. DeepMimic adalah contoh-Guided Deep Reinforcement Learning of Physics-Based Character Skills.

Magenta : Magenta adalah proyek penelitian yang mengeksplorasi peran pembelajaran mesin dalam proses pembuatan seni dan musik. Terutama ini melibatkan pengembangan pembelajaran mendalam baru dan algoritma pembelajaran penguatan untuk menghasilkan lagu, gambar, gambar, dan materi lainnya.

Ini juga merupakan eksplorasi dalam membangun alat dan antarmuka pintar yang memungkinkan seniman dan musisi untuk memperluas ( tidak menggantikan! ) proses mereka menggunakan model ini. Ayo kembangkan sayap Anda, buat konten unik Anda untuk Instagram atau SoundCloud, dan jadilah influencer.

Jadi teman-teman, dengan ini kita sampai pada akhir artikel Proyek Pembelajaran Mesin yang luar biasa ini. Cobalah contoh-contoh ini dan beri tahu kami di bagian komentar di bawah. Saya harap Anda mengetahui penerapan praktis Machine Learning di industri. Edureka's membuat Anda mahir dalam teknik-teknik seperti Supervised Learning, Unsupervised Learning, dan Natural Language Processing. Ini mencakup pelatihan tentang kemajuan terbaru dan pendekatan teknis dalam Kecerdasan Buatan & Pembelajaran Mesin seperti Pembelajaran Mendalam, Model Grafis, dan Pembelajaran Penguatan