Tutorial Python Seaborn: Apa itu Seaborn dan Bagaimana Cara Menggunakannya?



Tutorial Python Seaborn bersama perbedaan antara seaborn dan matplotlib. Pelajari juga tentang berbagai fungsi dan kustomisasi yang tersedia di seaborn.

Python adalah gudang dari banyak perpustakaan dan kerangka kerja yang sangat kuat. Diantaranya, adalah Yg keturunan dr laut, yang dominan visualisasi data perpustakaan, memberikan alasan lain bagi programmer untuk menyelesaikannya . Dalam Tutorial Python Seaborn ini, Anda akan mempelajari semua keahlian visualisasi data menggunakan Seaborn.

Sebelum melanjutkan, mari kita lihat semua topik diskusi di artikel ini:





Jadi, mari kita mulai dengan memikirkan pentingnya Python Seaborn.

Mengapa menggunakan Python Seaborn?

Seperti yang disebutkan sebelumnya, pustaka Python Seaborn digunakan untuk memudahkan tugas menantang visualisasi data dan yang menjadi dasarnya . Seaborn memungkinkan pembuatan grafik statistik melalui fungsi berikut:



  • API yang didasarkan pada kumpulan data memungkinkan perbandingan antara beberapa variabel

  • Mendukung kisi multi-plot yang pada gilirannya memudahkan membangun visualisasi kompleks

  • Visualisasi univariat dan bivariat tersedia untuk membandingkan antara subkumpulan data



  • Tersedianya palet warna yang berbeda untuk mengungkap berbagai macam pola

  • Estimasi dan plot secara otomatis

Jadi, jika Anda bertanya-tanya mengapa menggunakan Seaborn ketika Anda sudah memiliki Matplotlib, berikut jawabannya.

Python Seaborn vs Matplotlib:

“Jika Matplotlib“ mencoba membuat hal-hal mudah menjadi mudah dan hal-hal sulit menjadi mungkin ”, seaborn mencoba membuat serangkaian hal sulit yang terdefinisi dengan baik juga mudah” - Michael Waskom (Pencipta Seaborn).
Sebenarnya, Matplotlib bagus tapi Seaborn lebih baik. Pada dasarnya ada dua kekurangan Matplotlib yang diperbaiki Seaborn:

  1. Matplotlib dapat dipersonalisasi tetapi sulit untuk mengetahui setelan apa yang diperlukan untuk membuat plot lebih menarik. Di sisi lain, Seaborn hadir dengan banyak tema yang disesuaikan dan antarmuka tingkat tinggi untuk mengatasi masalah ini.

  2. Saat bekerja dengan Panda , Matplotlib tidak berfungsi dengan baik saat berurusan dengan DataFrames, sementara fungsi Seaborn benar-benar berfungsi pada DataFrames.

Bagaimana cara menginstal Seaborn?

Untuk menginstal pustaka Python Seaborn, Anda dapat menggunakan perintah berikut berdasarkan platform yang Anda gunakan:

pip instal seaborn

atau

Conda menginstal seaborn

Setelah ini diinstal, pastikan untuk menginstal paket dan pustaka yang bergantung pada seaborn.

Menginstal Ketergantungan Python Seaborn:

Ketergantungan wajib untuk seaborn adalah:

Ada satu ketergantungan yang direkomendasikan juga yaitu:

  • model negara

Untuk menginstal pustaka ini, Anda dapat menggunakan perintah yang sama seperti yang ditunjukkan sebelumnya untuk Seaborn dengan namanya masing-masing. Setelah dipasang, mereka dapat diimpor dengan mudah. Seaborn memungkinkan Anda memuat set data apa pun dari menggunakan load_dataset () fungsi. Anda juga bisa melihat semua dataset yang tersedia menggunakan fungsi get_dataset_names () sebagai berikut:

CONTOH:

impor seaborn sebagai sns sns.get_dataset_names ()

Ini akan mengembalikan daftar semua dataset yang tersedia.
Sekarang setelah Anda menyiapkan lingkungan untuk bekerja dengan mamalia laut, mari kita lanjutkan lebih jauh untuk melihat bagaimana menggunakan fungsi plotting di .

Fungsi Plotting Seaborn

Memvisualisasikan Hubungan Statistik:

Proses memahami hubungan antara variabel dari sebuah dataset dan bagaimana hubungan ini, pada gilirannya, bergantung pada variabel lain dikenal sebagai analisis statistik. Sekarang mari kita lihat lebih dalam fungsi yang dibutuhkan untuk ini:

relplot ():

Ini adalah fungsi tingkat gambar yang menggunakan dua fungsi sumbu lain untuk Memvisualisasikan Hubungan Statistik yaitu:

  • scatterplot ()
  • lineplot ()

Fungsi-fungsi ini dapat ditentukan menggunakan parameter 'kind' dari relplot (). Jika parameter ini diberikan, ini mengambil yang default yaitu scatterplot (). Sebelum Anda mulai menulis kode Anda, pastikan untuk mengimpor pustaka yang diperlukan sebagai berikut:

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns.set (style = 'darkgrid')

Harap dicatat bahwa atribut gaya juga dapat disesuaikan dan dapat mengambil nilai apa pun seperti darkgrid, ticks, dll yang akan saya bahas nanti di bagian plot-estetika. Sekarang mari kita lihat contoh kecilnya:

CONTOH:

f = sns.load_dataset ('penerbangan') sns.relplot (x = 'penumpang', y = 'bulan', data = f)

KELUARAN:

Flights1-Tutorial Seaborn Python-Edureka

Seperti yang Anda lihat, titik-titik tersebut diplot dalam 2 dimensi. Namun, Anda dapat menambahkan dimensi lain menggunakan semantik 'hue'. Mari kita lihat contoh yang sama:

CONTOH:

f = sns.load_dataset ('penerbangan') sns.relplot (x = 'penumpang', y = 'bulan', hue = 'tahun', data = f)

Anda akan melihat output berikut:

KELUARAN:

Namun, masih banyak lagi penyesuaian yang dapat Anda coba seperti warna, gaya, ukuran, dll. Izinkan saya menunjukkan bagaimana Anda dapat mengubah warna dalam contoh berikut:

CONTOH:

sns.set (style = 'darkgrid') f = sns.load_dataset ('flight') sns.relplot (x = 'penumpang', y = 'bulan', hue = 'tahun', palet = 'ch: r = - 0,5, l = 0,75 ', data = f)

KELUARAN:

lineplot ():

Fungsi ini memungkinkan Anda menggambar garis kontinu untuk data Anda. Anda dapat menggunakan fungsi ini dengan mengubah parameter 'kind' sebagai berikut:

CONTOH:

a = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Clothes' : [13,40,34,23,54,67,98], 'Utensils': [12,32,27,56,87,54,34]}, indeks = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Hari', y = 'Pakaian', jenis = 'garis', data = a) g.fig.autofmt_xdate ()

KELUARAN:

Default untuk slot baris adalah y sebagai fungsi dari x. Namun, ini dapat diubah jika Anda ingin melakukannya. Ada lebih banyak opsi yang dapat Anda coba lebih lanjut.

Sekarang mari kita lihat cara memplot data kategorikal.

Merencanakan dengan Data Kategorikal:

Pendekatan ini muncul ketika variabel utama kami dibagi lagi menjadi kelompok-kelompok diskrit (kategorikal). Ini bisa dicapai dengan menggunakan fungsi catplot ().

catplot ():

Ini adalah fungsi tingkat gambar seperti relplot (). Ini dapat dicirikan oleh tiga keluarga fungsi tingkat sumbu yaitu:

  1. Scatterplots - Ini termasuk stripplot (), swarmplot ()

  2. Plot Distribusi - yaitu boxplot (), violinplot (), boxenplot ()

  3. Estimateplots - yaitu pointplot (), barplot (), countplot ()

Sekarang mari kita ambil beberapa contoh untuk menunjukkan ini:

CONTOH:

impor seaborn sebagai sns impor matplotlib.pyplot sebagai plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', data = a)

KELUARAN:

Seperti yang Anda lihat, pada contoh di atas saya belum menyetel parameter 'kind'. Oleh karena itu, ia mengembalikan grafik sebagai sebar default. Anda dapat menentukan salah satu fungsi level sumbu untuk mengubah grafik sesuai kebutuhan. Mari kita ambil contoh ini juga:

CONTOH:

impor seaborn sebagai sns impor matplotlib.pyplot sebagai plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', jenis = 'biola', data = a)

KELUARAN:

Output di atas menunjukkan plot biola untuk dataset tips. Sekarang mari kita coba mencari cara memvisualisasikan distribusi kumpulan data.

Memvisualisasikan distribusi kumpulan data:

Ini pada dasarnya berkaitan dengan memahami kumpulan data dengan konteks menjadi univariat atau bivariat. Sebelum memulai ini, cukup impor yang berikut ini:

import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt dari scipy import stats sns.set (color_codes = True)

Setelah ini selesai, Anda dapat melanjutkan merencanakan distribusi univariat dan bivariat.

Merencanakan distribusi Univariat:

Untuk memplotnya, Anda dapat menggunakan fungsi distplot () sebagai berikut:

CONTOH:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

KELUARAN:

Seperti yang Anda lihat pada contoh di atas, kami telah memplot grafik untuk variabel a yang nilainya dihasilkan oleh fungsi normal () menggunakan distplot.

Merencanakan distribusi bivariat:

Ini muncul ketika Anda memiliki dua variabel independen acak yang menghasilkan beberapa kemungkinan peristiwa. Fungsi terbaik untuk memplot jenis grafik ini adalah jointplot (). Sekarang mari kita plot grafik bivariat menggunakan jointplot ().

CONTOH:

x = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Clothes' : [13,40,34,23,54,67,98], 'Utensils': [12,32,27,56,87,54,34]}, indeks = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Day': [8,9,10,11,12,13,14], 'Grocery': [30,80,45,23,51,46, 76], 'Pakaian': [13,40,34,23,54,67,98], 'Peralatan': [12,32,27,56,87,54,34]}, indeks = [8,9 , 10,11,12,13,14]) mean, cov = [0, 1], [(1, .5), (.5, 1)] data = np.random.multivariate_normal (mean, cov, 200 ) dengan sns.axes_style ('white'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

KELUARAN:

Sekarang setelah Anda memahami berbagai fungsi di Python Seaborn, mari kita lanjutkan untuk membuat kisi multi-plot terstruktur.

Kisi Multi-Plot:

Python Seaborn memungkinkan Anda memplot beberapa kisi secara berdampingan. Ini pada dasarnya adalah plot atau grafik yang diplot menggunakan skala dan sumbu yang sama untuk membantu perbandingan di antara keduanya. Ini, pada gilirannya, membantu programmer untuk membedakan dengan cepat antara plot dan mendapatkan informasi dalam jumlah besar.

Pertimbangkan contoh fungsi facetgrid () berikut untuk memplot grafik ini.

CONTOH:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

KELUARAN:

bagaimana mengubah ganda menjadi int

Output di atas dengan jelas menunjukkan perbandingan antara tip yang diberikan saat Makan Siang dan Makan Malam. Anda juga dapat memplot menggunakan fungsi PairGrid jika Anda memiliki sepasang variabel untuk dibandingkan. Perhatikan contoh berikut.

CONTOH:

sns.set (style = 'ticks') a = sns.load_dataset ('flight') b = sns.PairGrid (a) b.map (plt.scatter)

KELUARAN:

Seperti yang Anda lihat, keluaran di atas dengan jelas membandingkan antara tahun dan jumlah penumpang dengan cara yang berbeda.

Seaborn juga memungkinkan penyesuaian terkait estetika yang dibahas lebih lanjut.

Plot-Estetika:

Segmen tutorial Python Seaborn ini berkaitan dengan membuat plot kita lebih menarik dan menyenangkan.

Estetika Gambar Seaborn Python:

Fungsi pertama yang akan saya diskusikan adalah set (). Saya telah menggunakan parameter 'gaya' dari fungsi ini sebelumnya. Parameter ini pada dasarnya berkaitan dengan tema seaborn. Saat ini tersedia lima diantaranya yaitu darkgrid, ticks, whitegrid, white dan dark.

Perhatikan contoh berikut yang mendemonstrasikan tema putih.

CONTOH:

impor seaborn sebagai sns impor matplotlib.pyplot sebagai plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', data = a)

KELUARAN:

Pada output di atas, Anda dapat melihat tema berubah menjadi putih. Anda dapat menjelajahinya lebih jauh menggunakan tema lain juga. Jika Anda perhatikan di keluaran sebelumnya, ada sumbu yang ada di sekitar grafik. Namun, ini juga dapat disesuaikan menggunakan fungsi despine (). Lihat contoh di bawah ini.

CONTOH:

impor seaborn sebagai sns impor matplotlib.pyplot sebagai plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'day', y = 'total_bill', data = a) sns.despine (offset = 10, trim = True)

KELUARAN:



Perhatikan perbedaan antara dua keluaran sebelumnya. Namun, masih banyak lagi pilihan yang bisa Anda jelajahi sendiri.

Palet Warna Seaborn Python:

Warna pada dasarnya adalah fitur yang mendekati mata manusia melebihi fitur lainnya. Seaborn memungkinkan Anda untuk bermain-main dengan warna menggunakan berbagai fungsi seperti color_palette (), hls_palette (), husl_palette (), dll. Perhatikan warna yang saat ini ada di seaborn.

CONTOH:

import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

KELUARAN:

Gambar di atas menunjukkan warna-warna yang ada di dasar laut. Saya telah melakukannya dengan menggunakan fungsi palplot (). Untuk variasi yang lebih dalam, Anda dapat menggunakan hls_palette (), husl_palette (), dll.

Ini membawa kita ke bagian akhir Tutorial Python Seaborn. Saya harap Anda memahami semuanya dengan jelas. Pastikan Anda berlatih sebanyak mungkin .

Ada pertanyaan untuk kami? Harap sebutkan di bagian komentar di blog 'Tutorial Python Seaborn' ini dan kami akan menghubungi Anda kembali secepatnya.

Untuk mendapatkan pengetahuan mendalam tentang Python beserta berbagai aplikasinya, Anda dapat mendaftar secara langsung dengan dukungan 24/7 dan akses seumur hidup.