Python Seaborn Tutorial

I denne leksjonen om Python Seaborn-biblioteket vil vi se på forskjellige aspekter av dette datavisualiseringsbiblioteket som vi kan bruke med Python for å generere vakre og intuitive grafer som kan visualisere data i en form som virksomheten ønsker fra en plattform. For å gjøre denne leksjonen komplett, vil vi dekke følgende seksjoner:

Hva er Python Seaborn?
Typer tomter vi kan konstruere med Seaborn
Arbeide med flere tomter
Noen alternativer for Python Seaborn

Dette ser ut som mye å dekke. La oss komme i gang nå.

Hva er Python Seaborn-biblioteket?

Seaborn-biblioteket er en Python-pakke som lar oss lage infografikk basert på statistiske data. Som det er laget på toppen av matplotlib, er det iboende kompatibelt med det. I tillegg støtter den NumPy og Pandas datastruktur slik at plotting kan gjøres direkte fra disse samlingene.

Å visualisere komplekse data er noe av det viktigste Seaborn tar seg av. Hvis vi sammenligner Matplotlib med Seaborn, er Seaborn i stand til å gjøre de tingene enkle som det er vanskelig å oppnå med Matplotlib. Det er imidlertid viktig å merke seg det Seaborn er ikke et alternativ til Matplotlib, men et supplement til det. Gjennom denne leksjonen vil vi også bruke Matplotlib-funksjonene i kodebitene. Du vil velge å jobbe med Seaborn i følgende brukstilfeller:

Du har statistiske tidsseriedata som skal plottes med representasjon av usikkerhet rundt estimatene
Å visuelt etablere forskjellen mellom to delmengder med data
Å visualisere den univariate og bivariate distribusjonen
Legge til mye mer visuell hengivenhet til matplotlib-tomtene med mange innebygde temaer
Å passe og visualisere maskinlæringsmodeller gjennom lineær regresjon med uavhengige og avhengige variabler

Bare et notat før du starter er at vi bruker et virtuelt miljø for denne leksjonen som vi laget med følgende kommando:

python -m virtualenv seaborn
kilde seaborn / bin / aktivere

Når det virtuelle miljøet er aktivt, kan vi installere Seaborn-biblioteket i det virtuelle miljøet slik at eksempler vi oppretter neste kan utføres:

pip installere seaborn

Du kan også bruke Anaconda til å kjøre disse eksemplene, noe som er enklere. Hvis du vil installere den på maskinen din, kan du se på leksjonen som beskriver “Slik installerer du Anaconda Python på Ubuntu 18.04 LTS ”og del din tilbakemelding. La oss nå gå videre til forskjellige typer tomter som kan bygges med Python Seaborn.

Ved hjelp av Pokémon-datasett

For å holde denne leksjonen praktisk, bruker vi Pokemon-datasett som kan lastes ned fra Kaggle. For å importere dette datasettet til programmet vårt, bruker vi Pandas-biblioteket. Her er all import vi utfører i programmet vårt:

importer pandaer som pd
fra matplotlib importer pyplot som plt
importere seaborn som sns

Nå kan vi importere datasettet til programmet vårt og vise noen av eksempeldataene med Pandas som:

df = pd.read_csv ('Pokemon.csv ', index_col = 0)
df.hode()

Merk at for å kjøre kodebiten ovenfor, skal CSV-datasettet være til stede i samme katalog som selve programmet. Når vi kjører kodebiten ovenfor, ser vi følgende utdata (i notatblokken til Anaconda Jupyter):

Plotting av lineær regresjonskurve

En av de beste tingene med Seaborn er de intelligente plottfunksjonene den gir, som ikke bare visualiserer datasettet vi gir det, men også konstruerer regresjonsmodeller rundt det. For eksempel er det mulig å konstruere et lineært regresjonsplott med en enkelt kodelinje. Slik gjør du dette:

sns.lmplot (x = 'Attack', y = 'Defense', data = df)

Når vi kjører kodebiten ovenfor, ser vi følgende utdata:

Vi la merke til noen få viktige ting i kodebiten ovenfor:

Det er dedikert plottfunksjon tilgjengelig i Seaborn
Vi brukte Seaborns tilpasnings- og plottefunksjon som ga oss en lineær regresjonslinje som den modellerte selv

Ikke vær redd hvis du trodde vi ikke kunne ha et plott uten den regresjonslinjen. Vi kan ! La oss prøve en ny kodebit nå, i likhet med den siste:

sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = False)

Denne gangen vil vi ikke se regresjonslinjen i plottet vårt:

Nå er dette mye mer tydelig (hvis vi ikke trenger den lineære regresjonslinjen). Men dette er ikke bare over ennå. Seaborn lar oss lage annerledes dette plottet, og det er det vi skal gjøre.

Konstruksjon av kassetomter

En av de største funksjonene i Seaborn er hvordan den lett godtar Pandas Dataframes-struktur for å plotte data. Vi kan ganske enkelt sende en dataramme til Seaborn-biblioteket, slik at den kan konstruere en bokseplott av den:

sns.boxplot (data = df)

Når vi kjører kodebiten ovenfor, ser vi følgende utdata:

Vi kan fjerne den første avlesningen av totalt, da det ser litt vanskelig ut når vi faktisk plotter individuelle kolonner her:

stats_df = df.drop (['Total'], akse = 1)
# Ny boksplott ved bruk av stats_df
sns.boxplot (data = stats_df)

Når vi kjører kodebiten ovenfor, ser vi følgende utdata:

Svermtomt med Seaborn

Vi kan konstruere et intuitivt design av svermplott med Seaborn. Vi vil igjen bruke datarammen fra Pandas som vi lastet inn tidligere, men denne gangen vil vi ringe Matplotlibs showfunksjon for å vise plottet vi laget. Her er kodebiten:

sns.set_context ("papir")
sns.svermeplott (x = "Attack", y = "Defense", data = df)
plt.vise fram()

Når vi kjører kodebiten ovenfor, ser vi følgende utdata:

Ved å bruke en Seaborn-kontekst tillater vi Seaborn å legge til et personlig preg og flytende design for handlingen. Det er mulig å tilpasse dette plottet ytterligere med tilpasset skriftstørrelse som brukes til etiketter i plottet for å gjøre lesingen enklere. For å gjøre dette vil vi sende flere parametere til set_context-funksjonen som fungerer akkurat som det de høres ut. For eksempel, for å endre skriftstørrelsen på etikettene, bruker vi skrift.størrelse parameter. Her er kodebiten for å gjøre endringen:

sns.set_context ("papir", font_scale = 3, rc = "font.størrelse ": 8," akser.labelize ": 5)
sns.svermeplott (x = "Attack", y = "Defense", data = df)
plt.vise fram()

Når vi kjører kodebiten ovenfor, ser vi følgende utdata:

Skriftstørrelsen for etiketten ble endret basert på parametrene vi ga og verdien som er knyttet til skriften.størrelse parameter. En ting Seaborn er ekspert på er å gjøre plottet veldig intuitivt for praktisk bruk, og dette betyr at Seaborn ikke bare er en praksis Python-pakke, men faktisk noe vi kan bruke i våre produksjonsdistribusjoner.

Legge til en tittel til plott

Det er enkelt å legge til titler i plottene våre. Vi trenger bare å følge en enkel prosedyre for å bruke aksenivåfunksjonene der vi vil kalle set_title () fungerer som vi viser i kodebiten her:

sns.set_context ("papir", font_scale = 3, rc = "font.størrelse ": 8," akser.labelize ": 5)
my_plot = sns.svermeplott (x = "Attack", y = "Defense", data = df)
min_plott.set_title ("LH Swarm Plot")
plt.vise fram()

Når vi kjører kodebiten ovenfor, ser vi følgende utdata:

På denne måten kan vi legge til mye mer informasjon i tomtene våre.

Seaborn vs Matplotlib

Når vi så på eksemplene i denne leksjonen, kan vi identifisere at Matplotlib og Seaborn ikke kan sammenlignes direkte, men de kan sees på som et supplement til hverandre. En av funksjonene som tar Seaborn 1 skritt foran, er måten Seaborn kan visualisere data statistisk på.

For å få mest mulig ut av Seaborn-parametere, anbefaler vi sterkt å se i Seaborn-dokumentasjonen og finne ut hvilke parametere du skal bruke for å gjøre tomten din så nær forretningsbehov som mulig.

Konklusjon

I denne leksjonen så vi på forskjellige aspekter av dette datavisualiseringsbiblioteket som vi kan bruke med Python for å generere vakre og intuitive grafer som kan visualisere data i en form som virksomheten ønsker fra en plattform. Seaborm er et av de viktigste visualiseringsbiblioteket når det gjelder datateknikk og presentasjon av data i de fleste visuelle former, definitivt en ferdighet vi trenger å ha under beltet, da det lar oss bygge lineære regresjonsmodeller.

Del din tilbakemelding på leksjonen på Twitter med @sbmaggarwal og @LinuxHint.