Datavitenskap

Hvordan lage Pandas DataFrame i Python?

Hvordan lage Pandas DataFrame i Python?

Pandas DataFrame er en 2D (todimensjonal) kommentert datastruktur der data er justert i tabellform med forskjellige rader og kolonner. For enklere forståelse oppfører DataFrame seg som et regneark som inneholder tre forskjellige komponenter: indeks, kolonner og data. Pandas DataFrames er den vanligste måten å bruke pandagjenstandene på.

Pandas DataFrames kan opprettes ved hjelp av forskjellige metoder. Denne artikkelen vil forklare alle mulige metoder som du kan lage Pandas DataFrame i python. Vi har kjørt alle eksemplene på pycharm-verktøyet. La oss starte implementeringen av hver metode en etter en.

Grunnleggende syntaks

Følg følgende syntaks når du oppretter DataFrames i Pandas python:

pd.DataFrame (Df_data)

Eksempel: La oss forklare med et eksempel. I dette tilfellet har vi lagret dataene til studentens navn og prosenter i en 'Students_Data' -variabel. Videre bruker du pd.DataFrame (), vi har opprettet en DataFrames for å vise studentens resultat.

importer pandaer som pd
Students_Data =
'Navn': ['Samreena', 'Asif', 'Mahwish', 'Raees'],
'Prosent': [90,80,70,85]
resultat = pd.DataFrame (Students_Data)
skriv ut (resultat)

Metoder for å lage Pandas DataFrames

Pandas DataFrames kan opprettes på forskjellige måter som vi vil diskutere i resten av artikkelen. Vi vil skrive ut studentkursene i form av DataFrames. Så ved å bruke en av følgende metoder kan du opprette lignende DataFrames som er representert i følgende bilde:

Metode nr. 01: Opprette Pandas DataFrame fra ordlisten med lister

I det følgende eksemplet lages DataFrames fra ordbøkene til lister relatert til studentens kursresultater. Først importerer du et pandas bibliotek og oppretter deretter en ordliste med lister. Dikttastene representerer kolonnenavnene som 'Student_Name', 'Course_Title' og 'GPA'. Lister representerer kolonnens data eller innhold. Variablen 'ordbok_lister' inneholder dataene til studenter som videre er tilordnet variabelen 'df1'. Bruk utskriftserklæringen til å skrive ut alt innholdet i DataFrames.

Eksempel:

# Importer biblioteker for pandaer og numpy
importer pandaer som pd
# Importer pandas bibliotek
importer pandaer som pd
# Lag en ordliste med listen
ordbok_lister =
'Student_Name': ['Samreena', 'Raees', 'Sara', 'Sana'],
'Course_Title': ['SQA', 'SRE', 'IT Basics', 'Artificial intelligence'],
'GPA': [3.1. 3.3, 2.8, 4.0]
# Opprett DataFrame
dframe = pd.DataFrame (ordlistelister)
skriv ut (dframe)

Etter å ha utført koden ovenfor, vil følgende utgang vises:

Metode nr. 02: Lag Pandas DataFrame fra ordlisten til NumPy-matrisen

DataFrame kan opprettes fra dict of array / list. For dette formålet må lengden være den samme som hele narrayen. Hvis noen indekser blir bestått, bør indekselengden være lik matrisens lengde. Hvis ingen indeks passeres, vil standardindeksen i dette tilfellet være et område (n). Her representerer n matrisens lengde.

Eksempel:

importer nummen som np
# Opprett en nummen matrise
nparray = np.array (
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'IT Basics', 'Artificial Intelligence'],
[3.1. 3.3, 2.8, 4.0]])
# Lag en ordbok over nparray
dictionary_of_nparray =
'Student_Name': nparray [0],
'Course_Title': nparray [1],
'GPA': nparray [2]
# Opprett DataFrame
dframe = pd.DataFrame (ordbok_av_nparray)
skriv ut (dframe)

Metode # 03: Opprette pandas DataFrame ved hjelp av listen over lister

I den følgende koden representerer hver linje en enkelt rad.

Eksempel:

# Importer biblioteket Pandas pd
importer pandaer som pd
# Lag en liste med lister
gruppelister = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'IT Basics', 2.8],
['Sana', 'Kunstig intelligens', 4.0]]
# Opprett DataFrame
dframe = pd.DataFrame (group_lists, columns = ['Student_Name', 'Course_Title', 'GPA'])
skriv ut (dframe)

Metode # 04: Opprette pandaer DataFrame ved hjelp av listen over ordbøker

I den følgende koden representerer hver ordbok en enkelt rad og nøkler som representerer kolonnenavnene.

Eksempel:

# Importer bibliotekspandas
importer pandaer som pd
# Lag en liste med ordbøker
dict_list = [
'Student_Name': 'Samreena', 'Course_Title': 'SQA', 'GPA': 3.1,
'Student_Name': 'Raees', 'Course_Title': 'SRE', 'GPA': 3.3,
'Student_Name': 'Sara', 'Course_Title': 'IT Basics', 'GPA': 2.8,
'Student_Name': 'Sana', 'Course_Title': 'Artificial Intelligence', 'GPA': 4.0]
# Opprett DataFrame
dframe = pd.DataFrame (dict_list)
skriv ut (dframe)

Metode # 05: Opprette pandas Dataframe fra dict of pandas Series

Dikt-tastene representerer navnene på kolonnene, og hver serie representerer kolonneinnholdet. I de følgende kodelinjene har vi tatt tre typer serier: Name_series, Course_series og GPA_series.

Eksempel:

# Importer bibliotekspandas
importer pandaer som pd
# Lag serien av studentnavn
Navneserier = pd.Serier (['Samreena', 'Raees', 'Sara', 'Sana'])
Kursserier = pd.Serier (['SQA', 'SRE', 'IT Basics', 'Artificial intelligence'])
GPA_series = pd.Serie ([3.1. 3.3, 2.8, 4.0])
# Lag en serieordbok
ordbok_av_nparray
\
'] = ' Name ': Name_series,' Age ': Course_series,' Department ': GPA_series
# DataFrame oppretting
dframe = pd.DataFrame (ordbok_av_nparray)
skriv ut (dframe)

Metode # 06: Opprett Pandas DataFrame ved hjelp av zip () -funksjonen.

Ulike lister kan slås sammen gjennom funksjonen liste (zip ()). I det følgende eksemplet opprettes pandas DataFrame ved å ringe pd.DataFrame () -funksjon. Det lages tre forskjellige lister som slås sammen i form av tupler.

Eksempel:

importer pandaer som pd
# Liste1
Student_Name = ['Samreena', 'Raees', 'Sara', 'Sana']
# Liste2
Course_Title = ['SQA', 'SRE', 'IT Basics', 'Artificial Intelligence']
# Liste3
GPA = [3.1. 3.3, 2.8, 4.0]
# Ta listen over tupler fra tre lister videre, slå dem sammen ved hjelp av zip ().
tuples = list (zip (Student_Name, Course_Title, GPA))
# Tildel dataverdier til tupler.
tupler
# Konvertering av tupleliste til pandaer Dataframe.
dframe = pd.DataFrame (tuples, columns = ['Student_Name', 'Course_Title', 'GPA'])
# Skriv ut data.
skriv ut (dframe)

Konklusjon

Ved hjelp av metodene ovenfor kan du opprette Pandas DataFrames i python. Vi har skrevet ut et studentkurs GPA ved å lage Pandas DataFrames. Forhåpentligvis vil du få nyttige resultater etter å ha kjørt de ovennevnte eksemplene. Alle programmene er kommentert godt for bedre forståelse. Hvis du har flere måter å lage Pandas DataFrames på, så ikke nøl med å dele dem med oss. Takk for at du leser denne opplæringen.

diff Kommandoeksempler i Linux
Diff kommandoen er en analyse eller informativ kommando som skriver ut forskjeller mellom filer, analyserer dem linje for linje, eller kataloger rekur...
Slik kjører du Linux-kommandoer og skript automatisk når du starter systemet på nytt
Å kjøre apper og skript automatisk ved oppstart kan være nyttig for automatisering av vanlige oppstartsoppgaver og hendelser. Denne artikkelen vil for...
Cat Command i Linux
Kattekommando (forkortelse for sammenkoble) er et av de mest brukte kommandolinjeprogrammene i Linux OS. Det er et standard Linux-verktøy som brukes t...