Pandas to biblioteka Pythona o otwartym kodzie źródłowym, używana głównie do manipulacji i analizy danych. Jest zbudowany na bazie biblioteki NumPy i zapewnia wydajne, łatwe w użyciu struktury danych oraz narzędzia do analizy danych dla języka programowania Python.

W tym artykule dowiesz się, jak wykonać 6 podstawowych operacji za pomocą Pand.

Korzystanie z przykładów Pand

Możesz uruchomić przykłady w tym artykule za pomocą notatników obliczeniowych, takich jak Notatnik Jupytera, Współpraca Googleitp. Możesz również uruchomić przykłady, wprowadzając kod bezpośrednio do interpretera Pythona w trybie interaktywnym.

Jeśli chcesz zapoznać się z kompletnym kodem źródłowym użytym w tym artykule, możesz uzyskać dostęp do pliku Python Notebook z tego miejsca Repozytorium GitHub.

1. Jak zaimportować pandy jako pdf i wydrukować numer wersji?

Musisz użyć import słowo kluczowe do importowania dowolnej biblioteki w Pythonie. Pandy są zazwyczaj importowane pod pd Alias. Dzięki takiemu podejściu możesz odnieść się do pakietu Pandy jako pd zamiast pandy.

instagram viewer
importuj pandy jako PD
drukuj (pd.__wersja__)

Wyjście:

1.2.4

2. Jak stworzyć serię w Pandach

Seria Pandas to jednowymiarowa tablica, która przechowuje dane dowolnego typu. To jak kolumna w tabeli. Możesz tworzyć serie za pomocą numpy tablic, numpy funkcji, list, słowników, wartości skalarnych itp.

Wartości serii są oznaczone numerem indeksu. Domyślnie pierwsza wartość ma indeks 0, druga wartość ma indeks 1 i tak dalej. Aby nazwać własne etykiety, musisz użyć indeks argument.

Jak stworzyć pustą serię

s = pd. Seria (dtype='float64')
s

Wyjście:

Seria([], typ d: float64)

W powyższym przykładzie pusta seria z pływak tworzony jest typ danych.

Jak stworzyć serię za pomocą NumPy Array

importuj pandy jako PD
importuj numer jako np
d = np. tablica ([1, 2, 3, 4, 5])
s = pd. Seria (d)
s

Wyjście:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Związane z: Operacje NumPy dla początkujących

Jak stworzyć serię za pomocą listy

d = [1, 2, 3, 4, 5]
s = pd. Seria (d)
s

Wyjście:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Jak stworzyć serię z indeksem

Aby utworzyć szereg z indeksem, musisz użyć indeks argument. Liczba indeksów musi być równa liczbie elementów w serii.

d = [1, 2, 3, 4, 5]
s = pd. Seria (d, index=["jeden", "dwa", "trzy", "cztery", "pięć"])
s

Wyjście:

jeden 1
dwa 2
trzy 3
cztery 4
pięć 5
dtype: int64

Jak stworzyć serię za pomocą słownika

Klucze słownika stają się etykietami serii.

d = {"jeden": 1,
"dwa": 2,
„trzy”: 3,
„cztery”: 4,
"pięć": 5}
s = pd. Seria (d)
s

Wyjście:

jeden 1
dwa 2
trzy 3
cztery 4
pięć 5
dtype: int64

Jak utworzyć serię przy użyciu wartości skalarnej

Jeśli chcesz utworzyć szereg przy użyciu wartości skalarnej, musisz podać indeks argument.

s = pd. Seria (1, indeks = ["a", "b", "c", "d"])
s

Wyjście:

1
b 1
c 1
d 1
dtype: int64

3. Jak stworzyć Dataframe w Pandas

DataFrame to dwuwymiarowa struktura danych, w której dane są wyrównane w postaci wierszy i kolumn. DataFrame można utworzyć za pomocą słowników, list, listy słowników, tablic numpy itp. W świecie rzeczywistym ramki DataFrame są tworzone przy użyciu istniejącej pamięci masowej, takiej jak pliki CSV, pliki Excel, bazy danych SQL itp.

Obiekt DataFrame obsługuje wiele atrybutów i metod. Jeśli chcesz dowiedzieć się o nich więcej, zapoznaj się z oficjalną dokumentacją pandy dataframe.

Jak utworzyć pustą ramkę danych?

df = pd. Ramka danych()
drukuj (df)

Wyjście:

Pusta ramka danych
Kolumny: []
Indeks: []

Jak utworzyć ramkę DataFrame za pomocą listy?

listObj = ["MUO", "technologia", "uproszczony"]
df = pd. Ramka danych (listObj)
drukuj (df)

Wyjście:

 0
0 mln zł
1 technologia
2 uproszczone

Jak utworzyć ramkę danych za pomocą słownika ndarray/list

batmanData = {'Nazwa filmu': ['Batman zaczyna', 'Mroczny rycerz', 'Mroczny rycerz powstaje'],
„Rok wydania”: [2005, 2008, 2012]}
df = pd. Ramka danych (batmanData)
drukuj (df)

Wyjście:

 Nazwa filmu Rok wydania
0 Początek Batmana 2005
1 Mroczny Rycerz 2008
2 Mroczny Rycerz Powstaje 2012

Jak utworzyć ramkę DataFrame za pomocą listy list

dane = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (dane, kolumny = ['Nazwa', 'Nr rolki'])
drukuj (df)

Wyjście:

 Nazwa Nr rolki
0 Alex 601
1 Bob 602
2 Katalina 603

Jak utworzyć ramkę danych za pomocą listy słowników

data = [{'Nazwa': 'Alex', 'Nr rolki': 601},
{'Imię': 'Bob', 'Nr rolki': 602},
{'Nazwa': 'Katalina', 'Nr rolki': 603}]
df = pd. Ramka danych (dane)
drukuj (df)

Wyjście:

 Nazwa Nr rolki
0 Alex 601
1 Bob 602
2 Katalina 603

Związane z: Jak przekonwertować listę na słownik w Pythonie?

Jak utworzyć ramkę danych za pomocą funkcji zip()?

Użyj zamek błyskawiczny() funkcja scalania list w Pythonie.

Imię = ['Alex', 'Bob', 'Katalina']
Nr rolki = [601, 602, 603]
listOfTuples = lista (zip (Name, RollNo))
df = pd. DataFrame (listOfTuples, kolumny = ['Nazwa', 'Nr rolki'])
drukuj (df)

Wyjście:

 Nazwa Nr rolki
0 Alex 601
1 Bob 602
2 Katalina 603

4. Jak czytać dane CSV w Pandas

Plik „wartości rozdzielanych przecinkami” (CSV) to rozdzielany plik tekstowy, w którym do oddzielania wartości używa się przecinka. Możesz odczytać plik CSV za pomocą odczyt_csv() metoda u pand. Jeśli chcesz wydrukować całą ramkę DataFrame, użyj przycisku do_ciągu() metoda.

W tym i następnych przykładach to Plik CSV zostaną wykorzystane do wykonania operacji.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.to_string())

Wyjście:

5. Jak analizować ramki danych za pomocą metod head(), tail() i info()

Jak przeglądać dane za pomocą metody head()?

ten głowa() Metoda jest jednym z najlepszych sposobów uzyskania szybkiego przeglądu DataFrame. Ta metoda zwraca nagłówek i określoną liczbę wierszy, zaczynając od góry.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nadruk (głowica df (10))

Wyjście:

Jeśli nie określisz liczby wierszy, zostanie zwróconych pierwszych 5 wierszy.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.head())

Wyjście:

Jak przeglądać dane za pomocą metody tail()?

ten ogon() metoda zwraca nagłówek i określoną liczbę wierszy, zaczynając od dołu.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nadruk (df.ogon (10))

Wyjście:

Jeśli nie określisz liczby wierszy, zostanie zwróconych 5 ostatnich wierszy.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.tail())

Wyjście:

Jak uzyskać informacje o danych?

ten informacje() metody zwracają krótkie podsumowanie DataFrame, w tym indeks dtype i dtypes kolumny, wartości inne niż null i użycie pamięci.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.info())

Wyjście:

6. Jak czytać dane JSON w Pandas

JSON (JavaSkrypto Oobiekt notation) to lekki format wymiany danych. Możesz odczytać plik JSON za pomocą read_json() metoda u pand. Jeśli chcesz wydrukować całą ramkę DataFrame, użyj przycisku do_ciągu() metoda.

W poniższym przykładzie to Plik JSON służy do wykonywania operacji.

Związane z: Co to jest JSON? Przegląd laika

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
drukuj (df.to_string())

Wyjście:

Odśwież swoją wiedzę o Pythonie dzięki wbudowanym funkcjom i metodom

Funkcje pomagają skrócić kod i poprawić jego wydajność. Funkcje i metody takie jak zmniejszyć(), podział(), wyliczać(), oceń(), okrągły()itp. może sprawić, że Twój kod będzie solidny i łatwy do zrozumienia. Zawsze dobrze jest wiedzieć o wbudowanych funkcjach i metodach, ponieważ mogą one znacznie uprościć zadania programistyczne.

UdziałĆwierkaćE-mail
20 funkcji Pythona, które powinieneś znać

Biblioteka standardowa Pythona zawiera wiele funkcji ułatwiających wykonywanie zadań programistycznych. Dowiedz się o najbardziej przydatnych i stwórz bardziej niezawodny kod.

Czytaj dalej

Powiązane tematy
  • Programowanie
  • Pyton
  • Tworzenie stron internetowych
  • Programowanie
  • Analiza danych
O autorze
Yuvraj Chandra (69 opublikowanych artykułów)

Yuvraj jest studentem informatyki na Uniwersytecie w Delhi w Indiach. Jest pasjonatem Full Stack Web Development. Kiedy nie pisze, bada głębię różnych technologii.

Więcej od Yuvraja Chandra

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Kliknij tutaj, aby zasubskrybować