Pandas to biblioteka Pythona o otwartym kodzie źródłowym, używana głównie do manipulacji i analizy danych. Jest zbudowany na bazie biblioteki NumPy i zapewnia wydajne, łatwe w użyciu struktury danych oraz narzędzia do analizy danych dla języka programowania Python.
W tym artykule dowiesz się, jak wykonać 6 podstawowych operacji za pomocą Pand.
Korzystanie z przykładów Pand
Możesz uruchomić przykłady w tym artykule za pomocą notatników obliczeniowych, takich jak Notatnik Jupytera, Współpraca Googleitp. Możesz również uruchomić przykłady, wprowadzając kod bezpośrednio do interpretera Pythona w trybie interaktywnym.
Jeśli chcesz zapoznać się z kompletnym kodem źródłowym użytym w tym artykule, możesz uzyskać dostęp do pliku Python Notebook z tego miejsca Repozytorium GitHub.
1. Jak zaimportować pandy jako pdf i wydrukować numer wersji?
Musisz użyć import słowo kluczowe do importowania dowolnej biblioteki w Pythonie. Pandy są zazwyczaj importowane pod pd Alias. Dzięki takiemu podejściu możesz odnieść się do pakietu Pandy jako pd zamiast pandy.
importuj pandy jako PD
drukuj (pd.__wersja__)
Wyjście:
1.2.4
2. Jak stworzyć serię w Pandach
Seria Pandas to jednowymiarowa tablica, która przechowuje dane dowolnego typu. To jak kolumna w tabeli. Możesz tworzyć serie za pomocą numpy tablic, numpy funkcji, list, słowników, wartości skalarnych itp.
Wartości serii są oznaczone numerem indeksu. Domyślnie pierwsza wartość ma indeks 0, druga wartość ma indeks 1 i tak dalej. Aby nazwać własne etykiety, musisz użyć indeks argument.
Jak stworzyć pustą serię
s = pd. Seria (dtype='float64')
s
Wyjście:
Seria([], typ d: float64)
W powyższym przykładzie pusta seria z pływak tworzony jest typ danych.
Jak stworzyć serię za pomocą NumPy Array
importuj pandy jako PD
importuj numer jako np
d = np. tablica ([1, 2, 3, 4, 5])
s = pd. Seria (d)
s
Wyjście:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Związane z: Operacje NumPy dla początkujących
Jak stworzyć serię za pomocą listy
d = [1, 2, 3, 4, 5]
s = pd. Seria (d)
s
Wyjście:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Jak stworzyć serię z indeksem
Aby utworzyć szereg z indeksem, musisz użyć indeks argument. Liczba indeksów musi być równa liczbie elementów w serii.
d = [1, 2, 3, 4, 5]
s = pd. Seria (d, index=["jeden", "dwa", "trzy", "cztery", "pięć"])
s
Wyjście:
jeden 1
dwa 2
trzy 3
cztery 4
pięć 5
dtype: int64
Jak stworzyć serię za pomocą słownika
Klucze słownika stają się etykietami serii.
d = {"jeden": 1,
"dwa": 2,
„trzy”: 3,
„cztery”: 4,
"pięć": 5}
s = pd. Seria (d)
s
Wyjście:
jeden 1
dwa 2
trzy 3
cztery 4
pięć 5
dtype: int64
Jak utworzyć serię przy użyciu wartości skalarnej
Jeśli chcesz utworzyć szereg przy użyciu wartości skalarnej, musisz podać indeks argument.
s = pd. Seria (1, indeks = ["a", "b", "c", "d"])
s
Wyjście:
1
b 1
c 1
d 1
dtype: int64
3. Jak stworzyć Dataframe w Pandas
DataFrame to dwuwymiarowa struktura danych, w której dane są wyrównane w postaci wierszy i kolumn. DataFrame można utworzyć za pomocą słowników, list, listy słowników, tablic numpy itp. W świecie rzeczywistym ramki DataFrame są tworzone przy użyciu istniejącej pamięci masowej, takiej jak pliki CSV, pliki Excel, bazy danych SQL itp.
Obiekt DataFrame obsługuje wiele atrybutów i metod. Jeśli chcesz dowiedzieć się o nich więcej, zapoznaj się z oficjalną dokumentacją pandy dataframe.
Jak utworzyć pustą ramkę danych?
df = pd. Ramka danych()
drukuj (df)
Wyjście:
Pusta ramka danych
Kolumny: []
Indeks: []
Jak utworzyć ramkę DataFrame za pomocą listy?
listObj = ["MUO", "technologia", "uproszczony"]
df = pd. Ramka danych (listObj)
drukuj (df)
Wyjście:
0
0 mln zł
1 technologia
2 uproszczone
Jak utworzyć ramkę danych za pomocą słownika ndarray/list
batmanData = {'Nazwa filmu': ['Batman zaczyna', 'Mroczny rycerz', 'Mroczny rycerz powstaje'],
„Rok wydania”: [2005, 2008, 2012]}
df = pd. Ramka danych (batmanData)
drukuj (df)
Wyjście:
Nazwa filmu Rok wydania
0 Początek Batmana 2005
1 Mroczny Rycerz 2008
2 Mroczny Rycerz Powstaje 2012
Jak utworzyć ramkę DataFrame za pomocą listy list
dane = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (dane, kolumny = ['Nazwa', 'Nr rolki'])
drukuj (df)
Wyjście:
Nazwa Nr rolki
0 Alex 601
1 Bob 602
2 Katalina 603
Jak utworzyć ramkę danych za pomocą listy słowników
data = [{'Nazwa': 'Alex', 'Nr rolki': 601},
{'Imię': 'Bob', 'Nr rolki': 602},
{'Nazwa': 'Katalina', 'Nr rolki': 603}]
df = pd. Ramka danych (dane)
drukuj (df)
Wyjście:
Nazwa Nr rolki
0 Alex 601
1 Bob 602
2 Katalina 603
Związane z: Jak przekonwertować listę na słownik w Pythonie?
Jak utworzyć ramkę danych za pomocą funkcji zip()?
Użyj zamek błyskawiczny() funkcja scalania list w Pythonie.
Imię = ['Alex', 'Bob', 'Katalina']
Nr rolki = [601, 602, 603]
listOfTuples = lista (zip (Name, RollNo))
df = pd. DataFrame (listOfTuples, kolumny = ['Nazwa', 'Nr rolki'])
drukuj (df)
Wyjście:
Nazwa Nr rolki
0 Alex 601
1 Bob 602
2 Katalina 603
4. Jak czytać dane CSV w Pandas
Plik „wartości rozdzielanych przecinkami” (CSV) to rozdzielany plik tekstowy, w którym do oddzielania wartości używa się przecinka. Możesz odczytać plik CSV za pomocą odczyt_csv() metoda u pand. Jeśli chcesz wydrukować całą ramkę DataFrame, użyj przycisku do_ciągu() metoda.
W tym i następnych przykładach to Plik CSV zostaną wykorzystane do wykonania operacji.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.to_string())
Wyjście:
5. Jak analizować ramki danych za pomocą metod head(), tail() i info()
Jak przeglądać dane za pomocą metody head()?
ten głowa() Metoda jest jednym z najlepszych sposobów uzyskania szybkiego przeglądu DataFrame. Ta metoda zwraca nagłówek i określoną liczbę wierszy, zaczynając od góry.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nadruk (głowica df (10))
Wyjście:
Jeśli nie określisz liczby wierszy, zostanie zwróconych pierwszych 5 wierszy.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.head())
Wyjście:
Jak przeglądać dane za pomocą metody tail()?
ten ogon() metoda zwraca nagłówek i określoną liczbę wierszy, zaczynając od dołu.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
nadruk (df.ogon (10))
Wyjście:
Jeśli nie określisz liczby wierszy, zostanie zwróconych 5 ostatnich wierszy.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.tail())
Wyjście:
Jak uzyskać informacje o danych?
ten informacje() metody zwracają krótkie podsumowanie DataFrame, w tym indeks dtype i dtypes kolumny, wartości inne niż null i użycie pamięci.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drukuj (df.info())
Wyjście:
6. Jak czytać dane JSON w Pandas
JSON (JavaSkrypto Oobiekt notation) to lekki format wymiany danych. Możesz odczytać plik JSON za pomocą read_json() metoda u pand. Jeśli chcesz wydrukować całą ramkę DataFrame, użyj przycisku do_ciągu() metoda.
W poniższym przykładzie to Plik JSON służy do wykonywania operacji.
Związane z: Co to jest JSON? Przegląd laika
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
drukuj (df.to_string())
Wyjście:
Odśwież swoją wiedzę o Pythonie dzięki wbudowanym funkcjom i metodom
Funkcje pomagają skrócić kod i poprawić jego wydajność. Funkcje i metody takie jak zmniejszyć(), podział(), wyliczać(), oceń(), okrągły()itp. może sprawić, że Twój kod będzie solidny i łatwy do zrozumienia. Zawsze dobrze jest wiedzieć o wbudowanych funkcjach i metodach, ponieważ mogą one znacznie uprościć zadania programistyczne.
Biblioteka standardowa Pythona zawiera wiele funkcji ułatwiających wykonywanie zadań programistycznych. Dowiedz się o najbardziej przydatnych i stwórz bardziej niezawodny kod.
Czytaj dalej
- Programowanie
- Pyton
- Tworzenie stron internetowych
- Programowanie
- Analiza danych
Yuvraj jest studentem informatyki na Uniwersytecie w Delhi w Indiach. Jest pasjonatem Full Stack Web Development. Kiedy nie pisze, bada głębię różnych technologii.
Zapisz się do naszego newslettera
Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Kliknij tutaj, aby zasubskrybować