Artykuł w Next Button: 899988
Jupyter Notebook to narzędzie numer jeden dla naukowców zajmujących się danymi. Oferuje interaktywny interfejs sieciowy, którego można używać do wizualizacji danych, łatwej analizy i współpracy.
Wizualizacja danych umożliwia znalezienie kontekstu dla danych za pomocą map lub wykresów. Ten samouczek zawiera wnikliwy przewodnik po interakcji z wykresami w Jupyter Notebook.
Wymagania wstępne
Musisz mieć zainstalowany Jupyter na twoim komputerze. Jeśli tak nie jest, możesz go zainstalować, wprowadzając następujący kod w wierszu poleceń:
$ pip install jupyter
Będziesz także potrzebować pandy i matplotlib biblioteka:
$ pip zainstaluj pandy
$ pip zainstaluj matplotlib
Po zakończeniu instalacji uruchom serwer Jupyter Notebook. Aby to zrobić, wpisz poniższe polecenie w terminalu. Strona Jupyter pokazująca pliki w bieżącym katalogu otworzy się w domyślnej przeglądarce komputera.
Notatnik $ jupyter
Uwaga: Nie zamykaj okna terminala, w którym uruchamiasz to polecenie. Twój serwer zostanie zatrzymany, jeśli to zrobisz.
Prosta fabuła
Na nowej stronie Jupyter uruchom ten kod:
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5, 6, 7, 8]
y = [2,4,6,8,10,12,14,16]
plt.plot (x, y)
plt.show ()
Kod dotyczy prostego wykresu liniowego. Pierwsza linia importuje plik pyplot Biblioteka graficzna z matplotlib API. Trzecia i czwarta linia definiują odpowiednio osie x i y.
Plik wątek() wywoływana jest metoda wykreślania wykresu. Plik pokazać() jest następnie używana do wyświetlenia wykresu.
Załóżmy, że zamiast tego chcesz narysować krzywą. Proces jest taki sam. Po prostu zmień wartości lista Pythona dla osi y.
import matplotlib.pyplot as plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.plot (x, y)
plt.show ()
Zwróć uwagę na coś ważnego: na obu wykresach nie ma wyraźnej definicji skali. Skala jest obliczana i stosowana automatycznie. Jest to jedna z wielu interesujących funkcji oferowanych przez Juypter, dzięki której możesz skupić się na pracy (analizie danych) zamiast martwić się o kod.
Jeśli jesteś również czujny, możesz zauważyć, że liczba wartości na osi x i y jest taka sama. Jeśli którykolwiek z nich jest mniejszy od drugiego, po uruchomieniu kodu zostanie oflagowany błąd i nie zostanie wyświetlony żaden wykres.
Dostępne typy
W przeciwieństwie do powyższego wykresu liniowego i krzywej, inne wizualizacje wykresów (np. Histogram, wykres słupkowy itp.) Muszą być wyraźnie zdefiniowane, aby można je było wyświetlić.
Wykres słupkowy
Aby wyświetlić wykres słupkowy, musisz użyć rozszerzenia bar() metoda.
import matplotlib.pyplot as plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.bar (x, y)
plt.show ()
Wykres punktowy
Wszystko, co musisz zrobić, to użyć rozpraszać() w poprzednim kodzie.
import matplotlib.pyplot as plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt.scatter (x, y)
plt.show ()
Wykres kołowy
Wykres kołowy różni się nieco od reszty powyżej. Linia 4 jest szczególnie interesująca, więc spójrz na jej funkcje.
rozmiar figi służy do ustawiania współczynnika kształtu. Możesz ustawić to na wszystko, co lubisz (np. (9,5)), ale oficjalna dokumentacja Pandas radzi, aby użyć współczynnika proporcji 1.
import matplotlib.pyplot as plt
x = [4,9,16,25,36]
fig = plt.figure (figsize = (9, 5)) # line 4
plt.pie (x)
plt.show ()
Jest kilka parametrów, które ma wykres kołowy, na które warto zwrócić uwagę:
etykiety - Można to wykorzystać do nadania etykiety każdemu wycinkowi na wykresie kołowym.
zabarwienie - Można to wykorzystać do nadania wstępnie zdefiniowanych kolorów każdemu z plasterków. Możesz określić kolory zarówno w formie tekstowej (np. „Żółty”), jak i szesnastkowej (np. „# Ebc713”).
Zobacz poniższy przykład:
import matplotlib.pyplot as plt
x = [4,9,16,25,36]
fig = plt.figure (figsize = (5.5, 5.5))
plt.pie (x, labels = ("Guawa", "Jagody", "Mango", "Jabłka", "Awokado"),
colors = ("# a86544", "# eb5b13", "# ebc713", "# bdeb13", "# 8aeb13"))
plt.show ()
Istnieją również inne wątki, takie jak hist, powierzchnia i kde że możesz przeczytaj więcej o dokumentach Pandas.
Formatowanie wydruku
Na powyższych działkach nie ma żadnych aspektów, takich jak etykiety. Oto jak to zrobić.
Aby dodać tytuł, umieść poniższy kod w swoim notesie Jupyter:
matplotlib.pyplot.title („Tytuł mojego wykresu”)
Osie X i Y można odpowiednio opisać, jak poniżej:
matplotlib.pyplot.xlabel („moja etykieta osi X”)
matplotlib.pyplot.ylabel („moja etykieta osi Y”)
Uczyć się więcej
Możesz uruchomić Wsparcie() polecenie w notatniku, aby uzyskać interaktywną pomoc dotyczącą poleceń Jupyter. Aby uzyskać więcej informacji na temat konkretnego obiektu, możesz użyć pomoc (obiekt).
Dobrą praktyką będzie również rysowanie wykresów przy użyciu zestawów danych z plików csv. Nauka wizualizacji danych to potężne narzędzie do komunikowania się i analizowania wyników, dlatego warto poświęcić trochę czasu na rozwinięcie swoich umiejętności.
W przypadku zaawansowanej analizy danych Python jest lepszy niż Excel. Oto jak zaimportować dane z Excela do skryptu Pythona za pomocą Pandy!
Czytaj dalej
- Programowanie
- Pyton
- Samouczki kodowania
- Analiza danych
Jerome jest autorem pracującym w MakeUseOf. Publikuje artykuły o programowaniu i Linuksie. Jest także entuzjastą kryptowalut i zawsze śledzi branżę kryptowalut.
Zapisz się do naszego newslettera
Dołącz do naszego biuletynu, aby otrzymywać wskazówki techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Jeszcze jeden krok…!
Potwierdź swój adres e-mail w wiadomości e-mail, którą właśnie wysłaliśmy.