Jak skonsolidować wiele skoroszytów programu Excel za pomocą Pythona

Python jako język jest niezmiernie cenny, zwłaszcza gdy chcesz pracować z danymi strukturalnymi. Ponieważ ludzie przechowują dużo danych w plikach Excel, konieczne jest skonsolidowanie wielu plików, aby zaoszczędzić czas i wysiłek.

Python pozwala ci to zrobić; bez względu na to, ile plików Excela chcesz połączyć, możesz to zrobić ze względną łatwością. Biorąc pod uwagę zakres bibliotek i zasobów innych firm, możesz importować i używać wieloaspektowych narzędzi Pythona do wykonywania swoich licytacji.

W tym przewodniku będziesz musiał zainstalować i używać bibliotek Pandas do importowania danych do Pythona przed ich konsolidacją.

Zainstaluj biblioteki Pandas w Pythonie

Pandas to biblioteka innej firmy, którą można zainstalować w Pythonie. Niektóre IDE mają już zainstalowane Pandy.

Jeśli używasz an Wersja IDE który nie jest dostarczany z preinstalowanymi Pandami, możesz być pewien, że możesz zainstalować go bezpośrednio w Pythonie.

Oto jak zainstalować Pandy:

pip zainstaluj pandy

Jeśli używasz notesu Jupyter, możesz zainstalować Pandy bezpośrednio za pomocą

instagram viewer

polecenie PIP. W większości przypadków po zainstalowaniu Jupytera z Anacondą istnieje duże prawdopodobieństwo, że Pandy będą już dostępne do bezpośredniego użytku.

Jeśli nie możesz zadzwonić do Pand, możesz użyć powyższego polecenia, aby zainstalować je bezpośrednio.

Łączenie plików Excela z Pythonem

Najpierw musisz utworzyć folder w preferowanej lokalizacji ze wszystkimi plikami Excel. Gdy folder jest gotowy, możesz zacząć pisać kod, aby zaimportować biblioteki.

W tym kodzie użyjesz dwóch zmiennych:

Pandy: Biblioteka Pandas udostępnia ramki danych do przechowywania plików Excel.
System operacyjny: Biblioteka jest korzystna przy odczytywaniu danych z folderu twojego komputera

Aby zaimportować te biblioteki, użyj tych poleceń:

Importuj Pandy jako pd
Importuj system operacyjny

Import: Składnia Pythona używana do importowania bibliotek w Pythonie
Pandy: Nazwa biblioteki
pd: Pseudonim nadany bibliotece
System operacyjny: Biblioteka umożliwiająca dostęp do folderu systemowego

Po zaimportowaniu bibliotek utwórz dwie zmienne do przechowywania ścieżki pliku wejściowego i wyjściowego. Ścieżka do pliku wejściowego jest potrzebna, aby uzyskać dostęp do folderu plików. Ścieżka do pliku wyjściowego jest konieczna, ponieważ połączony plik zostanie tam wyeksportowany.

Jeśli używasz Pythona, upewnij się, że zmieniłeś ukośnik odwrotny na ukośnik w przód (\ do /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Dołącz / na końcu również, aby ukończyć ścieżki.

Pliki folderu są dostępne na liście. Utwórz listę, aby przechowywać wszystkie odniesienia do plików w folderze wejściowym, używając listdir funkcja z OS Biblioteka.

Jeśli nie masz pewności co do funkcji dostępnych w bibliotece, możesz użyć reż funkcja z nazwą biblioteki. Na przykład, aby sprawdzić dokładną wersję funkcji listdir, możesz użyć polecenia w następujący sposób:

reż. (OS)

Dane wyjściowe będą zawierać wszystkie powiązane funkcje dostępne w bibliotece systemu operacyjnego. Funkcja listdir jest jedną z wielu funkcji dostępnych w tej bibliotece.

Utwórz nową zmienną do przechowywania plików wejściowych z folderu.

excel_file_list = os.listdir (ścieżka_pliku_wejściowego)

Wydrukuj tę zmienną, aby zobaczyć nazwy plików przechowywanych w folderze. Wszystkie pliki zapisane w folderze są wyświetlane po użyciu funkcji drukowania.

drukuj (lista_plików_excela)

Następnie musisz dodać nową ramkę danych do przechowywania każdego pliku Excel. Wyobraź sobie ramkę danych jako pojemnik do przechowywania danych. Oto polecenie do tworzenia ramki danych.

df = pd. Ramka danych()

df: Zmienna do przechowywania wartości DataFrame
pd: Alias dla Biblioteka Pand
Ramka danych: Domyślna składnia dodawania ramki danych

Folder wejściowy ma trzy .xlsx w tym przykładzie. Nazwy plików to:

Plik1_excel.xlsx
Plik2_excel.xlsx
Plik3_excel.xlsx

Aby otworzyć każdy plik z tego folderu, musisz uruchomić pętlę. Pętla zostanie uruchomiona dla każdego z plików z powyższej listy.

Oto jak możesz to zrobić:

dla plików excel w excel_file_list:

Następnie należy sprawdzić rozszerzenia plików, ponieważ kod otworzy tylko pliki XLSX. Aby sprawdzić te pliki, możesz użyć Jeśli oświadczenie.

Użyj kończy się funkcjonują w tym celu w następujący sposób:

dla plików excel w excel_file_list:if excel_files.endswith(.xlsx"):

excel_files: Lista ze wszystkimi wartościami plików
kończy się na: Funkcja sprawdzania rozszerzenia plików
(".xlsx"): Ta wartość ciągu może się zmieniać w zależności od tego, czego chcesz szukać

Teraz, po zidentyfikowaniu plików programu Excel, możesz utworzyć nową ramkę danych, aby indywidualnie odczytywać i przechowywać pliki.

dla plików excel w excel_file_list:if excel_files.endswith(.xlsx"):df1 = pd.read_excel (ścieżka_pliku_wejściowego+pliki_excel)

df1: Nowa ramka danych
pd: Biblioteka Pand
read_excel: Funkcja odczytu plików Excel w bibliotece Pandy
input_file_path: Ścieżka folderu, w którym przechowywane są pliki
excel_files: Dowolna zmienna używana w pętli for

Aby rozpocząć dołączanie plików, musisz użyć dodać funkcjonować.

dla plików excel w excel_file_list:if excel_files.endswith(.xlsx"):df1 = pd.read_excel (ścieżka_pliku_wejściowego+pliki_excel)
 df = df.dołącz (df1)

Wreszcie, teraz, gdy skonsolidowana ramka danych jest gotowa, możesz ją wyeksportować do lokalizacji wyjściowej. W takim przypadku eksportujesz ramkę danych do pliku XLSX.

df.to_excel (ścieżka_pliku_wyjściowego+"Skonsolidowany_plik.xlsx")

df: Dataframe do eksportu
to_excel: Polecenie używane do eksportu danych
ścieżka_pliku_wyjściowego: Ścieżka zdefiniowana do przechowywania danych wyjściowych
Skonsolidowany_plik.xlsx: Nazwa skonsolidowanego pliku

Spójrzmy teraz na ostateczny kod:

#Pandas służy jako ramka danych do obsługi plików Excel importuj pandy jako PD importuj system# zmień ukośnik z „\” na „/”, jeśli używasz urządzeń z systemem Windows input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/" output_file_path = "C:/Users/gaurav/OneDrive/Desktop/" #utwórz listę do przechowywania wszystkich odniesień do plików folderu wejściowego za pomocą funkcji listdir z biblioteki os. #Aby zobaczyć zawartość biblioteki (jak funkcja listdir, możesz użyć funkcji dir na nazwie biblioteki). #Użyj dir (library_name), aby wyświetlić zawartość excel_file_list = os.listdir (ścieżka_pliku_wejściowego) #wydrukuj wszystkie pliki zapisane w folderze, po zdefiniowaniu listy excel_file_list #Po otwarciu każdego pliku użyj funkcji dołączania, aby rozpocząć konsolidację danych przechowywanych w wielu plikach #utwórz nową, pustą ramkę danych, aby obsłużyć import plików Excel df = pd. Ramka danych() #Uruchom pętlę for, aby przejść przez każdy plik na liście dla plików excel w excel_file_list: #sprawdź tylko pliki z rozszerzeniem .xlsx if excel_files.endswith(.xlsx"): #utwórz nową ramkę danych, aby odczytać/otworzyć każdy plik Excel z listy plików utworzonych powyżej df1 = pd.read_excel (ścieżka_pliku_wejściowego+pliki_excel) #dołącz każdy plik do oryginalnej pustej ramki danych df = df.dołącz (df1)

#przenieś końcowe dane wyjściowe do pliku Excel (xlsx) na ścieżce wyjściowej df.to_excel (ścieżka_pliku_wyjściowego+"Skonsolidowany_plik.xlsx")

Używanie Pythona do łączenia wielu skoroszytów programu Excel

Pandas Pythona to doskonałe narzędzie zarówno dla początkujących, jak i zaawansowanych użytkowników. Biblioteka jest szeroko wykorzystywana przez programistów, którzy chcą opanować Pythona.

Nawet jeśli jesteś początkujący, możesz ogromnie skorzystać, poznając niuanse Pand i sposób, w jaki biblioteka jest używana w Pythonie.

6 operacji pand dla początkujących

Naucz się pand, wykonując te operacje dla początkujących.

Czytaj dalej

DzielićĆwierkaćE-mail

Powiązane tematy

Programowanie
Pyton
Microsoft Excel
Arkusz

O autorze

Gaurav Siyal (59 opublikowanych artykułów)

Gaurav Siyal ma dwuletnie doświadczenie w pisaniu dla szeregu firm zajmujących się marketingiem cyfrowym i dokumentach dotyczących cyklu życia oprogramowania.

Więcej od Gaurava Siyala

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Kliknij tutaj, aby zasubskrybować

About Technology - denizatm.com

Jak skonsolidować wiele skoroszytów programu Excel za pomocą Pythona

Zainstaluj biblioteki Pandas w Pythonie

Łączenie plików Excela z Pythonem

Używanie Pythona do łączenia wielu skoroszytów programu Excel

Zapisz się do naszego newslettera

Kategorie

Recent Post

3 upiorne efekty deszczomierza na Halloween

Twój następny Android może być BlackBerry, zasadami neutralności sieci i nie tylko... [Przegląd wiadomości technicznych]

5 sposobów na ochronę Twojego bezpieczeństwa w biurze