Python jako język jest niezmiernie cenny, zwłaszcza gdy chcesz pracować z danymi strukturalnymi. Ponieważ ludzie przechowują dużo danych w plikach Excel, konieczne jest skonsolidowanie wielu plików, aby zaoszczędzić czas i wysiłek.
Python pozwala ci to zrobić; bez względu na to, ile plików Excela chcesz połączyć, możesz to zrobić ze względną łatwością. Biorąc pod uwagę zakres bibliotek i zasobów innych firm, możesz importować i używać wieloaspektowych narzędzi Pythona do wykonywania swoich licytacji.
W tym przewodniku będziesz musiał zainstalować i używać bibliotek Pandas do importowania danych do Pythona przed ich konsolidacją.
Zainstaluj biblioteki Pandas w Pythonie
Pandas to biblioteka innej firmy, którą można zainstalować w Pythonie. Niektóre IDE mają już zainstalowane Pandy.
Jeśli używasz an Wersja IDE który nie jest dostarczany z preinstalowanymi Pandami, możesz być pewien, że możesz zainstalować go bezpośrednio w Pythonie.
Oto jak zainstalować Pandy:
pip zainstaluj pandy
Jeśli używasz notesu Jupyter, możesz zainstalować Pandy bezpośrednio za pomocą
polecenie PIP. W większości przypadków po zainstalowaniu Jupytera z Anacondą istnieje duże prawdopodobieństwo, że Pandy będą już dostępne do bezpośredniego użytku.Jeśli nie możesz zadzwonić do Pand, możesz użyć powyższego polecenia, aby zainstalować je bezpośrednio.
Łączenie plików Excela z Pythonem
Najpierw musisz utworzyć folder w preferowanej lokalizacji ze wszystkimi plikami Excel. Gdy folder jest gotowy, możesz zacząć pisać kod, aby zaimportować biblioteki.
W tym kodzie użyjesz dwóch zmiennych:
- Pandy: Biblioteka Pandas udostępnia ramki danych do przechowywania plików Excel.
- System operacyjny: Biblioteka jest korzystna przy odczytywaniu danych z folderu twojego komputera
Aby zaimportować te biblioteki, użyj tych poleceń:
Importuj Pandy jako pd
Importuj system operacyjny
- Import: Składnia Pythona używana do importowania bibliotek w Pythonie
- Pandy: Nazwa biblioteki
- pd: Pseudonim nadany bibliotece
- System operacyjny: Biblioteka umożliwiająca dostęp do folderu systemowego
Po zaimportowaniu bibliotek utwórz dwie zmienne do przechowywania ścieżki pliku wejściowego i wyjściowego. Ścieżka do pliku wejściowego jest potrzebna, aby uzyskać dostęp do folderu plików. Ścieżka do pliku wyjściowego jest konieczna, ponieważ połączony plik zostanie tam wyeksportowany.
Jeśli używasz Pythona, upewnij się, że zmieniłeś ukośnik odwrotny na ukośnik w przód (\ do /)
input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"
Dołącz / na końcu również, aby ukończyć ścieżki.
Pliki folderu są dostępne na liście. Utwórz listę, aby przechowywać wszystkie odniesienia do plików w folderze wejściowym, używając listdir funkcja z OS Biblioteka.
Jeśli nie masz pewności co do funkcji dostępnych w bibliotece, możesz użyć reż funkcja z nazwą biblioteki. Na przykład, aby sprawdzić dokładną wersję funkcji listdir, możesz użyć polecenia w następujący sposób:
reż. (OS)
Dane wyjściowe będą zawierać wszystkie powiązane funkcje dostępne w bibliotece systemu operacyjnego. Funkcja listdir jest jedną z wielu funkcji dostępnych w tej bibliotece.
Utwórz nową zmienną do przechowywania plików wejściowych z folderu.
excel_file_list = os.listdir (ścieżka_pliku_wejściowego)
Wydrukuj tę zmienną, aby zobaczyć nazwy plików przechowywanych w folderze. Wszystkie pliki zapisane w folderze są wyświetlane po użyciu funkcji drukowania.
drukuj (lista_plików_excela)
Następnie musisz dodać nową ramkę danych do przechowywania każdego pliku Excel. Wyobraź sobie ramkę danych jako pojemnik do przechowywania danych. Oto polecenie do tworzenia ramki danych.
df = pd. Ramka danych()
- df: Zmienna do przechowywania wartości DataFrame
- pd: Alias dla Biblioteka Pand
- Ramka danych: Domyślna składnia dodawania ramki danych
Folder wejściowy ma trzy .xlsx w tym przykładzie. Nazwy plików to:
Plik1_excel.xlsx
Plik2_excel.xlsx
Plik3_excel.xlsx
Aby otworzyć każdy plik z tego folderu, musisz uruchomić pętlę. Pętla zostanie uruchomiona dla każdego z plików z powyższej listy.
Oto jak możesz to zrobić:
dla plików excel w excel_file_list:
Następnie należy sprawdzić rozszerzenia plików, ponieważ kod otworzy tylko pliki XLSX. Aby sprawdzić te pliki, możesz użyć Jeśli oświadczenie.
Użyj kończy się funkcjonują w tym celu w następujący sposób:
dla plików excel w excel_file_list:
if excel_files.endswith(.xlsx"):
- excel_files: Lista ze wszystkimi wartościami plików
- kończy się na: Funkcja sprawdzania rozszerzenia plików
- (".xlsx"): Ta wartość ciągu może się zmieniać w zależności od tego, czego chcesz szukać
Teraz, po zidentyfikowaniu plików programu Excel, możesz utworzyć nową ramkę danych, aby indywidualnie odczytywać i przechowywać pliki.
dla plików excel w excel_file_list:
if excel_files.endswith(.xlsx"):
df1 = pd.read_excel (ścieżka_pliku_wejściowego+pliki_excel)
- df1: Nowa ramka danych
- pd: Biblioteka Pand
- read_excel: Funkcja odczytu plików Excel w bibliotece Pandy
- input_file_path: Ścieżka folderu, w którym przechowywane są pliki
- excel_files: Dowolna zmienna używana w pętli for
Aby rozpocząć dołączanie plików, musisz użyć dodać funkcjonować.
dla plików excel w excel_file_list:
if excel_files.endswith(.xlsx"):
df1 = pd.read_excel (ścieżka_pliku_wejściowego+pliki_excel)
df = df.dołącz (df1)
Wreszcie, teraz, gdy skonsolidowana ramka danych jest gotowa, możesz ją wyeksportować do lokalizacji wyjściowej. W takim przypadku eksportujesz ramkę danych do pliku XLSX.
df.to_excel (ścieżka_pliku_wyjściowego+"Skonsolidowany_plik.xlsx")
- df: Dataframe do eksportu
- to_excel: Polecenie używane do eksportu danych
- ścieżka_pliku_wyjściowego: Ścieżka zdefiniowana do przechowywania danych wyjściowych
- Skonsolidowany_plik.xlsx: Nazwa skonsolidowanego pliku
Spójrzmy teraz na ostateczny kod:
#Pandas służy jako ramka danych do obsługi plików Excel
importuj pandy jako PD
importuj system# zmień ukośnik z „\” na „/”, jeśli używasz urządzeń z systemem Windows
input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"#utwórz listę do przechowywania wszystkich odniesień do plików folderu wejściowego za pomocą funkcji listdir z biblioteki os.
#Aby zobaczyć zawartość biblioteki (jak funkcja listdir, możesz użyć funkcji dir na nazwie biblioteki).
#Użyj dir (library_name), aby wyświetlić zawartośćexcel_file_list = os.listdir (ścieżka_pliku_wejściowego)
#wydrukuj wszystkie pliki zapisane w folderze, po zdefiniowaniu listy
excel_file_list#Po otwarciu każdego pliku użyj funkcji dołączania, aby rozpocząć konsolidację danych przechowywanych w wielu plikach
#utwórz nową, pustą ramkę danych, aby obsłużyć import plików Excel
df = pd. Ramka danych()#Uruchom pętlę for, aby przejść przez każdy plik na liście
dla plików excel w excel_file_list:
#sprawdź tylko pliki z rozszerzeniem .xlsx
if excel_files.endswith(.xlsx"):
#utwórz nową ramkę danych, aby odczytać/otworzyć każdy plik Excel z listy plików utworzonych powyżej
df1 = pd.read_excel (ścieżka_pliku_wejściowego+pliki_excel)
#dołącz każdy plik do oryginalnej pustej ramki danych
df = df.dołącz (df1)
#przenieś końcowe dane wyjściowe do pliku Excel (xlsx) na ścieżce wyjściowej
df.to_excel (ścieżka_pliku_wyjściowego+"Skonsolidowany_plik.xlsx")
Używanie Pythona do łączenia wielu skoroszytów programu Excel
Pandas Pythona to doskonałe narzędzie zarówno dla początkujących, jak i zaawansowanych użytkowników. Biblioteka jest szeroko wykorzystywana przez programistów, którzy chcą opanować Pythona.
Nawet jeśli jesteś początkujący, możesz ogromnie skorzystać, poznając niuanse Pand i sposób, w jaki biblioteka jest używana w Pythonie.
Naucz się pand, wykonując te operacje dla początkujących.
Czytaj dalej
- Programowanie
- Pyton
- Microsoft Excel
- Arkusz

Gaurav Siyal ma dwuletnie doświadczenie w pisaniu dla szeregu firm zajmujących się marketingiem cyfrowym i dokumentach dotyczących cyklu życia oprogramowania.
Zapisz się do naszego newslettera
Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Kliknij tutaj, aby zasubskrybować