Przy całej rozmowie o uczeniu maszynowym w ostatnich latach trudno zignorować chęć wypróbowania tego samodzielnie. Technologia wydaje się ewoluować w bardzo szybkim tempie i znalazła już zastosowanie w wielu środowiskach. Jeśli masz pewne umiejętności programistyczne i podstawową wiedzę na temat niektórych pojęć dotyczących statystyk, dobrze jest przejść do wymagań dotyczących umiejętności.
Musisz jednak wziąć pod uwagę sprzęt, który będzie Ci do tego potrzebny. Możesz hostować wszystko w domu lub korzystać z usług zdalnych - obie mają swoje wady i zalety.
Podstawowe wymagania dotyczące rozwoju uczenia maszynowego
Aby wszystko działało, będziesz potrzebować stosunkowo wydajnego sprzętu. Chociaż możesz uruchomić większość powiązanych narzędzi na niedrogim laptopie, Twój potencjał uczenia się będzie znacznie ograniczony, a wszystko zajmie znacznie więcej czasu niż to konieczne.
Twój GPU (Graphics Processing Unit) jest tutaj najważniejszym komponentem. Nie ma to nic wspólnego z grafiką. Po prostu układy GPU lepiej nadają się do typów obliczeń, na których opiera się uczenie maszynowe.
GPU obsługujący CUDA będzie tutaj jeszcze lepszy, chociaż zdobycie go będzie kosztować więcej. Nie martw się, jeśli obecnie nie stać Cię na tego rodzaju sprzęt. Możesz także uruchamiać swoje rozwiązania zdalnie, ale będziesz musiał radzić sobie z wzlotami i upadkami tej konfiguracji.
Czytaj więcej: Co to są rdzenie CUDA?
Dlaczego Twoje koszty mogą być wyższe w 2021 r
Warto również zauważyć, że zakup nowego sprzętu do uczenia maszynowego może być teraz jeszcze trudniejszy. Na całym świecie rozwija się trudna sytuacja związana z niedoborem półprzewodników używanych do produkcji różnych elektroniki użytkowej. Od procesorów graficznych po smartfony i inne urządzenia, wpłynęło to na wiele rynków.
Niektóre prognozy mówią, że niedobór ten może trwać jeszcze kilka lat, ponieważ był wynikiem nieoczekiwanego dopasowania się kilku czynników. Pomiędzy pandemią, która osłabia zdolności produkcyjne i zwiększa popyt, a górnikami i konstruktorami wykupując cały czas, sytuacja była trudna dla tych, którzy chcą tylko kupić nowy GPU.
Związane z: Dlaczego karty graficzne są teraz tak drogie?
Nie jest też jasne, kiedy ceny będą się normalizować - ceny mogą nadal rosnąć. Poszukiwanie używanego procesora graficznego może być lepszą opcją, ale nie możesz zagwarantować, że znajdziesz coś odpowiedniego.
Zalety i wady platform hostowanych
Hostowana platforma do rozwoju uczenia maszynowego pozwoli Ci skupić się na faktycznej pracy programistycznej bez martwienia się o kwestie sprzętowe. Skorzystasz z zaawansowanej mocy obliczeniowej, a platformy te mogą zazwyczaj uruchamiać Twoje rozwiązania znacznie szybciej niż wszystko, co możesz zbudować w domu.
Oczywiście tego rodzaju moc nie jest za darmo. Aby korzystać z większości tych usług, będziesz musiał zapłacić abonament. Te, które są oferowane za darmo, mają własne oddzielne ograniczenia.
Na przykład może nie być możliwe uruchomienie programu na żądanie i może być konieczne czekanie w kolejce. Może to być szczególnie problematyczne w przypadku dłuższych sesji treningowych, podczas których będziesz musiał dodać kilka dodatkowych godzin do i tak już długiego okresu oczekiwania.
A potem niektórzy ludzie po prostu czują się bardziej komfortowo w swojej pracy, gdy mają wszystko dostępne lokalnie. Z pewnością wygodniej jest pracować z uczeniem maszynowym w ten sposób, gdy niektóre modele mogą mieć kilka gigabajtów, a przesłanie ich do iz odpowiednich serwerów może zająć trochę czasu.
Najlepsze z obu światów
Możesz zastosować podejście mieszane. Większość prac programistycznych wykonuj lokalnie - podobnie jak rzeczywistą pracę nad algorytmami i modelami - oraz korzystaj z usługi hostowanej do poważnego, kosztownego przetwarzania.
Zwykle możesz przesyłać dane partiami, aby były przetwarzane wszystkie naraz przez pewien okres czasu, a następnie musisz po prostu wrócić, aby później odzyskać wyniki. Może to działać dobrze, gdy nie potrzebujesz natychmiastowych wyników, i może pozwolić na przeprowadzenie drogiego szkolenia przy stosunkowo niskich kosztach.
W dzisiejszych czasach jest to podejście, które przyjmuje większość ludzi. Jeśli nie chcesz wydawać zbyt dużo na sprzęt, ale nie przeszkadza Ci pomysł wydania na to trochę pieniędzy, prawdopodobnie powinieneś się tym zająć.
Na rynku dostępnych jest wiele ofert, a niektóre są skierowane do osób o mniejszych budżetach, więc rozejrzyj się i zobacz, co jest tam dostępne. Czasami możesz uciec z hostowaniem swoich projektów za zaskakująco niewiele, o ile nie mają one żadnych skomplikowanych wymagań.
Uważaj na wrażliwe dane
Pamiętaj, że uczenie maszynowe często może obejmować pracę z poufnymi danymi. Na przykład możesz otrzymać zadanie przetwarzania dokumentacji medycznej lub innych danych osobowych. Nie trzeba mówić, że w takich sytuacjach należy zachować większą ostrożność, jeśli pracuje się ze zdalnymi usługami hostowanymi.
Musisz zdawać sobie sprawę z konsekwencji przesyłania tych danych na zdalne serwery. Czasami możesz naruszyć pewne ramy prawne, nawet nie zdając sobie z tego sprawy. Na przykład w Unii Europejskiej trzeba bardzo uważać na RODO.
Warto skonsultować się ze specjalistą prawnym, jeśli ćwiczenia z uczeniem maszynowym mają obejmować jakiekolwiek poufne dane. Co więcej, prawdopodobnie nie powinieneś używać tego rodzaju danych w pierwszej kolejności do swoich pierwszych projektów szkoleniowych. Po prostu wybierz coś, co jest bezpieczniejsze i łatwiejsze w obsłudze.
Samodzielne uczenie maszynowe
Uczenie maszynowe w domu jest możliwe i ma wiele zalet. Ale ma to również pewne negatywne konsekwencje, które musisz wziąć pod uwagę i musisz upewnić się, że na końcu znajdziesz wyważone podejście. Zwróć szczególną uwagę na szczegóły, takie jak praca z poufnymi danymi i zawsze zapoznaj się z wszelkimi wymogami prawnymi, które może nałożyć na Ciebie Twoja sytuacja.
Ostatecznie może to być bardzo zabawne i produktywne doświadczenie, które może zapewnić Ci świetną pozycję na rynku pracy.
Python jest niezwykle wszechstronny, a jego aplikacje obejmują szeroki zakres zastosowań, od tworzenia stron internetowych po analizę danych.
Czytaj dalej
- Technologia wyjaśniona
- Chmura obliczeniowa
- Nauczanie maszynowe
Stefan jest pisarzem z pasją do nowego. Pierwotnie ukończył studia z tytułem inżyniera geologa, ale zamiast tego postanowił poświęcić się pisaniu na własny rachunek.
Zapisz się do naszego newslettera
Dołącz do naszego biuletynu, aby otrzymywać wskazówki techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Jeszcze jeden krok…!
Potwierdź swój adres e-mail w wiadomości e-mail, którą właśnie wysłaliśmy.