Wszyscy tam byliśmy: wpisujesz nazwę strony internetowej w pasku adresu swojej ulubionej przeglądarki, a może klikasz wynik wyszukiwania Google. Nagle na końcu adresu URL witryny pojawia się ciąg pozornie przypadkowych słów i symboli. Oczywiście nie masz pojęcia, dlaczego tam jest, ale cieszysz się, że możesz bezpiecznie przeglądać listy Amazon, wyniki wyszukiwania Google lub dowolną wybraną witrynę.
Dla niewprawnego oka może to wyglądać jak bełkot, ale każdy znak w adresie URL służy celowi. Przeanalizujmy anatomię adresu URL witryny, od protokołu po ciąg zapytania.
5 kluczowych składników adresu URL
Adres URL można podzielić na trzy główne części: protokół, nazwę domeny i ścieżkę. Następnie możesz przyczepić ciąg zapytania lub wymyślić znacznik zakotwiczenia.
1. Protokół
Pierwszym składnikiem adresu URL jest protokół. Jest to metoda używana do uzyskiwania dostępu do zasobów w Internecie. Najpopularniejszym protokołem do przeglądania stron internetowych jest HTTP (Hypertext Transfer Protocol). Wysyła żądanie z przeglądarki użytkownika do serwera hostującego witrynę, a następnie serwer odsyła żądany zasób jako odpowiedź.
HTTP ma bezpieczną wersję o nazwie HTTPS (HTTP Secure), która wykorzystuje szyfrowanie w celu dodania dodatkowej warstwy bezpieczeństwa. HTTPS jest używany, gdy poufne dane, takie jak hasła lub informacje o kartach kredytowych, są przesyłane przez Internet. Twoja strona potrzebuje certyfikatu SSL używać protokołu HTTPS w swoich adresach URL.
2. Nazwa domeny
Nazwa domeny jest unikalnym identyfikatorem strony internetowej w Internecie. Składa się z dwóch części: domena najwyższego poziomu (TLD) i domeny drugiego poziomu. TLD wskazuje kategorię witryny, na przykład .com dla witryn komercyjnych, .edu dla instytucji edukacyjnych i .org dla organizacji non-profit. Domena drugiego poziomu to unikalna nazwa wybrana przez właściciela serwisu.
Na przykład w nazwie domeny www.makeuseof.com „makeuseof” to domena drugiego poziomu, a „”.com” to TLD. Nazwy domen są rejestrowane u rejestratorów domen i można je kupić na określony okres, zazwyczaj jeden rok, ale czasami dłużej.
3. Ścieżka
Ścieżka adresu URL określa lokalizację zasobu w witrynie internetowej. Zwykle występuje po nazwie domeny i zaczyna się od ukośnika (/). Ścieżka służy do organizowania treści w witrynie internetowej i ułatwiania użytkownikom nawigacji.
Na przykład w adresie URL www.example.com/blog/post1 „blog” to katalog zawierający posty na blogu, a „post1” to konkretny wpis na blogu. Ścieżkę można również wykorzystać do optymalizacji wyszukiwarek (SEO) poprzez uwzględnienie odpowiednich słów kluczowych.
4. Ciąg zapytania
Ciąg zapytania jest częścią adresu URL, który rozpoczyna się znakiem zapytania (?) i zawiera pary klucz-wartość oddzielone ampersandem (&). Służy do przekazywania danych między stronami internetowymi i może zawierać informacje, takie jak wyszukiwane hasła lub preferencje użytkownika.
Na przykład w adresie URL www.example.com/search? q=przykład&kategoria=książki, ciąg zapytania zawiera dwie pary klucz-wartość: „q=przykład” wskazuje, że wyszukiwanym terminem jest „przykład”, a „kategoria=książki” oznacza, że wyszukiwane są książki. Podczas przeglądania witryn, które umożliwiają filtrowanie wyników wyszukiwania lub witryn, które chcą przechwytywać dane śledzenia, często zobaczysz ciągi zapytań zawierające stos parametrów wyszukiwania.
5. Znacznik kotwicy
Tag zakotwiczenia to identyfikator fragmentu, który pojawia się po adresie URL i rozpoczyna się symbolem krzyżyka (#). Łączy się z określoną częścią strony internetowej i może służyć do tworzenia spisu treści lub odsyłacza do określonej sekcji długiego artykułu.
Na przykład w przewodniku zawierającym 5000 słów autor może zamieścić menu nawigacyjne w celu podzielenia treści:
- Definicje
- Historia
- Wyzwania branżowe
- Często zadawane pytania
Jeśli najedziesz kursorem na jeden z tych linków, adres URL może zawierać znacznik zakotwiczenia, taki jak „#definicje”, który sygnalizuje przeglądarce, aby przewinęła w dół do sekcji z tym identyfikatorem w kodzie HTML.
Co to jest kodowanie adresów URL?
Adresy URL zawierają znaki z zestawu znaków ASCII, będącego podzbiorem zestawu znaków Unicode. Unicode to międzynarodowy standard kodowania znaków w różnych językach i alfabetach. Gdy w adresie URL używany jest znak spoza zestawu znaków ASCII, musi on zostać zakodowany, aby przeglądarka prawidłowo go zrozumiała.
Kodowanie adresów URL to proces konwersji znaków spoza zestawu znaków ASCII na ich odpowiedniki ASCII. Na przykład znak Unicode „é” zostałby zakodowany jako „%e9”. Kodowanie adresów URL jest również używane w przypadku znaków specjalnych, takich jak spacje, które są kodowane jako „+” lub „%20”.
Nie martw się o zapamiętywanie każdej możliwej kombinacji kodowania. The Odniesienie do kodowania adresów URL W3Schools przewodnik jest przydatnym źródłem informacji na ten temat.
Czym są przekierowania adresów URL?
Czasami po wprowadzeniu adresu URL w pasku adresu przeglądarki strona internetowa przekieruje do innej strony internetowej. Dzieje się tak, ponieważ adresy URL mogą mieć strukturę na kilka sposobów, a niektóre z nich mogą nie działać zgodnie z oczekiwaniami. Gdy tak się dzieje, serwer odpowiada kodem stanu HTTP wskazującym, że powinien przekierować do innego adresu URL (zwykle 301 lub 302). Nową lokalizację można następnie określić w nagłówku odpowiedzi.
Kody stanu i ich znaczenie obejmują:
- 200 - dobrze: Żądanie powiodło się.
- 301 wyprowadził się permamentnie: Żądany zasób został trwale przeniesiony do nowej lokalizacji i powinien zostać stamtąd pobrany w przyszłych żądaniach.
- 302 - Znaleziono (tymczasowe przekierowanie): Oznacza to, że strona jest tymczasowo umieszczona pod innym adresem URL i nie powinna być zapisywana w pamięci podręcznej wyszukiwarek ani używana jako wiarygodne źródło informacji o jej zawartości. Może również wskazywać na konserwację serwera, gdzie strony są przekierowywane podczas przeprowadzania aktualizacji lub gdy strony docelowe muszą udostępniać alternatywne adresy URL do celów śledzenia, takich jak testy A/B lub podział testy.
Powyższe kody stanu są specyficzne dla ważności samego adresu URL i prawdopodobnie nawet nie będziesz wiedział, że istnieją, podczas swobodnego przeglądania działającej witryny internetowej.
Jeśli jednak pojawią się problemy z adresem URL, witryną lub podstawowym hostingiem, zobaczysz jeden z różnych zestawów kodów:
- 403 - Zakazane: Oznacza to, że nie masz uprawnień do przeglądania strony internetowej. Może to być spowodowane nieprawidłowymi uprawnieniami lub brakiem danych uwierzytelniających.
- 404 Nie Znaleziono: Oznacza to, że żądany zasób nie istnieje na serwerze i powinien zostać usunięty ze wszystkich zakładek lub stron wyników wyszukiwania (SERP).
- 500+ - Błędy serwera: Oznacza to, że podczas przetwarzania żądania wystąpił błąd, który zwykle jest spowodowany problemem z konfiguracją serwera, takim jak błędy kodowania w skryptach, problemy z bazą danych itp.
Błędy w witrynie mogą być irytujące, ale to nie koniec świata. Najpierw spróbuj wymusić odświeżenie strony internetowej. Następnie sprawdź pasek adresu pod kątem błędów spowodowanych przez człowieka. Dodałeś list? Czy marka pisze jedno ze słów w niekonwencjonalny sposób? Czy twój kot przeszedł przez klawiaturę? Jeśli żadne z powyższych rozwiązań nie działa, a to Twoja witryna, skontaktuj się z usługodawcą hostingowym. Niestety, jeśli witryna należy do kogoś innego, będziesz musiał na to poczekać.
Zrozumienie adresów URL Od protokołów do ścieżek
Adres URL składa się z wielu elementów, z których każdy służy do określonego celu. Znając anatomię adresu URL, możesz łatwiej poruszać się po stronach internetowych i maksymalnie wykorzystać dostępne funkcje. Niezależnie od tego, czy szukasz informacji, czy robisz zakupy online, zrozumienie adresów URL może pomóc Ci w pełni wykorzystać Internet.