Używając Arkuszy Google do pracy z dwoma zestawami danych, możesz porównać je, określając stopień, w jakim jeden wpływa na drugi.

Korelacje mogą dać wgląd w to, czy istnieje predykcyjna zależność między płaszczyznami x i y, ale niekoniecznie wskazują na związek przyczynowy. Oto jak możesz używać Arkuszy Google do identyfikowania korelacji w swoich danych.

Co to jest korelacja i do czego można jej użyć?

Kiedy dwie zmienne są skorelowane, można określić, w jaki sposób zmienna wpływa na drugą. Należy jednak pamiętać, że w tym przypadku korelacja nie oznacza polegania; pokazuje tylko, jak blisko i szybko porównuje się lub wiąże dwie zmienne.

Metryki statystyczne pomagają zrozumieć podstawowe trendy w analizie danych. Korelacja jest jedną z najczęściej używanych metryk statystycznych i określa, jak blisko powiązane lub zależne są dwie zmienne.

Zrozumienie współczynnika korelacji w Arkuszach Google

W Arkuszach Google współczynnik korelacji jest obliczany za pomocą funkcji CORREL. Współczynnik korelacji służy jako wskaźnik tego, jak blisko powiązane są zbiory danych. Można go użyć do uzyskania współczynnika korelacji momentu iloczynu Pearsona (r), jeśli masz dwa zmienne zestawy danych. Jeśli chcesz dowiedzieć się więcej o tym współczynniku, możesz przeczytać więcej w tym przewodniku

Statystyki w firmie Leard.

Można natknąć się na jedną z trzech metryk korelacji. Każdy pomiar inaczej definiuje zależności między zmiennymi. Jego wartość mieści się w przedziale od -1 do +1:

  • -1 oznacza doskonałą korelację ujemną: Kiedy korelacja ma współczynnik korelacji równy lub niższy niż -0,9, określa się ją jako silnie ujemną. Oznacza to, że dane są ze sobą skorelowane. Jednak zmienna x stale rośnie, podczas gdy zmienna y maleje.
  • 0 oznacza brak połączenia: Uważa się, że zmienne nie korelują, jeśli współczynnik korelacji jest większy niż 0,01, ale mniejszy niż 0,1, ponieważ nie ma dostrzegalnego związku między każdą zmienną. Są od siebie niezależni.
  • +1 oznacza doskonałą dodatnią korelację: Gdy współczynnik korelacji mieści się w przedziale od 0,9 do 1, uznaje się go za wysoce dodatni. Oznacza to, że nastąpił wzrost w dwóch zestawach zmiennych.

Najwyższą wartością współczynnika mógł być współczynnik korelacji równy 1. Gdy wartość korelacji wynosi 1, oznacza to, że gdybyś miał wykreślić dane, byłyby one całkowicie wyrównane, tworząc linię prostą.

Jeśli nadal jesteś trochę zagubiony, nie martw się. Wyjaśnimy składnię funkcji CORREL, a następnie zagłębimy się w przykłady z życia wzięte, aby pomóc Ci lepiej ją zrozumieć. Zrozumienie linii najlepszego dopasowania i jak tworzyć linie trendów w Arkuszach Google ci w tym pomoże.

Składnia funkcji CORREL w Arkuszach Google

=KORELACJA(dane_y; dane_x) 

Podzielmy to na części i lepiej zrozummy, co oznacza każde wyrażenie:

  • =KORELACJA: jest to funkcja Arkusza Google, która określa r (współczynnik korelacji momentu iloczynu Pearsona zbioru danych).
  • dane_y: odnosi się do grupy komórek zawierających dane zależne lub zakresu wartości tych komórek.
  • dane x: jest to albo odwołanie do tablicy komórek z niezależnymi danymi, albo do zakresu wartości dla tych komórek.

Gdybyś miał wykreślić punkty danych, data_y byłaby osią Y, a data_x osią X. Zauważysz, że istnieją dwa różne sposoby wprowadzania zakresu danych. Opcje to albo zakres komórek odniesienia, albo proste wprowadzanie danych w funkcji.

W większości przypadków preferowane jest użycie zakresu komórek odniesienia. To dlatego, że arkusz kalkulacyjny najprawdopodobniej zawiera już Twoje dane. Użycie zakresu komórek odniesienia pozwala uniknąć nadmiernej liczby wpisywanych danych, co może spowodować błąd użytkownika.

Przykłady funkcji CORREL w Arkuszach Google

Przyjrzyjmy się kilku przykładom, aby zrozumieć, jak używać funkcji CORREL w Arkuszach Google.

Przykład 1: Silna dodatnia korelacja

W tym pierwszym przykładzie wyobraźmy sobie, że pracujemy w branży nieruchomości. W poniższym arkuszu kalkulacyjnym mamy podział hektarów gruntów, które sprzedajesz, oraz dane dotyczące liczby sprzedanych jednostek tych gruntów w Twoim Arkuszu Google.

  1. Jeśli postępujesz zgodnie z arkuszem, zacznij od wprowadzenia danych zmiennych do arkusza kalkulacyjnego, jak pokazano poniżej:
  2. Kliknij komórkę C2
  3. Typ = KOREKTA (
  4. Następnie przejdziesz do wpisania data_y, co w naszym przypadku jest zakresem komórek, do których się odwołuje A2:A6, następnie wprowadź przecinek.
  5. Przejdź do typu data_x, który w naszym przypadku jest określany jako B2:B6.
  6. Zakończ nawiasem zamykającym, jak pokazano poniżej:
  7. Na koniec naciśnij Wchodzić aby zwrócić współczynnik korelacji dwóch fragmentów danych w komórce C2.

Korzystając z powyższego przykładu, uzyskałeś współczynnik korelacji równy 0,90, co jest silną dodatnią korelacją, ponieważ jego wartość mieści się w przedziale od 0,9 do 1. Oznacza to zatem, że wraz ze zmianą y zmienia się również x w zasadniczo porównywalny sposób.

Poniżej znajduje się reprezentacja naszych przykładowych danych przykładowych na wykresie punktowym XY. Jak widać, linia najlepszego dopasowania znajduje się blisko punktów danych na wykresie, co potwierdza tezę, że liczby są silnie skorelowane.

Możesz dowiedzieć się więcej o tworzenie wykresów punktowych XY w Arkuszach Google w naszym innym artykule.

Przykład 2: Słaba korelacja ujemna

Tym razem użyjemy bardziej ogólnego przykładu „zmiennej x i y” w naszym arkuszu kalkulacyjnym. Celowo uwzględniliśmy liczby, aby wykazać ujemną korelację, którą przedstawia funkcja CORREL poniżej:

Nie ma silnego związku między zmiennymi y i x, więc otrzymany wynik jest mniej istotnym współczynnikiem korelacji niż w poprzednim przykładzie. Osiągnięty przez nas wynik to -0,47. Nie oznacza to jednak, że korelacji w ogóle nie ma. Przyjrzyjmy się ponownie linii najlepiej dopasowanej, aby nadać jej sens.

Jak widać na wykresie punktowym, punkty danych są dalej od linii najlepszego dopasowania. Istnieje zatem mniejsza korelacja niż w pierwszym przykładzie, ale nie żadna. Zauważysz również, że linia najlepszego dopasowania maleje. To pokazuje ujemną korelację, jedna wartość maleje, a druga rośnie.

Przykład 3: Brak połączenia

Tutaj mamy zestaw całkowicie losowych liczb. Przejdźmy szybko do ponownego użycia funkcji CORREL:

  1. Wpisz komórkę C2 formuła CORREL
  2. Nasze argumenty są A2:A10 I B2:B10
  3. Wciśnij Enter

Wartość zwrócona na C2 to 0,02. Jeżeli współczynnik korelacji mieści się w przedziale od 0,01 do 0,1, oznacza to, że badane zmienne nie korelują, ponieważ nie ma między nimi dostrzegalnego związku. Relacje między zmiennymi są całkowicie niezależne.

Poniżej znajduje się reprezentacja tego samego na wykresie punktowym. Linia najlepszego dopasowania jest prawie płaska, co wskazuje na niewielką korelację między dwoma zestawami danych.

Łatwo koreluj swoje dane w Arkuszach Google

Korelacja może być trudnym tematem, jeśli nie pracowałeś z nią dużo w szkole średniej. W tym przewodniku omówiono wszystkie podstawy, ale musisz nadal używać funkcji CORREL w Arkuszach Google, aby zachować ją w pamięci.

Jest to potężna funkcja, ponieważ pomaga uniknąć tworzenia wykresów punktowych i może szybko znaleźć trendy w danych. Mimo to nie bój się dodawać wykresów, aby pomóc innym użytkownikom lepiej zrozumieć dane w Twoich arkuszach kalkulacyjnych.