Dane to delikatny temat, a jako naukowiec zajmujący się danymi będziesz mieć z nimi wiele do czynienia. Oto kilka zasad, których zawsze powinieneś przestrzegać.

Dane są niezwykle cenne, a ich wykorzystanie jest jedną z najlepszych praktyk dla większości dzisiejszych organizacji. Ale znajomość standardów branżowych w tym zakresie jest niezbędna, aby analitycy danych nie mylili się z danymi, gdy ludzie dowiadują się więcej o ich wartości.

W związku z tym analitycy danych muszą przyjąć bezpieczne i etyczne praktyki oraz przyjąć standardowe. Zamiast zastanawiać się tylko nad tym, jak cenne są dane, warto zastanowić się nad sposobami pozyskiwania i przetwarzania danych w jakimkolwiek celu. Oto dziewięć kodeksów postępowania, których powinien przestrzegać każdy analityk danych.

1. Przestrzegaj Regulaminu

Analitycy danych muszą znać przepisy dotyczące ochrony danych, które mają zastosowanie do niektórych stanowisk. W przeciwnym razie możesz nieświadomie złamać prawo i narazić siebie i innych na niebezpieczeństwo. Wiedza ta ma więc kluczowe znaczenie dla zapewnienia etycznej pracy i zapobiegania niezamierzonym szkodom.

instagram viewer

W związku z tym przed podjęciem jakichkolwiek działań należy zapoznać się z odpowiednimi przepisami. Co więcej, nie tylko przestrzegaj przepisów, aby postępować zgodnie z zasadami; także szukać głębszego ich zrozumienia. Aby właściwie przestrzegać przepisów, trzeba wiedzieć, po co zostały wprowadzone i przed czym chronią.

Kilka godnych uwagi przepisów dotyczących prywatności to Ogólne rozporządzenie UE o ochronie danych (RODO) i kalifornijska ustawa o ochronie prywatności konsumentów (CCPA). Inne obejmują HIIPA, DPA, PIPEDA, LGPD i wiele przepisów branżowych.

2. Szanuj prywatność

Adresy, e-maile i identyfikatory to identyfikatory, które nie powinny być publiczne, ponieważ stanowią realne zagrożenie dla ludzi. Dlatego upewnij się, że te dane są tak prywatne, jak to tylko możliwe.

W przypadku ujawnienia ofiary mogą paść ofiarą kradzieży tożsamości lub oszustwa. Mogą być również szantażowani przez osoby grożące ujawnieniem ich poufnych informacji. Ponadto profesjonaliści mogą ucierpieć z powodu utraty reputacji i nękania w Internecie, gdy ich osobiste preferencje zostaną upublicznione. Mogą one wpływać na ich relacje, możliwości kariery i pozycję społeczną.

Mając to na uwadze, badaj i wybieraj skuteczne sposoby na lepsze bezpieczne tożsamości internetowe i dezidentyfikować dane. Na przykład możesz zastąpić znaki, usunąć bezpośrednie identyfikatory lub uogólnić. W ten sposób chronisz poufne dane przed cyberprzestępcami, jednocześnie pomagając organizacjom w uzyskaniu wyników.

3. Wyeliminuj uprzedzenia

Analitycy danych polegają na statystykach, aby były jak najbardziej obiektywne. Jednak pomimo tych wysiłków stronniczość utrzymuje się, ponieważ pogląd, że większe dane są dokładniejsze, jest jednym z najbardziej rozpowszechnionych popularne mity związane z nauką o danych.

Jest w tym trochę prawdy, ale niestety duże zbiory danych czasami zawierają niepotrzebne lub fałszywe elementy i statystyki. Dlatego zamiast skupiać się wyłącznie na liczbach, upewnij się, że Twoje dane są czyste i reprezentatywne.

Czyszczenie lub filtrowanie danych przed użyciem to doskonałe metody walki z uprzedzeniami. Możesz na przykład sprawdzić błędy lub zastosować próbkowanie warstwowe, aby zapewnić reprezentatywność danych.

4. Nie fabrykuj ani nie wymyślaj wyników

Fabrykowanie to forma niewłaściwego postępowania w zakresie danych i oszustw badawczych, która polega na zmyślaniu ustaleń i zgłaszaniu ich jako prawdziwych.

Na przykład analityk danych może zgłosić, że lek nie ma skutków ubocznych dla większości członków określonej grupy wiekowej. Odkrycia te zostałyby sfabrykowane, gdyby nie było wstępnych eksperymentów medycznych i zebranych danych na ich poparcie.

Fabrykowanie ma poważne i negatywne konsekwencje dla analityków danych i osób polegających na ich pracy. Może to zniszczyć Twoją wiarygodność, nadszarpnąć reputację Twojej organizacji, zaszkodzić opinii publicznej lub narazić Cię na ryzyko prawne.

5. Nie fałszuj ani nie manipuluj dowodami

Fałszowanie to manipulowanie rzeczywistością, gromadzenie danych w celu dopasowania ich do celu. Podczas gdy fabrykanci wymyślają wyniki na podstawie nieistniejących danych, aby poprzeć swoje twierdzenia, fałszerze pracują nad obaleniem prawdziwych i istniejących danych z powodów osobistych. Aby to osiągnąć, mogą manipulować sprzętem badawczym, zmieniać lub całkowicie pomijać dane.

Fałszowanie może szkodzić społeczeństwu poprzez dostarczanie fałszywych informacji wpływających na podejmowanie decyzji w różnych sektorach. Na przykład sfałszowane badanie leku może narazić ludzi na niepotrzebne ryzyko, nieskuteczne leczenie lub szkodliwe skutki uboczne. Może to również spowodować utratę pieniędzy, czasu lub materiałów, które mogłyby zostać wykorzystane do innych celów.

Fabrykowanie i fałszerstwo to praktyki pozbawione skrupułów, mające negatywne skutki i liczne sankcje. Mogą one obejmować grzywny, cofnięcie poświadczeń, utratę funduszy na badania naukowe lub pozbawienie wolności.

6. Pokaż przezroczystość

Przejrzystość dla analityków danych oznacza uczciwość w kwestii metod stosowanych do gromadzenia, analizowania i prezentowania danych. Analitycy danych powinni być otwarci i gotowi do dzielenia się swoimi praktykami z innymi analitykami danych i uczestnikami badań.

Ponadto musisz uzyskać zgodę uczestników badania, ponieważ publikowanie wyników bez świadomej zgody może na różne sposoby okazać brak szacunku lub zaszkodzić uczestnikom. Mogą naruszać ich godność, prywatność i autonomię lub narażać na szkodliwe, niepotrzebne ryzyko wynikające z badania.

Przejrzystość buduje zaufanie wśród tych, którzy polegają na Twoich danych w celu uzyskania wglądu. Zapewnia również jakość danych, umożliwiając innym przeglądanie wyników.

Ponadto otwartość wśród analityków danych sprzyja współpracy i uczeniu się. Możesz pomóc w promowaniu innowacji, dzieląc się swoim procesem i komunikując najlepsze metody wizualizacji danych i technik data science swoim współpracownikom, ucząc się od nich.

7. Gromadź dane w bezpieczny sposób

Analitycy danych muszą potwierdzić bezpieczeństwo metod stosowanych do gromadzenia, analizowania i przechowywania danych. W ten sposób zapobiegniesz potencjalnym naruszeniom danych, które mogą mieć wpływ na analityków danych i uczestników badania.

Naruszenia danych zagrażają bezpieczeństwu osobistemu, podważają zaufanie publiczne i ujawniają niekompetencję organizacyjną, co skutkuje ogromnymi stratami finansowymi dla firmy. Straty te mogą obejmować procesy sądowe ofiar naruszenia danych, mniejszą liczbę klientów i nie tylko.

W świetle tego musisz przeprowadzić badania, aby znaleźć najskuteczniejsze rozwiązania w zakresie bezpieczeństwa danych i zastosować je. Na przykład możesz zabezpieczyć połączenia za pomocą szyfrowania TLS/SSL lub użyć rotacyjnych serwerów proxy. Możesz także egzekwować środki kontroli dostępu i tworzyć kopie zapasowe na wypadek ataku. Kiedy znajdziesz rozwiązania, nie zapomnij podzielić się nimi z innymi, aby zapewnić maksymalne bezpieczeństwo.

8. Używaj algorytmów odpowiedzialnie

Algorytmy to nie tylko narzędzia do analizy danych. Mają potężny wpływ na życie, zachowania i możliwości ludzi. Jednak chociaż pomagają rozwiązywać problemy i dokonywać innowacyjnych prognoz, są również niedoskonałe.

Algorytmy, które nie są starannie zaprojektowane, przetestowane lub wdrożone, mają skutki społeczne i etyczne, które mogą zaszkodzić określonym grupom ludzi. Wprowadzają również uprzedzenia, jeśli są szkolone na danych, które odzwierciedlają istniejące uprzedzenia i mogą być nieprzewidywalne. Dlatego analitycy danych muszą je projektować i wykorzystywać w sposób odpowiedzialny.

Zawsze wybieraj odpowiednie algorytmy, testuj ich działanie i wyjaśniaj, jak działają. Upewnij się również, że identyfikujesz potencjalne źródła stronniczości i wdrażasz mechanizmy, które w razie potrzeby aktualizują lub poprawiają.

9. Zastanów się nad długoterminowymi konsekwencjami swojej pracy

Twoja praca jako naukowca danych będzie miała znaczący wpływ na wiele aspektów społeczeństwa. Dlatego zawsze zastanów się, jak Twoje modele wpływają na ludzi.

Na przykład staraj się kwestionować, czy twoja praca może utrwalać uprzedzenia i nierówności lub zagrażać prywatności w przyszłości. Następnie należy odpowiednio odnieść się do tych obaw.

Należy pamiętać, że perspektywa zorientowana na przyszłość jest ważniejsza niż jakakolwiek metoda naprawcza, a myślenie o nadchodzących dniach jest jednym z najskuteczniejszych sposobów podejmowania etycznie uzasadnionych decyzji.

Musisz być etyczny jako Data Scientist

Jako naukowiec zajmujący się danymi otrzymujesz moc, która wiąże się z proporcjonalną odpowiedzialnością. Twoje umiejętności są rzadkie, więc zasiadasz na czele procesów decyzyjnych w organizacji.

Twoje decyzje wpływają na wszystko, od planów biznesowych firmy po systemy wymiaru sprawiedliwości w sprawach karnych. Więc nie powinieneś robić ich lekko. Zawsze bądź uczciwy, etyczny i skrupulatny w swojej pracy, aby chronić ludzi przed istniejącymi dylematami etycznymi w swojej branży i innych dziedzinach technologii.