Data er et sensitivt emne, og du vil naturligvis være rundt mye av det som dataforsker. Her er noen regler du alltid bør følge.
Data er ekstremt verdifulle, og å utnytte dem er lett en av de beste praksisene for de fleste organisasjoner i dag. Men å kjenne til industristandarder angående dette er nødvendig for at dataforskere ikke skal feile med data ettersom folk lærer mer om verdien.
Som sådan må dataforskere omfavne trygge og etiske praksiser og ta i bruk standardiserte. I stedet for å vurdere hvor verdifulle dataene bare er, er det lurt å stille spørsmål ved metodene for å innhente og behandle data til ethvert formål. Derfor er her ni etiske retningslinjer som hver dataforsker bør følge.
1. Følg forskriftene
Datavitere må kjenne til databeskyttelsesregelverket som gjelder for enkelte jobber. Ellers kan du ubevisst bryte loven og sette deg selv og andre i fare. Så denne kunnskapen er avgjørende for å sikre etisk arbeid og forhindre utilsiktet skade.
Sjekk derfor de relevante lovene før du deltar i noen aktiviteter. Videre, ikke bare observere forskrifter for å følge reglene; også søke en dypere forståelse av dem. For å overholde regelverket på riktig måte, må du vite hvorfor de ble plassert og hva de beskytter mot.
Noen få bemerkelsesverdige personvernlover er EUs generelle databeskyttelsesforordning (GDPR) og California Consumer Privacy Act (CCPA). Andre inkluderer HIIPA, DPA, PIPEDA, LGPD og mange bransjespesifikke forskrifter.
2. Respekter personvernet
Adresser, e-poster og ID-er er identifikatorer som ikke bør være offentlige da de utgjør en reell risiko for folket. Sørg derfor for at du gjør disse detaljene så private som mulig.
Hvis ofrene blir utsatt, kan de lide av identitetstyveri eller svindel. De kan også bli utpresset av personer som truer med å frigi deres konfidensielle informasjon. Videre kan fagfolk lide skade på omdømmet og trakassering på nettet når deres personlige preferanser er offentliggjort. Disse kan påvirke deres forhold, karrieremuligheter og sosial status.
Så med det i tankene, undersøk og velg effektive måter å bli bedre på sikre online identiteter og avidentifisere data. Du kan for eksempel erstatte tegn, fjerne direkte identifikatorer eller generalisere. Å gjøre dette beskytter sensitive data fra nettkriminelle samtidig som det hjelper organisasjoner med funnene dine.
3. Eliminer skjevhet
Dataforskere stoler på at statistikk er så objektiv som mulig. Likevel, til tross for denne innsatsen, vedvarer skjevheten fordi forestillingen om at større data er mer nøyaktig er en av de mest vanlige datavitenskapelige myter.
Det ligger en viss sannhet i dette, men dessverre inneholder store data noen ganger unødvendige eller falske elementer og statistikk. Så i stedet for å fokusere på tallene alene, sørg for at dataene dine er rene og representative.
Rengjøring eller filtrering av data før bruk er utmerkede metoder for å bekjempe skjevheter. Du kan for eksempel se etter feil eller bruke stratifisert prøvetaking for å sikre representative data.
4. Ikke lag eller oppfinn resultater
Fabrikasjon er en form for datamisbruk og forskningssvindel som innebærer å finne opp funn og rapportere dem som sanne.
For eksempel kan en dataforsker rapportere at et legemiddel har vist seg å ikke ha noen bivirkninger for de fleste medlemmer av en viss aldersgruppe. Disse funnene ville blitt fabrikkert hvis det ikke var noen innledende medisinske eksperimenter og samlet inn data for å sikkerhetskopiere dem.
Fabrikasjon har alvorlige og negative konsekvenser for dataforskere og de som stoler på arbeidet deres. Det kan ødelegge din troverdighet, ødelegge organisasjonens rykte, skade offentligheten eller utsette deg for juridiske risikoer.
5. Ikke forfalsk eller manipuler bevis
Falsifisering er manipulering av virkeligheten, innsamlet data for å passe en agenda. Mens produsenter gjør opp resultater fra ikke-eksisterende data for å støtte påstandene deres, jobber forfalskninger for å motbevise ekte og eksisterende data av personlige årsaker. For å oppnå dette kan de tukle med forskningsutstyr, endre eller utelate data helt.
Forfalskning kan skade offentligheten ved å gi falsk informasjon som påvirker beslutningstaking i ulike sektorer. For eksempel kan en forfalsket legemiddelstudie utsette folk for unødvendig risiko, ineffektive behandlinger eller skadelige bivirkninger. Det kan også føre til tap av penger, tid eller materialer som kunne vært brukt til andre formål.
Fabrikasjon og forfalskning er skruppelløs praksis med uheldige effekter og mange sanksjoner. Disse kan omfatte bøter, tilbakekall av legitimasjon, tap av forskningsfinansiering eller fengsling.
6. Vis åpenhet
Åpenhet for dataforskere betyr å være ærlig om metodene som brukes for å samle inn, analysere og presentere data. Dataforskere bør være åpne og klare til å dele sin praksis med andre dataforskere og studiedeltakere.
Dessuten må du innhente samtykke fra studiedeltakerne fordi publisering av resultater uten informert samtykke kan respektere eller skade deltakerne på ulike måter. De kan krenke deres verdighet, privatliv og autonomi eller utsette dem for skadelige, unødvendige risikoer som følge av studien.
Åpenhet bygger tillit hos de som stoler på dataene dine for å få innsikt. Det sikrer også datakvaliteten ved å la andre vurdere resultatene dine.
I tillegg fremmer åpenhet blant dataforskere samarbeid og læring. Du kan bidra til å fremme innovasjon ved å dele prosessen din og kommunisere beste datavisualiseringsmetoder og datavitenskapelige teknikker til jevnaldrende mens de lærer av dem.
7. Samle data på en sikker måte
Dataforskere må bekrefte sikkerheten til metodene som brukes til å samle inn, analysere og lagre data. Å gjøre dette forhindrer potensielle datainnbrudd som kan påvirke dataviterne og studiedeltakerne.
Datainnbrudd setter personlig sikkerhet i fare, undergraver offentlig tillit og avslører organisatorisk inkompetanse som resulterer i svimlende økonomiske tap for selskapet. Disse tapene kan være søksmål fra ofrene for datainnbrudd, færre kunder og mer.
I lys av dette må du utføre undersøkelser for å finne mest effektive datasikkerhetsløsninger og bruke dem. Du kan for eksempel sikre tilkoblinger med TLS/SSL-kryptering eller bruke roterende proxyer. Du kan også håndheve tilgangskontrolltiltak og lage sikkerhetskopier i tilfelle et angrep. Når du finner løsninger, ikke glem å dele dem med andre for å sikre maksimal sikkerhet.
8. Bruk algoritmer på en ansvarlig måte
Algoritmer er ikke bare verktøy for dataanalyse. De er kraftige påvirkninger på folks liv, atferd og muligheter. Men selv om de hjelper til med å løse problemer og lage innovative spådommer, er de også ufullkomne.
Hvis de ikke er nøye utformet, testet eller implementert, har algoritmer sosiale og etiske konsekvenser som kan skade visse grupper av mennesker. De introduserer også skjevheter hvis de trenes på data som gjenspeiler eksisterende fordommer og kan være uforutsigbare. Dataforskere må derfor designe og bruke dem på en ansvarlig måte.
Velg alltid passende algoritmer, test ytelsen og forklar hvordan de fungerer. Sørg også for at du identifiserer potensielle kilder til skjevhet og implementerer mekanismer som oppdaterer eller korrigerer der det er nødvendig.
9. Vurder de langsiktige implikasjonene av arbeidet ditt
Arbeidet ditt som dataforsker vil påvirke mange aspekter av samfunnet betydelig. Så vurder alltid hvordan modellene dine påvirker folk.
Forsøk for eksempel å stille spørsmål ved om arbeidet ditt kan opprettholde fordommer og ulikhet eller sette personvernet i fare i fremtiden. Deretter må du ivareta disse bekymringene.
Merk at et fremtidsrettet syn er viktigere enn noen korrigerende metode, og å tenke på dagene fremover er en av de mest effektive måtene å ta etisk forsvarlige beslutninger på.
Du må være etisk som dataforsker
Som dataforsker får du en makt som følger med proporsjonalt ansvar. Dine ferdigheter er sjeldne, så du sitter i forkant av organisatoriske beslutninger.
Avgjørelsene dine påvirker alt fra bedriftens forretningsplaner til strafferettssystemer. Så du bør ikke lage dem lett. Vær alltid ærlig, etisk og omhyggelig i arbeidet ditt for å beskytte folk mot eksisterende etiske dilemmaer på tvers av industrien og andre teknologiske felt.