Leter du etter gratis data for å trene dine dataanalyseferdigheter? Her er noen av de beste nettstedene å sjekke ut.
Enten du utfører markedsundersøkelser, bygger porteføljen din som analytiker eller søker innsikt for å utvide markedsrekkevidden, er verdifulle og pålitelige data avgjørende for informert beslutningstaking.
Å søke på internett etter gratis, pålitelige og tilgjengelige data har imidlertid noen utfordringer. Denne artikkelen vil gjøre datajakten din mindre utfordrende ved å introdusere deg til noen av de beste nettstedene for å få tilgang til gratis data.
Google Trends er en gratis tjeneste utviklet av Google som gir brukere ufiltrerte dataeksempler av søkeforespørsler til Google. Selv om denne tjenesten viser tidsseriedata fra 2004 til i dag på både global og bynivå, viser den ikke de personlige detaljene til søkemotorbrukerne.
Du kan også begrense dataene til å fokusere på kategorier, språk, enheter eller populære søk på Google med Google Trender. Eksempler på tilgjengelige data inkluderer
daglige søketrender og sanntids søketrender, som viser data for de siste syv dagene.FiveThirtyEight er et datajournalistikknettsted som har data om avstemningsanalyse, sport, popkultur, politikk, vitenskap og økonomiske hendelser.
Det fine med nettstedet er at du kan laste ned dataene fra deres nettside eller deres offisielle GitHub-depot og bruk din datavisualiseringsverktøy for å lage fengslende datajournalistiske visuals for publikum. Noen få eksempler på interessante tilgjengelige data inkluderer verdenscupspådommer og 2022-23 NHL spådommer data.
BuzzFeed News er en amerikansk siste nytt og original rapporteringsplattform som rapporterer alt fra journalistikk, teknologi, underholdning, kjendisnyheter, kultur og DIY-hack til helse og politikk.
På GitHub gjør BuzzFeed News sine datasett, verktøy og analyser fra BuzzFeeds nyhetsrom åpen kildekode, tilgjengelig og tilgjengelig. Et eksempel inkluderer FBI NICS bakgrunnssjekkdata for skytevåpen.
Data.gov er USAs regjerings åpne datanettsted som er vert for over 250 000 offentlig tilgjengelige, godt dokumenterte datasett fra internasjonale og flere føderale myndigheter. Tanken bak dette initiativet var å gi en åpen og transparent regjering.
Du kan få tilgang til data fra nettstedet basert på emne og byrå eller organisasjon. Noen eksempler på data du kan finne på Data.gov er nasjonalt studielånsdatasystem og befolkningsdata for elektriske kjøretøy.
Kaggle er en offentlig datalekeplass anskaffet av Google som tilbyr et bredt spekter av datasett om ulike emner. Denne fellesskapsplattformen lar deg dele kodene dine, lære, samarbeide med andre dataeksperter og bli bedre. Kaggle arrangerer også datavitenskapskonkurranser hvor du kan vinne ulike premier.
Denne veiledningen gir en nybegynnerveiledning for hvordan du kommer i gang med Kaggle for data science. Et eksempel er Global YouTube-statistikk 2023.
EarthData er et datainitiativ fra NASA som fungerer som et depot for jorddata fra 1994 til nå. Du kan få data relatert fra den eksterne satellittinformasjonen til data om jordens atmosfære, hav og terrestrisk hydrosfære.
Du kan bla gjennom ulike emner og få tilgang til data som data om ekstrem varme. Du må imidlertid utforske NASAs planetdatasystem for ikke-jorddata.
IMDb gir data om filmer, TV-serier, hjemmevideoer, podcaster, videospill, strømmeinformasjon og kjendisinnhold. Et eksempel er IMDb ikke-kommersielle datasett.
AWS Public Dataset er et nettsted som er vert for over 3000 datasett med datasett som er gjort offentlig tilgjengelig gjennom AWS-tjenester. De fleste datasettene her er prosjektbaserte. Noen få inkluderer kreftgenomatlas og Foldingathome COVID-19-datasett.
Inside Airbnb er et vakthundnettsted lansert av Murray Cox. Denne nettsiden henter data som er offentlig tilgjengelig fra Airbnb, en plattform som tilbyr brukere budsjettvennlige rom over hele verden. Du kan bruke informasjon fra dette nettstedet til å utføre analyser som utleieanalyse av Montreal.
Google Dataset Search er en datasettsøkemotor laget av Google som er vert for over 20 millioner datasett. I likhet med søkemotoren deres kan du få data fra nesten hva som helst. Et godt eksempel er Kanadiske nasjonale langsiktige overvåkingsdata for vannkvalitet.
UC Irvine Machine Learning Repository er hjemmet til 624 datasett for maskinlæringsfellesskapet i verden. Denne nettsiden har et sterkt rykte i samfunnet fordi datasettene er kategorisert basert på maskinlæringsoppgavene de er egnet for. Et eksempel er Iris datasett, et kjent datasett for klassifiserings- og klyngemodeller.
Datahub som plattform har mange datasett som dekker et bredt spekter av emner som 10-års amerikanske statsobligasjonsrenter (langsiktig rente). I tillegg til dataene viser de også dataverktøy og verktøysett som kan komme inn for datafagfolk.
Dette er det første nettstedet på listen vår for eksklusive helsedata. Global Health Observatory fungerer som et datalager som viser helserelatert statistikk for over 1000 indikatorer for WHOs 194 medlemsland. Dataene registreres for å overvåke disse medlemslandenes fremgang mot SDG-målene. Du kan få data ved å filtrere temaet, kategorien, metadataene og indikatoren for dataene.
Denne plattformen er virkelig nisjebasert. Det viser forskningsdata og markedsinformasjon som tall for helgens billettkontor og relaterte data om den britiske filmindustrien.
GitHub er mer enn bare hjemmet til millioner av samarbeids- og åpen kildekodeprosjekter. Plattformen er også vert for mange depoter som har som mål å holde gratis, offentlige og åpen kildekode-datasett. Til og med BuzzFeedNews har et åpen kildekode GitHub-depot.
Andre eksempler er Fantastisk arkiv for offentlige datasett og løfter du i det hele tatt datasettet. Du kan også bidra til disse åpen kildekode-prosjektene på GitHub.
Data.world er et datafellesskap og samarbeidsplattform som er vert for dataprosjekter og datasett. Mens noen få datasett er betalt, hovedsakelig av dataene på plattformen, som Makeover mandagens 2021/W16: månedlige flypassasjerer i Amerika, er gratis og kan enkelt lastes ned lokalt eller få tilgang til via deres API.
World Bank Open Data er en katalog over globale økonomiske og utviklingsdata. Du kan bla gjennom og filtrere dataene, for eksempel global statistikk om kostnadene og rimeligheten av sunne dietter etter indikator og land.
Nasdaq Data Link er for alt av finansiell, økonomisk og alternativ data. Du kan få tilgang til data som US Federal Reserve-datautgivelser via et regneark som Excel eller et API.
NYC Taxi and Limousine Commission dataplattform registrerer og er vert for informasjon som f.eks gule og grønne taxireiser over hele New York City. Det fine med denne nettsiden er at den viser informasjon om alt, fra henting/levering til taxisonen og reisepriser.
Academic Torrents er en datakatalog med over 127,15 TB med forskningsdata. Den ble bygget, som de sier, for forskere og av forskere.
Utforsk og lær
Forhåpentligvis kan du med denne listen få data som kan forme forretningslandskapet ditt, drive markedsundersøkelser, oppnå konkurransefortrinn og hjelpe deg med å bygge den unike dataporteføljen gratis. Så omfavn mulighetene, utforsk og ha et mindre utfordrende datajaktoppdrag.