Annonse
De sier at på Internett, ingenting blir borte Ingenting blir slettet fra Internett, noensinne. Dette er hvordan.Disse menneskene prøver å sikkerhetskopiere alt på nettet. Det er en stor jobb, men du kan hjelpe. Les mer .
Dette er sant, for populært innhold som er uendelig delt og omblandet. Men denne typen viral godteri er bare toppen av et virkelig stort isfjell. Under overflaten av memes og nakne kjendiser lurer det uendelige petabytes med data for kjedelige for udødelighet. Bryllupsbilder, college essays, hjemmevideoer 10 enkle tips for å få hjemmevideoer til å se profesjonelle utEnten du spiller inn noe for å publisere på nettet eller for å fange minner du kan beholde, vil disse tipsene hjelpe deg med å lage bedre videoer. Les mer , gamle e-postmeldinger - de fleste av dataene våre er i denne kategorien, og de kan være urovekkende flyktige.
En av de viktigste leksjonene fra fysikk er det termodynamikk hater tarmen din. Datadata er ikke noe unntak. Flash-minnet mister ladingen i
under et tiår. Selv under ideelle forhold magnetiske harddisker vil ikke vare lenger enn omtrent ti år. CD-er, under ideelle forhold, varer omtrent ti også. Magnetbånd, gullstandarden for langsiktig datalagring for industrien, slutter å være lesbar etter tretti til femti år.Hvordan digitale data dør
Dette utgjør et problem fordi det gjør at lagring av data tar innsats. Alt som ikke er interessant nok til å aktivt bevare fra harddisk til harddisk, skytjeneste til skytjeneste, slutter ganske enkelt å eksistere. 99% av våre data blir ganske enkelt kastet, til deponier og mislykkede internettbedrifter. Selv for dataene vi bryr oss om, er prognosen ikke god.
Vurdere problemene som kommer med datakomprimering. For å spare lagringsplass og båndbredde bruker vi ofte filformater (som .jpg og .mp4) som komprimere innholdet Hvordan fungerer komprimering?Hvordan fungerer komprimering av filer? Lær det grunnleggende om filkomprimering og forskjellen mellom tapet kontra tapsfri komprimering. Les mer på en måte. Komprimeringsalgoritmene som brukes kommer i to generelle typer: tapsfri og tapt.
- Tapfri formater eliminere overflødighet, identifiser biter av filen som gjentar og erstatter dem med kortere beskrivelser. Dette lar deg rekonstruere den originale filen perfekt senere, men kan bare komprimere dataene så mye (sjekk ut lenken over for en visuell metafor om hvordan disse algoritmene fungerer).
- Tapeformater er mye kraftigere, men kommer med store avveininger. Tapige formater fungerer ved å forkaste noe av informasjonen om den opprinnelige filen for å kunne kode filen på mindre plass. Disse algoritmene kan ikke nøyaktig rekonstruere den originale filen, men de er innstilt slik at informasjonen som blir falt, har en tendens til å være informasjon som folk ikke legger merke til. Disse algoritmene kan få en spektakulær reduksjon i filstørrelse med bare et lite fall i visuell kvalitet, og brukes til nesten all lyd, video og bilder.
Dette er generelt en god ting: det gjør at vi kan laste ned mye høyere kvalitet av innhold mye raskere enn det som ville vært mulig hvis vi satt fast ved å bruke tapsfrie formater. Imidlertid er det en mørk side for tapte formater, og det ser slik ut:
Når du koder en fil på nytt i et tapt format, går data tapt. Hvis du konverterer et tapt format til et annet tapsformat, fordobles skaden. Videoen ovenfor ble generert ved gjentatte ganger å konvertere mellom to tapte formater mange hundre ganger. På slutten har mannen som snakket degradert til et mareritt rot av farger og støy. Denne prosessen kalles generasjons forfall.
Når filer reiser rundt på internett, blir kopiert og sikkerhetskopiert og remikset og kodet på nytt, legger dette datatapet seg opp, og filer kan bli kraftig degradert. Etter hvert som vi blir bedre på tapte kodinger og mindre effektive filformater faller fra fordel, kan originale versjoner gå tapt for alltid.
Forhåpentligvis bryr filmstudioene seg nok til å beholde en tapt-kodet versjon av Kul hånd Luke og Tolv sinte menn trygt et sted, slik at vi alltid har versjoner av høy kvalitet av disse filene. Imidlertid er dette absolutt ikke sant for de fleste medier. Dine digitale babybilder og hjemmevideoer vil sakte forfalle når du transkoder dem fra foreldede formater til nye.
Det samme blir dobbelt for innhold på nettet. Originalene til de fleste YouTube-videoer finnes sannsynligvis ikke lenger. Når YouTube slutter å eksistere og disse videoene blir migrert til en ny plattform, vil de alle ta en kvalitetstreff fra omkodingsprosessen. Noen få generasjoner videodelingsplattformer nede på veien, og selv de videoene som forblir populære nok til å kopieres fra plattform til plattform, vil bli uakseptabelt forringet.
Vint CerfGoogles sjef for Internett-evangelisten, har snakket lenge om farene ved å kaste all denne informasjonen så kavalerisk som vi gjør. I løpet av ett intervju, Cerf beskrev hvordan historikeren Doris Goodwin i 2005 skrev en bok om Abraham Lincoln og studerte vanene hans etter besøke biblioteker over hele landet, grave opp de gamle brevene hans og rekonstruere samtalene de legemliggjøre. Cerf bemerker at i dag "vil disse brevene være e-post, og sjansene for å finne dem vil være forsvinnende små 100 år fra nå av."
Denne typen forfall vil utgjøre et stort problem for fremtidige historikere. Det 21 århundre kan godt bli et gapende hull i den historiske posten - en digital mørk tidsalder.
Kan vi gjøre det bedre?
En løsning på dette problemet er å utvikle arkivlagring som kan vare mye lenger med mindre vedlikehold, slik at det er lettere å arkivere informasjon på veldig lang sikt. En rekke smarte mennesker jobber med dette problemet, og vi har sammenstilt de beste tilgjengelige dataene om teknologiene deres.
Så la oss si at du vil sikkerhetskopiere en fil for en egentlig lang tid. Hvordan skal du gjøre det?
~ 50 år
Løsning: Magnetbånd
Hvis du bare trenger å lagre dataene dine i noen tiår av gangen, er sannsynligvis ditt beste alternativ god, gammeldags magnetbånd (av den typen som brukes av IT-avdelinger over hele verden). Lagret under jorden i et kaldt, tørt, magnetisk skjermet miljø, med en sunn grad av redundans, er magnetbånd relativt stabil sammenlignet med konvensjonelle CD-er eller harddisker, og bare omtrent tre ganger så dyrt som low-end harddisker (omtrent $ 3,0 per gigabyte).
~ 100 år
Løsning: Optiske disker i arkivkvalitet
Konvensjonelle CD-er er en forferdelig måte å lagre data på: aluminiums- eller sølvunderlaget begynner å oksidere så snart du åpner pakken, og lav byggekvalitet kan forårsake andre problemer. Ikke forvent at de skal vare lenger enn noen få timer - hvis du ved en feiltakelse lar dem ligge i solen. Noen CD-er og DVD-er er imidlertid laget med gullbelegg og mye høyere byggekvalitet. Gull oksiderer ikke, noe som betyr at disse diskene kan vare lenge, lenge. Det er vanskelig å vite nøyaktig hvor lenge, for vi har ikke hatt dem så lenge, men vi kan få en god estimere ved å ta diskene, være virkelig mening for dem, og deretter prøve å gjenopprette dataene: dette er kalt en akselerert aldringstest.
Basert på disse testene hevder produsentene levetid i området fra 1-3 århundre. For maksimal datatetthet, kan du hente arkiverte Blue Rays for omtrent 2,5 gigabyte per dollar, med en forventet levetid på 200 år. Akselererte aldringstester er ikke en sikker ting, men det er sannsynligvis trygt å stole på dem i et århundre eller så. Som en bonus, i motsetning til magnetbånd, krever de ikke noe spesielt utstyr for å lese og skrive, så oppstartkostnadene er minimale.
~ 1000 år
Løsning: M-plater
OK, glem at "århundre" tull, la oss bli alvorlige. For å gi deg en idé om tidsskalaen, for tusen år siden, forbød jarl Eric Haakonsson Berserkers i Norge for første gang. Det er disse gutta som er etset på en bronseplate som ble oppdaget på 1900-tallet:
Inntil nylig var det ikke mange gode industrielle alternativer for denne typen tidsskalaer. Nylig har det imidlertid dukket opp et spennende alternativ som kalles en ‘M-plate.’ Dette er arkiv-DVDer laget av et tykt lag av en “Steinlignende” mineralsk kompositt som er designet for å etses av spesielle brennere (selv om de kan leses av vanlig DVD stasjoner). Disse er absurd robuste, og forventes å overleve i minst tusen år. Det er en ambisiøs påstand, men selskapet har en solid forskning (inkludert en studie fra det amerikanske forsvarsdepartementet) for å sikkerhetskopiere det.
Disse platene er til og med rimelig billige, kl 5,7 gigabyte per dollar, selv om du også trenger en spesiell brenner. Hvis du er seriøst interessert i å lagre en mye av data i lang tid, er M-plater den klare vinneren.
~ 10.000 år
Løsning: Gravering av ekstremt stabile metaller
Det er her vi begynner å streite litt fra allfarvei. Per nå er det ingen digitalt lesbare formater som kan overleve hvor som helst i nærheten av ti tusen år. Det betyr at alle data som er arkivert for denne varigheten kommer til å bli veldig vanskelig å komme seg Hva er gjenoppretting av data, og hvordan fungerer det?Hvis du noen gang har opplevd et stort tap av data, har du sannsynligvis lurt på datagjenoppretting - hvordan fungerer det? Les mer . På noen måter er det greit - det er ikke som DVD-lesere kommer til å være om ti tusen år uansett.
Så hvordan lagrer du data så lenge? Svaret er at de eneste materialene som kan overleve den slags tidsskalaer er kjemisk stabile metaller og edelstener. Denne teknologien har allerede blitt brukt i praksis for Voyager-platene - gullplater, inngravert med informasjon som representerer lyd og bilder, som ble lansert ombord Voyager-sonden. Sonden er på vei ut av solsystemet for å gi en varig oversikt over menneskeheten for romvesener til en dag.
Et moderne grep om saken er nanolitografi. Et selskap som heter Norsam har tilpasset litografiteknikker opprinnelig utviklet for gravering av halvledere, og kan bruke dem til å etse fine mønstre på overflater som diamant eller nikkel. Oppløsningen er anstendig (ca. 165 gigabyte per 12 centimer disk), og det er også praktisk talt uforgjengelig. Disse diskene skal lagres trygt, i mange tusen år, og kan overleve EMP-er, de fleste branner og kollaps av den menneskelige sivilisasjonen. Prisinformasjon er ikke lett tilgjengelig, men "dyrt" er en virkelig god gjetning.
En tidlig anvendelse av denne teknologien har vært å lage moderne “Rosetta Stone” -plater, laget av titan, som skal lagres på trygge steder rundt world, som inneholder rundt tusenvis av sider med tekst, oversatt mellom mange språk, for å gi en referanse for fremtidige historikere hvis noen moderne språk er det tapt. Som en sidefordel ser platene også utrolig kule ut:
Mer enn 100 000 år
La oss være tydelige her: Hvis du handler etter datalagring og nano-gravert titan er bare for kortvarig for deg, skremmer planleggingshorisonten meg. For hundre tusen år siden begynte den første mannen å dra ut av det afrikanske kontinentet til Europa. Hvis du virkelig bryr deg om å sørge for at dine digitale data overlever så langt inn i fremtiden, så har du forlatt kjennetegn ved bare dødelige, og sannsynligvis også fornuft og god fornuft.
Noe som ikke sier at du ikke har alternativer.
Løsning: Fossilisert DNA
En av fordelene ved bioteknologirevolusjonen er at det er mange selskaper som vil det opprette tilpasset DNA for deg ut av en rekke basepar som du oppgir, online, for en marginal avgift. Hvert basepar har fire mulige kombinasjoner, som kan lagre to biter. Dataene kan deretter leses ved å sekvensere disse genene på et senere tidspunkt ved bruk av en rekke teknikker. Dette gjør at DNA kan tjene som en slags eksotisk datalagring. Nå, i seg selv, er dine tilpassede DNA-kjeder ganske kortvarige, og vil kjemisk brytes sammen ved romtemperatur om noen år. Det er noen få måter å utvide levetiden på.
Du kan dele dataene dine inn i DNA-en fra en langvarig organisme, som Great Basin Bristlecone furu (som er kjent for å leve mer enn fem tusen år). Fordi disse trærne kan reprodusere, blir din primære bekymring dem for å beskytte dem fra mange storskala branner, meteorpåvirkninger og vulkanutbrudd som kommer til å skje i framtid. Du kan kanskje få dataene dine til å overleve i noen titusenvis av år ved å plante flere skoger i arkivtrær på trygge, avsidesliggende steder; men - selvfølgelig - du er ikke interessert i så små poteter.
For å virkelig få pengene dine ut av DNA-lagring, må du kjemisk fikse DNAet for å beskytte det mot kjemisk endring og radioaktiv sammenbrudd. Forskere har funnet en måte å gjøre det på imbed DNA i smeltet glass for å lage et “syntetisk fossil” som vil beskytte DNAet i ekstremt lange perioder. Prosessen er basert på naturlig fossilisering, og ble utviklet etter avsløringen at det ofte er mulig å trekke ut intakt DNA fra fossiler som er millioner av år gammel. Med riktig bruk av feilrettingskoder og redundans, er det ingen grunn til at du ikke kunne bevare mange gigabyte med informasjon på ensifrede millioner av år.
Når det gjelder kostnadseffektivitet: hvis du er bekymret for pris, er denne lagringsmetoden ikke noe for deg. Dette er ikke en kommersiell prosess på noen måte. Du kommer til å bruke minst hundretusenvis av dollar for å få DNA produsert og bevart. Dette er ikke et selskap for svakhet i hjertet. Likevel er det et alternativ, og hvis du virkelig vil forsikre deg om at viktigste data på Internett er fremdeles tilgjengelig lenge etter at menneskeheten er død og borte, er det i din makt til å gjøre det.
Er du opptatt av den digitale mørketiden? Hvilke data vil du bevare for fremtidige generasjoner? Diskusjonen starter i kommentarene!
Bildetillegg: ødelagt usb-stasjon Via Shutterstock, “Berzerkers, "Av Wikimedia," Cutaway, "[Broken URL Removed] av M-Disc,"Rosetta, Av Long Now Foundation, "Rainbow CD, "Av Wikimedia,"Magnetisk teip, "Av Wikimedia,"Tidskapsel, "Av Wikimedia,"Voyager Record, "Av Wikimedia,"Fossil, ”Av Wikimedia
Andre er en skribent og journalist med base i Sørvest, og garantert å være funksjonell opptil 50 grader celsius, og er vanntett til en dybde på tolv meter.