Hackingen av Internettarkivet: Hvorfor er nettets digitale bibliotek under konstant angrep?

Hvorfor oss?

Internet Archive har de siste ukene blitt utsatt for innbrudd, hacking, DDoS-angrep og søksmål som hindrer dem i å distribuere visse «forbudte» bøker.

Den amerikanske ideelle organisasjonen, som bevarer og låner ut digitale og fysiske bøker og tilbyr øyeblikksbilder av nettsteder fra fortiden gjennom Wayback Machine, ser ut til å være under et ubarmhjertig angrep.

Techopedia har snakket med eksperter for å forstå de nylige angrepene mot Internet Archive og organisasjonens rolle i en tid preget av kunstig intelligens og feilinformasjon.

Nøkkelpunkter

  • Internet Archive, et non-profit digitalt bibliotek, utsettes for hyppige angrep, som DDoS, datainnbrudd og søksmål, på grunn av sin rolle i å bevare informasjon og gi fri tilgang.
  • Denne måneden ble personopplysninger stjålet fra 31 millioner brukere av Internet Archive.
  • Techopedia har snakket med eksperter for å fremheve Internet Archive sin kritiske rolle i å bevare historiske data og bekjempe feilinformasjon gjennom Wayback Machine.
  • Søksmål om opphavsrett, AI-skraping og angrep mot Internet Archive representerer en større trend mot fri tilgang til informasjon.
  • Å beskytte digitale biblioteker som Internet Archive er avgjørende for å sikre at faktainnhold blir bevart og tilgjengelig for fremtidige generasjoner.

DDoS-angrep, nettstedet ødelagt og data fra 31 millioner brukere stjålet

Den 10. oktober bekreftet Brewster Kahle, grunnleggeren av Internet Archive, via X/Twitter at DDoS-angrepene mot organisasjonen hadde blitt gjenopptatt.

Angriperne oversvømte nettstedet med ondsinnet trafikk og klarte å stenge nettstedet midlertidig.

15. oktober var Internet Archive tilbake på nett og i full drift. Men så ble organisasjonen utsatt for et stort datainnbrudd. En trusselaktør stjal personopplysninger fra 31 millioner brukere.

De kompromitterte dataene inkluderer e-postadresser, skjermnavn, tidsstempler for endring av passord, Bcrypt-hashede passord og andre interne data fra Internet Archive og Wayback Machine.

Hackeren la igjen en melding på nettstedet archive.org som lød:

«Har du noen gang følt at Internet Archive går på pinner og hele tiden er på randen av å lide et katastrofalt sikkerhetsbrudd? Det skjedde nettopp. Vi ses 31 millioner av dere på HIBP!»

Forkortelsen «HIPB» refererer til nettstedet Have I Been Pwned, som lar folk søke for å se om de har blitt utsatt for et datainnbrudd. Techopedia intervjuet grunnleggeren tidligere i år.

Et av Internet Archives fysiske bokdepoter. (The Internet Archive)
Et av Internet Archives fysiske bokdepoter. (The Internet Archive)

I en samtale med Bleeping Computer bekreftet Hunt at trusselaktøren hadde delt dataene med HIPB, som inkluderte 31 millioner unike e-postadresser. Andre sikkerhetsforskere har også verifisert dataene og bekreftet at de var hentet fra Internet Archive.

David Redekop, administrerende direktør i ADAMnetworks, et Zero-Trust-sikkerhetsøkosystem, snakket med Techopedia om innbruddet og arbeidet som Internet Archive gjør.

“(Angrepet) Det er rett og slett meningsløst. Det kan sammenlignes med en terroristgruppe som angriper et bibliotek.”

Vi spurte Redekop hva han mente om arbeidet med bevaring (av bøker, informasjon og innhold) som Internet Archive og Wayback Machine gjør. Redekop sa

“Dette minner meg om det berømte Oppenheimer-sitatet: ‘Historien lærer mennesket at mennesket ikke lærer noe av historien’ – noe som skjer når vi ikke kjenner historien. For at menneskeheten skal blomstre, må vi bevare historien.”

«Uten historiske data er det umulig å finne sannheten.»

Domstolen sier nei til tilgang til informasjon når feilinformasjon og kunstig intelligens blir normen

Det nylige DDoS-angrepet mot Internet Archive er bare én av mange hindringer på en lang og vanskelig vei.

Organisasjonen, som har mer enn 916 milliarder nettsider lagret over tid, 44 millioner ekte og digitaliserte bøker og 10,6 millioner videoer av filmer og TV-programmer, tapte nylig en sak om distribusjon av digitale bøker uten forlagenes samtykke.

Som bibliotek fungerer Internet Archive som en inngangsport til informasjon, men den amerikanske domstolen så det ikke slik, og prioriterte betalingsmurer og profitt fremfor digitale biblioteker.

På internettsiden har Wayback Machine blitt mer relevant enn noen gang. Ifølge Pew Research vil 25 % av alle nettsteder som ble opprettet mellom 2013 og 2023, ha forsvunnet. Wayback Machine er den siste forsvarslinjen mot den stadig skiftende informasjonen på nettet.

Wayback Machine fra Internet Archive lagrer øyeblikksbilder av nettsteder og nettinnhold som stadig fjernes og endres. (Internettarkivet)
Wayback Machine fra Internet Archive lagrer øyeblikksbilder av nettsteder og nettinnhold som stadig fjernes og endres. (Internettarkivet)

Kapil Raina, Data Security Evangelist Bedrock Security, et sky-, generativ AI- og datasikkerhetsselskap, sier til Techopedia at med dagens bekymring for legitim kunnskap og «sannhet», er det enda viktigere å bevare historiske data og informasjon som er publisert på internett.

«Ellers blir det lettere å møte bekymringen for reviderte fortellinger om historiske hendelser og informasjon i vår digitale verden.»

Internet Archive har også fått skryt av eksperter for sin evne til å bidra til å bekjempe desinformasjon, og for å holde de historiske dokumentene i orden med Wayback Machine. Raina fra Bedrock Security forklarer at det også bidrar til å balansere AI-skjevheter:

“Med fremveksten av OpenAI og relaterte selskaper kan disse nettstedene være nyttige når det gjelder å balansere kunnskap og skjevheter som oppstår på aktuelle nettsteder

«Og hvis vi ser lenger inn i fremtiden, er den nåværende generasjonen mer avhengig av informasjon på internett – og da er det avgjørende å ha historisk informasjon for å justere skjevheter.

«Nå som desinformasjon øker, særlig fra enkelte politiske ledere, og teknologiselskaper som bruker sosiale medier, er trege eller nekter å ta tak i dette, ser det ut til at timingen for de nylige angrepene (mot Internet Archive) passer godt med det kommende valget.»

Raina sa at vi må støtte disse tjenestene og utstyre dem med verktøy for å beskytte dataene deres så godt som mulig for å minimere fremtidige konsekvenser av slike angrep.

Et bibliotek som kjemper mot AI-roboter

Fremveksten av kunstig intelligens har mildt sagt vært problematisk for en organisasjon som Internet Archive. Organisasjonen har etterlyst reguleringer samtidig som de har kjempet mot roboter som skraper innhold for å trene opp generative AI-produkter. I tillegg, etter hvert som generativ AI skyter fart, blir nettinnholdet som er skapt og sammenstilt av mennesker, raskt omskrevet av genAI-verktøy.

John Price, administrerende direktør i cybersikkerhetsselskapet SubRosa, sier til Techopedia at Wayback Machine spiller en viktig rolle i bekjempelsen av desinformasjon ved å gi øyeblikksbilder av nettsteder over tid, noe som skaper en pålitelig oversikt over hva som ble publisert.

«Dette er et kraftig verktøy for journalister, forskere og publikum til å verifisere fakta og spore utviklingen av informasjon.»

Price legger til at Internet Archive gjør et uvurderlig arbeid med å bevare bøker og annet digitalt innhold.

«Som et digitalt folkebibliotek sørger det for at historisk, kulturelt og pedagogisk materiale beskyttes for fremtidige generasjoner, særlig ettersom digitalt innhold raskt kan forsvinne», sier Price.

«Internet Archives pågående utfordringer – opphavsrettssaker, DDoS-angrep og AI-skraping – tyder på at det er en voksende bevegelse mot digital bevaring.»

Price forklarte at bevegelsen bunner i bransjer som beskytter proprietære data og frykten for at kunstig intelligens skal omskrive historisk informasjon, og advarte om fremtiden.

«Etter hvert som AI og automatisering utvikler seg, blir det viktig å beskytte arkiver for å sikre at faktainnhold blir bevart for fremtiden.»

Chris Dukich, grunnlegger og administrerende direktør i Display NOW, et selskap som jobber med digital transformasjon, sa til Techopedia at angrepene og handlingene mot Internet Archive representerer en større trend mot fri tilgang til informasjon.

«Med tanke på opphavsrettssøksmålene mot Internet Archive, DDoS-angrepene og AI-skrapeaktivitetene, forstår man dette som noe større enn bare fri tilgang til informasjon.

«Med utviklingen av AI-verktøy som helt klart krever mye data, er vi vitne til forsøk på å begrense tilgjengeligheten til nettopp de dataene som må være tilgjengelige hvis man ønsker å opprettholde åpenhet i det digitale samfunnet.»

Konklusjon

Uansett om angrepene mot Internet Archive er koordinerte eller ikke, representerer de en bevegelse for å slette det historiske arkivet og prioritere betalt og AI-generisk innhold fremfor fri og offentlig tilgang til informasjon som er skapt av mennesker.

I likhet med Alexandria-biblioteket i vår moderne tid sitter Internet Archive på enorm kunnskap. La oss bare håpe at ingen «brenner det ned» ved et uhell, litt etter litt.

Ofte stilte spørsmål

Hva er Internet Archive?

Hva skjedde i det nylige hacket av Internet Archive?

Hvorfor er Internet Archive under angrep?

Hvordan bidrar Wayback Machine til å bekjempe feilinformasjon?

Hvorfor er AI-skraping et problem for Internet Archive?

Hva kan gjøres for å beskytte digitale arkiver som Internet Archive?

Relaterte begreper

Related Articles

Ray Fernandez
Senior Technology Journalist
Ray Fernandez
Senior teknologijournalist

Ray er en uavhengig journalist med 15 års erfaring, med fokus på skjæringspunktet mellom teknologi og ulike aspekter av livet og samfunnet. Han begynte i Techopedia i 2023 etter å ha publisert i en rekke medier, blant annet Microsoft, TechRepublic, Moonlock, Hackermoon, VentureBeat, Entrepreneur og ServerWatch. Han har en grad i journalistikk fra Oxford Distance Learning og to spesialiseringer fra FUNIBER i miljøvitenskap og oseanografi. Når Ray ikke jobber, lager han musikk, driver med sport og reiser med sin kone og tre barn.