Internet Archive har under de senaste veckorna utsatts för dataintrång, hackningar, DDoS-attacker och stämningar som hindrar dem från att distribuera vissa “förbjudna” böcker.
Den amerikanska ideella organisationen, som bevarar och lånar ut digitala och fysiska böcker samt erbjuder ögonblicksbilder av webbplatser från det förflutna via Wayback Machine, verkar vara under ett obevekligt angrepp.
Techopedia pratar med experter för att förstå de senaste attackerna mot Internet Archive och dess roll i AI- och desinformationseran.
Viktiga insikter gällande attackerna mot Internet Archive
- Internet Archive, ett ideellt digitalt bibliotek, utsätts ofta för attacker som DDoS, dataintrång och stämningar på grund av dess roll i att bevara information och erbjuda fri tillgång.
- Denna månads hackning ledde till att personlig data stals från 31 miljoner Internet Archive-användare.
- Techopedia talar med experter för att belysa Internet Archive:s avgörande roll i att bevara historisk data och bekämpa desinformation genom Wayback Machine.
- Upphovsrättsstämningar, AI-scraping och attacker mot Internet Archive speglar en större trend mot fri tillgång till information.
- Att skydda digitala bibliotek som Internet Archive är avgörande för att säkerställa att faktainnehåll bevaras och är tillgängligt för framtida generationer.
- Visa fullständig lista
DDoS-attacker och data från 31 miljoner användare stulen
Den 10 oktober bekräftade Brewster Kahle, grundaren av Internet Archive, via X/Twitter att DDoS-attackerna mot organisationen hade återupptagits.
Angriparna överbelastade webbplatsen med skadlig trafik och lyckades tillfälligt stänga ner sajten.
Sorry, but DDOS folks are back and knocked https://t.co/Hk02WjumkL and https://t.co/Xb2ku5dgZs offline. @internetarchive is being cautious and prioritizing keeping data safe at the expense of service availability.
Will share more as we know it.
— Brewster Kahle (@brewster_kahle) October 10, 2024
Den 15 oktober var Internet Archive åter online och i full drift. Men då drabbades organisationen av ett stort dataintrång. En hotaktör stal personlig data från 31 miljoner användare.
Den komprometterade informationen inkluderar e-postadresser, användarnamn, tidpunkter för lösenordsändringar, Bcrypt-hashade lösenord och annan intern data från Internet Archive och Wayback Machine.
Hackaren lämnade ett meddelande på archive.org som löd:
“Har du någonsin känt att Internet Archive drivs på tandpetare och ständigt är på gränsen till en katastrofal säkerhetsincident? Det hände just nu. Vi ses, 31 miljoner av er, på HIBP!”
Akronymen ‘HIPB’ syftar på sajten Have I Been Pwned, där användare kan söka för att se om de varit offer för ett dataintrång.
I en intervju med Bleeping Computer bekräftade Hunt att hotaktören hade delat datan med HIBP, som inkluderade 31 miljoner unika e-postadresser. Andra säkerhetsforskare verifierade också datan och bekräftade att den hade legitimt extraherats från Internet Archive.
David Redekop, VD på ADAMnetworks, ett Zero-Trust säkerhetsekosystem, talade med Techopedia om dataintrånget och arbetet som Internet Archive utför.
“(Attacken) är helt meningslös. En analogi skulle vara att jämföra det med en terroristgrupp som attackerar ett bibliotek.”
Vi frågade Redekop om hans åsikt om det arbete med bevarande (av böcker, information och innehåll) som Internet Archive och Wayback Machine utför. Redekop sa:
“Detta påminner mig om det berömda Oppenheimer-citatet, ‘Historien lär människan att människan inte lär sig något av historien’ — vilket händer när vi inte känner till historien. För att mänskligheten ska blomstra behöver vi bevara historien.”
“Utan historisk data är det omöjligt att fastställa sanningen.”
Domstolsbeslut mot tillgång till information i en tid där desinformation och AI blir norm
Den senaste DDoS-attacken mot Internet Archive är bara ett av många hinder på en lång och svår väg.
Organisationen, som har sparat mer än 916 miljarder webbsidor över tid, 44 miljoner fysiska och digitaliserade böcker samt 10,6 miljoner filmer och TV-program, förlorade nyligen ett mål om distribution av digitala böcker utan förlagens samtycke.
Som ett bibliotek fungerar Internet Archive som en port till information, men den amerikanska domstolen såg inte på saken på samma sätt och prioriterade betalväggar och vinster framför digitala bibliotek.
När det gäller internetsidan av saken har Wayback Machine:s roll blivit mer relevant än någonsin idag. Enligt Pew Research har 25% av alla webbplatser skapade mellan 2013 och 2023 försvunnit. Wayback Machine är det sista försvaret mot den ständigt föränderliga onlineinformationen.
Kapil Raina, datasäkerhetsexpert på Bedrock Security, ett företag inom molntjänster, generativ AI och datasäkerhet, berättade för Techopedia att med dagens oro kring legitim kunskap och “sanning” är det ännu viktigare att bevara historisk data och information som publiceras på internet.
“Annars blir det lättare att möta problemet med reviderade narrativ om historiska händelser och information i vår digitala värld.”
Internet Archive har också hyllats av experter för sin förmåga att bekämpa desinformation och hålla den historiska informationen korrekt genom Wayback Machine. Raina från Bedrock Security förklarade att det också hjälper till att balansera AI-bias:
“Med framväxten av OpenAI och liknande företag kan dessa sidor vara till hjälp för att balansera kunskap och bias som uppstår på aktuella webbplatser.”
“Ser vi längre in i framtiden är den nuvarande generationen mer beroende av internetinformation — och därmed är det avgörande att ha historisk information för att justera bias.
“Just nu, med ökningen av desinformation, särskilt från vissa politiska ledare, och sociala medieföretag som är långsamma eller vägrar att ta itu med det, verkar tidpunkten för de senaste attackerna (mot Internet Archive) sammanfalla med kommande val.”
Raina sa att vi måste stödja dessa tjänster och förse dem med verktyg för att skydda deras data så mycket som möjligt för att minimera framtida konsekvenser av sådana attacker.
Ett bibliotek som kämpar mot AI-bottar
Framväxten av artificiell intelligens har varit problematisk för en organisation som Internet Archive, minst sagt. Organisationen har efterlyst regleringar samtidigt som de försvarar sig mot bottar som skrapar innehåll för att träna generativa AI-produkter. Dessutom, i takt med att generativ AI ökar i hastighet, omskrivs det onlineinnehåll som skapats och sammanställts av människor snabbt av genAI-verktyg.
John Price, VD på SubRosa, ett cybersäkerhetsföretag, berättade för Techopedia att Wayback Machine spelar en avgörande roll i att bekämpa desinformation genom att tillhandahålla ögonblicksbilder av webbplatser över tid, vilket skapar en tillförlitlig uppteckning av vad som publicerats.
“Detta är ett kraftfullt verktyg för journalister, forskare och allmänheten för att verifiera fakta och följa informationsutvecklingen.”
Price tillade att Internet Archive:s arbete med att bevara böcker och annat digitalt innehåll är ovärderligt.
“Som ett digitalt offentligt bibliotek säkerställer det att historiska, kulturella och utbildningsmaterial skyddas för framtida generationer, särskilt eftersom digitalt innehåll snabbt kan försvinna,” sa Price.
“Internet Archive:s pågående utmaningar—upphovsrättsfall, DDoS-attacker och AI-scraping—indikerar en växande rörelse mot insatser för digitalt bevarande.”
Price förklarade att denna rörelse bottnar i att branscher vill skydda sin äganderätt till data och oro för att AI ska skriva om historisk information, och han varnade för framtida konsekvenser.
“Eftersom AI och automation utvecklas, kommer det att vara avgörande att skydda arkiv för att säkerställa att faktainnehåll bevaras för framtiden.”
Chris Dukich, grundare och VD på Display NOW, ett företag inom digital transformation, berättade för Techopedia att attackerna och åtgärderna mot Internet Archive representerar en större trend mot begränsad fri tillgång till information.
“Med tanke på de upphovsrättsstämningar som Internet Archive står inför, DDoS-attackerna och AI-scraping, förstår man detta som något större än bara fri tillgång till information.”
“Med utvecklingen av AI-verktyg, som tydligt kräver mycket data, ser vi försök att begränsa tillgången till just den data som måste vara tillgänglig om man vill upprätthålla transparens i det digitala samhället.”
Slutsatsen om Internet Archive-attackerna
Oavsett om attackerna mot Internet Archive är koordinerade eller inte, representerar de en rörelse för att radera historiska arkiv och prioritera betalt och AI-genererat innehåll över fri och offentlig tillgång till information skapad av människor.
Precis som Alexandrinska biblioteket i vår moderna tid rymmer Internet Archive enorm kunskap. Låt oss bara hoppas att ingen “råkar bränna” ner det lite i taget.