Internet Archive hakkerointi: Miksi verkon digitaalinen kirjasto on jatkuvien hyökkäysten kohteena?

Avoin toiminta
Tiivistelmä

  • Internet Archive on voittoa tavoittelematon digitaalinen kirjasto, joka kohtaa usein kyberhyökkäyksiä, kuten DDoS, tietomurtoja ja oikeusjuttuja.
  • Tässä kuussa tapahtunut Internet Archive hakkerointi johti 31 miljoonan käyttäjän henkilökohtaisten tietojen varastamiseen.
  • Tekijänoikeusjutut, tekoälyn suorittama tietojen kerääminen ja hyökkäykset Internet Archivea vastaan edustavat laajempaa suuntausta ilmaista tiedonsaantia vastaan.

Viimeisein Internet Archive hakkerointi nousi uutisotsikoihin ympäri maailman. Alustaa kohtaan on muutoinkin viime viikkoina hyökätty useaan kertaan. Sen tietoturva on ollut esimerkiksi DDoS-hyökkäysten kohteena ja sivustoa vastaan on nostettu oikeusjuttuja, jotka estävät sitä jakamasta tiettyjä “kiellettyjä” kirjoja.

Kyseessä on yhdysvaltalainen voittoa tavoittelematon organisaatio, joka säilyttää ja lainaa digitaalisia ja fyysisiä kirjoja sekä tarjoaa Wayback Machinen kautta kuvakaappauksia verkkosivujen vanhoista versioista.

Techopedia keskusteli asiantuntijoiden kanssa ymmärtääkseen viimeaikaisia tapahtumia Internet Archiven ympärillä. Samoin pohdimme sen roolia tekoälyn ja disinformaation aikakaudella.

Internet Archive hakkerointi ja DDoS-hyökkäys: 31 miljoonan käyttäjän tiedot varastettu

Lokakuun 10. päivänä Internet Archiven perustaja Brewster Kahle vahvisti X:ssä, että DDoS-hyökkäykset organisaatiota vastaan olivat jatkuneet jo jonkin aikaa.

Hyökkääjät kohdistivat sivustoon haitallista liikennettä ja onnistuivat hetkellisesti sulkemaan koko palvelun.

Lokakuun 15. päivä Internet Archive oli jälleen pystyssä ja täydessä toiminnassa. Organisaatio koki kuitenkin sen jälkeen suuren tietomurron, jossa hyökkääjä varasti 31 miljoonan käyttäjän henkilökohtaisia tietoja.

Varastetut tiedot sisältävät sähköpostiosoitteita, käyttäjänimiä, salasanoja ja niiden vaihtamiseen liittyviä aikaleimoja sekä muita tietoja Internet Archivesta ja Wayback Machinesta.

Hakkeri jätti archive.org-sivustolle viestin, jossa luki:

“Oletko koskaan ajatellut, että Internet Archive on jatkuvasti katastrofaalisen tietoturvamurron partaalla? Sellainen itse asiassa tapahtui juuri: 31 miljoonaa käyttäjää pääsi HIBP:hen!”

Lyhenne ‘HIBP’ viittaa sivustoon Have I Been Pwned, jonka avulla ihmiset voivat tarkistaa, ovatko he joutuneet tietomurron uhreiksi.

Internet Archive varasto jossa säilytetään kirjoja
Yksi Internet Archiven kirjavarastoista. Lähde: The Internet Archive

Bleeping Computerille puhuessaan Hunt vahvisti, että hakkeri oli jakanut tietomurron yhteydessä saamansa tiedot HIBP:n kanssa. Ne sisälsivät 31 miljoonaa uniikkia sähköpostiosoitetta. Muut tietoturvatutkijat vahvistivat tietojen olevan peräisin Internet Archivesta.

Tietoturvaekosysteemin ADAMnetworksin toimitusjohtaja David Redekop kertoi Techopedialle murrosta ja Internet Archiven tekemästä työstä.

“Hyökkäys on yksinkertaisesti järjetön. Se on kuin terroristiryhmä hyökkäisi kirjastoon.”

Kysyimme Redekopilta mielipidettä Internet Archiven ja Wayback Machinen tekemästä  säilytystyöstä.

Redekop sanoi:

“Tämä muistuttaa minua kuuluisasta Oppenheimerin lainauksesta: ‘Historia opettaa ihmiselle, että ihminen ei opi mitään historiasta’. Jotta ihmiskunta voisi kukoistaa, meidän on säilytettävä historiamme.”

“Ilman historiallisia tietoja on mahdotonta määrittää totuutta.”

Oikeuden päätös hankaloitti ilmaista tiedonsaantia väärän tiedon yleistyessä

Viimeaikainen DDoS-hyökkäys Internet Archivea vastaan on vain yksi nykyaikana esiin tulleista ongelmista historiallisten dokumenttien säilyttämisessä.

Organisaatio hävisi hiljattain tapauksen digitaalisten kirjojen jakamisesta ilman julkaisijoiden suostumusta. Tämä on tietysti merkittävä ongelma, kun ottaa huomioon, että sivustolla on yli 916 miljardia tallennettua verkkosivua, 44 miljoonaa fyysistä kirjaa digitalisoituna sekä 10,6 miljoonaa elokuvaa ja televisio-ohjelmaa arkistoissaan.

Kirjastona Internet Archive toimii porttina tiedolle, mutta Yhdysvaltain oikeusistuin ei nähnyt asiaa samalla tavalla. Se prioirisoi maksumuureja ja yritysten liiketoimintaa ilmaisen digitaalisen kirjaston sijaan.

Internetissä Wayback Machinen rooli on tällä hetkellä ajankohtaisempi kuin koskaan. Pew Researchin mukaan 25 prosenttia kaikista vuosien 2013 ja 2023 välillä luoduista verkkosivuista on kadonnut. Koska Wayback Machine säilyttää näitä verkkosivustoja arkistoissaan, se voi ylläpitää internetissä jatkuvasti muuttuvien sisältöjen eri versioita.

Internet Wayback Machine mahdollistaa verkkosivustojen eri versioiden tarkastelun
The Wayback Machine tallentaa kuvankaappauksia verkkosivuista ja -sisällöistä, jotka ovat jatkuvassa muutoksessa. Lähde: The Internet Archive.

Pilvipalveluihin, generatiiviseen tekoälyyn ja tietoturvaan keskittyneen yrityksen, Bedrock Securityn, tietoturva-asiantuntija Kapil Raina kertoi, että nykyään on aiempaa tärkeämpää säilyttää internetissä historiallisia tietoja.

“Muuten on helpompaa uudelleenkirjoittaa historiallisia tapahtumia ja luoda erilaisia narratiiveja digitaalisessa maailmassamme.”

Internet Archive on saanut asiantuntijoilta kiitosta kyvystään torjua disinformaatiota säilyttämällä historialliset tiedot verkkosivuista Wayback Machinen avulla. Raina selitti, että se auttaa myös tasapainottamaan tekoälyn puolueellisuutta:

“OpenAI:n ja senkaltaisten yritysten myötä nämä sivustot voivat auttaa monipuolistamaan tietoa ja paljastamaan puolueellista tietoa, jos sellaista ilmenee verkkosivustoilla.

“Ja jos katsomme pidemmälle tulevaisuuteen, nykyinen sukupolvi on yhä riippuvaisempi internetistä löytyvästä tiedosta—historiallisten tietojen saatavuus on kriittistä objektiivisuuden kannalta.

“Kun disinformaation määrä lisääntyy esimerkiksi poliittisten johtajien toimesta, sosiaalisen median alustat ovat hitaita vastatoimissaan tai kieltäytyvät puuttumasta väärän tiedon levittämiseen. Viimeaikaisten hyökkäysten ajoitus Internet Archivea vastaan näytti osuvan yhteen tulevien vaalien kanssa.”

Raina sanoi, että meidän on tuettava tällaisia palveluita ja suojattava niiden sisältämät tiedot mahdollisimman hyvin minimoidaksemme tulevien hyökkäysten vaikutukset.

Internet Archive taistelee tekoälybotteja vastaan

Tekoälyn nousu on ollut ongelmallista Internet Archiven kaltaiselle organisaatiolle. Organisaatio on vaatinut sääntelyä samalla torjuen botteja, jotka keräävät sisältöä kouluttaakseen generatiivista tekoälyä. Lisäksi tekoälyn käyttöönotto laajenee kovaa vauhtia, jolloin ihmisten verkossa luoma ja kokoama sisältö korvautuu sen tuottamalla sisällöllä.

Kyberturvallisuusyritys SubRosan toimitusjohtaja John Price kertoi Techopedialle, että Wayback Machine näyttelee tärkeää roolia disinformaation torjunnassa tarjoamalla kuvakaappauksia verkkosivuista. Siksi se luo luotettavaa tietoa siitä, mitä on aiemmin julkaistu.

“Tämä on tehokas työkalu esimerkiksi toimittajille, tutkijoille ja tavallisille ihmisille tosiasioiden vahvistamiseen ja tiedon kehityksen seuraamiseen.”

Price lisäsi, että Internet Archiven työ kirjojen ja muun digitaalisen sisällön säilyttämisessä on korvaamatonta.

“Digitaalisena julkisena kirjastona se varmistaa, että historialliset, kulttuuriset ja opetukselliset materiaalit säilytetään myös tuleville sukupolville. Tämä on tärkeää, koska digitaalinen sisältö voi kadota nopeasti”, Price sanoi.

“Internet Archiven jatkuvat haasteet tekijänoikeuksien, DDoS-hyökkäysten ja tekoälyn keräämien tietojen kanssa osoittavat kasvavaa kiinnostusta digitaalisen tiedon säilyttämistä vastaan.”

Price selitti, että tämä trendi johtuu toimialoista, jotka suojelevat omia tietojaan. Lisäksi on noussut pelkoja siitä, että tekoäly uudelleenkirjoittaa historiallista tietoa.

Hän varoitti tulevaisuuden uhkakuvista:

“Kun tekoäly ja automaatio kehittyvät, arkistojen suojeleminen on välttämätöntä, jotta faktapohjainen sisältö säilyy myös tulevaisuudessa.”

Digitaalista transformaatiota tutkivan yrityksen Display NOW:n perustaja ja toimitusjohtaja Chris Dukich kertoi Techopedialle, että hyökkäykset ja toimet Internet Archivea vastaan edustavat vahvaa trendiä ilmaista tiedonsaantia vastaan.

“Ottaen huomioon tekijänoikeusjutut, joita Internet Archive kohtaa, DDoS-hyökkäykset ja tekoälyn suorittamat tietojen keräämiset, ymmärtää tässä olevan kyse jostain suuremmasta kuin vain vapaasta tiedonsaannista.

“Kun kehitämme tekoälytyökaluja, jotka vaativat paljon dataa, kohtaamme pyrkimyksiä rajoittaa datan saatavuutta ja läpinäkyvyyttä. Tietoa täytyy olla kuitenkin käytettävissä, jos haluamme ylläpitää läpinäkyvyyttä digitaalisessa yhteiskunnassa.”

Internet Archive hakkerointi – Yhteenveto

Riippumatta siitä, ovatko hyökkäykset Internet Archivea vastaan koordinoituja vai eivät, ne edustavat pyrkimyksiä poistaa historiallisia arkistoja. Maksettu ja tekoälyn tuottama geneerinen sisältö on prioriteettina ihmisten luoman vapaan ja julkisen tiedon ylitse.

Kuin modernin ajan Aleksandrian kirjasto, Internet Archive pitää hallussaan valtavaa tietomäärää. Olisi tulevaisuuden kannalta toivottavaa, ettei kukaan “vahingossa poistaisi” sitä internetistä.

Internet Archive hakkerointi – UKK

Mikä on Internet Archive?

Mitä tapahtui Internet Archiven viimeisimmässä hakkeroinnissa?

Miksi Internet Archive on hyökkäysten kohteena?

Miten Wayback Machine auttaa torjumaan väärää tietoa?

Miksi tekoälyn suorittama tietojen kerääminen on ongelma Internet Archivelle?

Mitä toimia voidaan tehdä digitaalisten arkistojen suojelemiseksi?

Samankaltaiset termit

Aiheeseen liittyvät artikkelit

Ray Fernandez
Senior Technology Journalist
Ray Fernandez
Teknologiatoimittaja

Ray on kokenut toimittaja, joka on toiminut alalla yli 15 vuoden ajan. Tällä hetkellä hän toimii teknologiatoimittajana Techopedialla sekä TechRepublicissa. Hänen kirjoituksiaan ovat julkaisseet monien muiden ohella Microsoft, Moonlock, Venture Beat, Forbes, Solutions Review, The Sunday Mail, The FinTech Times, Bloomberg, Horasis sekä Nature Conservancy.