Det er tidligt 2019, og vi har allerede været vidne til ikke én, men to rekordstort data lossepladser. Den første, kendt som Collection #1, bestod af ca. 773 million unikke e-mail-id'er og 21 million unikke adgangskoder, og blev rapporteret af Troy Hunt i januar.
2,692,818,238 Optager i Collection #2-5
Den anden dataindsamling er endnu større end den første, bestående af 2,692,818,238 optegnelser spredt over 12,000 filer. De data dump blev rapporteret af tysk sikkerhed hjemmeside Heise og er 845 GB. Det er benævnt Collection #2-5.
Tilsyneladende, Kollektion #2-5 omfatter hovedsageligt data fra gamle lækager, men det betyder ikke, at det ikke kan udnyttes igen. Desuden, filerne er nu vært på Mega fildeling tjeneste. Sikkerhed forskere siger, at data er blevet downloadet mere end 1,000 gange. Der er endda en tjeneste, der gør det muligt for folk at kontrollere, om deres data er blevet medtaget i Collection #2-5 - Info Leak Checker.
De data dump er ganske imponerende i størrelse, men de fleste af de stjålne data ser ud til at stamme fra tidligere data tyverier, såsom brud på Yahoo, LinkedIn, og Dropbox. Sikkerhed forskere på Wired undersøgte en stikprøve af dataene og bekræftede, at de legitimationsoplysninger er faktisk gyldige, men for det meste repræsenterer passwords fra gamle data lækager.
Hasso Plattner Instituttets forskere, der skabte Info Leak Checker, anslået, at 750 millioner af de legitimationsoplysninger der ikke tidligere er medtaget i deres database over lækket brugernavne og passwords. De fandt også, at 611 millioner af legitimationsoplysninger i Samlinger # 2-5 er ikke medtaget i samlingen #1 data.
Det er bemærkelsesværdigt, at Hasso Plattner Institute forsker David Jaeger mener, at visse dele af samlingen kan stamme fra automatiserede hacking af mindre, obskure hjemmesider for at stjæle deres password databaser, hvilket betyder, at en betydelig luns af passwords bliver lækket for første gang.
Som for samling #1, en af Hunt kontakter pegede ham til en populær hacking forum, hvor de data, der var ved at blive ”socialiseret”. På et billede der er tilknyttet de data, der var en rod mappe med navnet ”Collection # 1”, og så forskeren besluttede at navngive brud på denne måde. Dataene kom fra flere kilder, og er måske ”en samling af 2000+ dehashed databaser og combos, der er lagret efter emne", som forklaret på et forumindlæg, hvor overtrædelsen blev ”annonceret”.