Huis > Cyber ​​Nieuws > De obsessie voor big data: Aandeel, Verzamelen, Schending, Herhaling
CYBER NEWS

De Big Data Obsession: Aandeel, Verzamelen, Schending, Herhaling

GEGEVENSVERZAMELING

“Als u de gegevens lang genoeg martelen, het zal bekennen.”
– Ronald Coase, Econoom

big data. Het verzamelen van gegevens. data mining. data-aggregatie. gegevens technologie. Data Privacy. Gegevenslek. Wat betekenen al die big data termen betekenen en hoe zijn ze verwant - aan elkaar, en ons? Waarom zouden we de zorg over hun betekenis? Dit artikel is een poging om iets uit te leggen (we konden bedenken) verbonden zijn met jou, de gebruiker, data en web. Een poging, want als het gaat om grote hoeveelheden gegevens geen verklaring is groot genoeg.

First Thing's First. Wat is Big Data?

Big data is een relatief nieuwe term voor iets dat altijd in de buurt is geweest. De term illustreert de exponentiële groei en de beschikbaarheid van data - gestructureerde en ongestructureerde. Sommige deskundigen zeggen zelfs dat big data is net zo belangrijk voor moderne bedrijven als het internet zelf. Ze zijn niet verkeerd.

In 2001, analist Doug Laney geschetst een coherente definitie van grote data, bestempeld als de drie Vs van big data: volume, snelheid en variatie.

  • Volume. Vele factoren dragen bij aan de toename van het volume data. Transactie-gebaseerde data opgeslagen door de jaren heen. Ongestructureerde data streaming vanuit social media. Toenemende hoeveelheden sensor en machine-naar-machine data verzameld.
  • Snelheid. Data wordt streaming in op een ongekende snelheid en moeten worden behandeld in een tijdig. RFID-tags, sensoren en slimme meters rijdt de noodzaak om te gaan met stromen van data in bijna realtime. Snel reageren genoeg om te gaan met data snelheid is een uitdaging voor de meeste organisaties.
  • Verscheidenheid. Gegevens die vandaag komt in alle soorten formaten. gestructureerde, numerieke gegevens in traditionele databases. Informatie gemaakt op basis van line-of-business applicaties. Ongestructureerde tekstdocumenten, e-mail, video-, audio, ticker gegevens en financiële transacties. Managing, samenvoegen en met betrekking tot verschillende soorten data is iets wat veel organisaties nog steeds worstelen met.

Betekent dit alles lijkt abstract voor u? Net als u niet kan betrekking hebben op het onderwerp helemaal? denk opnieuw. Omdat je deel uit van het proces, in ieder geval uw digitale aanwezigheid is. omdat grote (online) data wordt gegenereerd door alles ... en iedereen verbonden via het web. Dientengevolge, big data is afkomstig uit verschillende bronnen, en het afleiden relevante waarde ervan vereist een optimale verwerkingscapaciteit en goede analysemogelijkheden. Data is de nieuwe meest waardevolle uitwisseling eenheid, en is misschien wel meer waard dan geld. Zakelijk, data is de nieuwe munt, en iedereen wil wat, of alle (Google, Microsoft?) ervan.

Dit is hoe we aan data mining en data-aggregatie. Nadat u alle gegevens hebt verzameld, wat moet je er mee doen?

Het verschil tussen Data Collection, Data Mining en data-aggregatie

Wat is Data Collection?

Het verzamelen van gegevens is precies wat het zegt het is - de accumulatie van informatie, meestal via software (instrumenten voor gegevensverzameling). Er zijn veel verschillende soorten van het verzamelen van gegevens technieken. Als u volgen Sensor Holly Forum regelmatig, je zou een ding of twee heb gelezen over de duistere praktijken van online dataverzameling, bij derden. Het verzamelen van gegevens kan betrekking hebben op verschillende benaderingen en resultaten, en afhankelijk van het veld dat u op zoek bent naar, u zult een andere definitie van de term te krijgen.

Echter, zijnde een online gebruiker, moet u zeker geïnteresseerd zijn in alle opzichten online diensten aan te schaffen uw persoonlijk identificeerbare informatie. Uw PII is wat je waardevol maakt. Hoe meer je, vrij en vrijwillig, aandeel over jezelf, hoe makkelijker het is voor bedrijven om “krijgen” aan jou.

Hier is een lijst van basis en verplichte dataverzamelingstechnieken, zonder welke uw favoriete diensten niet kunnen bestaan:

  • Koekjes
  • Active Web Inhoud
  • JavaScript
  • Fingerprinting van Browser (HTTP) Hoofd
  • Browser cache
  • Webbugs
  • IP adres
  • Mac adres

Nu, een meer interactieve scherm:
datacollectie-infographics-stforum-22

Wat is Data Mining?

data mining, anderzijds, vraagt ​​om een ​​stukje software en een computationeel proces dat je helpt patronen ontdekken in uitgebreide data-instellingen. Data mining is als cruciaal voor moderne marketing en business development als de investeringen. Veel bedrijven investeren in data mining - om hun winst-en product positionering door verkoop forecasting verhogen. Dit is hoe je naar het gedrag te begrijpen (en voorkeuren) van uw klanten, en het verbeteren van uw toekomstige benaderingen.

Data mining betreft het gebruik van kunstmatige intelligentie, machine learning, statistieken, voorspellende analyse, en database-systemen. Met dank aan data mining, kunt u belangrijke patronen te vinden, en deze kennis, Zoals hierboven vermeld, kan u helpen om conclusies te trekken. De gegevens zullen niet alles doen om uw bedrijf betekenen als u geen waarde kan ontlenen.

Hoe zit het met data-aggregatie?

Data-aggregatie is het geval van een samenvatting van verzamelde gegevens voornamelijk voor analytische doeleinden. Waarom zou u gegevens aggregeren? Om meer inzicht te krijgen over bepaalde groepen mensen krijgen (zoals uw klanten - huidige en potentiële) en in staat zijn te groeperen naar leeftijd, beroep, inkomen, etc. Waarom is dit proces waardevol voor bedrijven? Personalisatie verbeteren, en maak uw klanten tevreden met de service die u aanbiedt.

Als u besteden veel of geen aandacht aan privacy-beleid, weet je precies wat we bedoelen.

Je bent een Google-gebruiker, ben je niet? Bent u bekend met privacybeleid van Google?

Dit is een fragment, klik op de accordeon om het te lezen:

Privacybeleid van Google
Informatie die we verzamelen
We verzamelen informatie voor een betere dienstverlening aan al onze gebruikers - van het uitzoeken elementaire dingen zoals welke taal je spreekt, tot meer complexe dingen zoals welke advertenties u het nuttigst vindt, de mensen die het meest online relevant zijn voor u, of welke YouTube-video die je misschien leuk.
We verzamelen informatie op de volgende manieren:
Informatie die u ons. Bijvoorbeeld, veel van onze services moet u zich aanmelden voor een Google-account. Als je dat doet, we zullen vragen om persoonlijke informatie, zoals uw naam, e-mailadres, telefoonnummer of credit card op te slaan met uw account. Wilt u ten volle te profiteren van het delen van functies die we aanbieden, kunnen we u ook vragen een openbaar zichtbaar Google-profiel maken, die uw naam en foto kan omvatten.
Informatie die we krijgen van uw gebruik van onze diensten. We verzamelen informatie over de diensten die u gebruikt en hoe u ze gebruikt, zoals wanneer je een video op YouTube, een bezoek aan een website die onze reclame-diensten gebruikt, of bekijk en interactie met onze advertenties en content. Deze informatie omvat:
Apparaat informatie
We verzamelen apparaat-specifieke informatie (zoals uw hardware model, versie van het besturingssysteem, unieke apparaat-ID, en mobiele netwerkgegevens waaronder het telefoonnummer). Google kan uw apparaat-ID's of telefoonnummer koppelen aan uw Google-account.
Logbestandsgegevens
Wanneer u gebruik maken van onze diensten of inhoud bekijkt die wordt geleverd door Google, we automatisch verzamelen en bepaalde informatie in server logs op te slaan. Deze omvat:
informatie over hoe u onze service gebruikt, zoals uw zoekopdrachten.
telefonie log informatie zoals uw telefoonnummer, oproepende partij nummer, doorschakelnummers, datum en tijd van de oproepen, duur van gesprekken, SMS route-informatie of oproepen.
IP-adres.
apparaatgebeurtenis informatie zoals crashes, systeem activiteit, hardware-instellingen, browser type, browser taal, de datum en tijd van uw verzoek en verwijzing URL.
cookies die uw browser of uw Google-account kan worden herkend.
Locatie informatie
Wanneer u Google-services, we kunnen verzamelen en verwerken van informatie over uw huidige locatie. We maken gebruik van verschillende technologieën om locatie te bepalen, inclusief IP-adres, GPS, en andere sensoren die kunnen, bijvoorbeeld, Google naar informatie over de apparaten in de buurt, Wi-Fi-toegangspunten en zendmasten.
Unieke applicatienummers
Bepaalde diensten omvatten een unieke applicatie nummer. Dit nummer en informatie over uw installatie (bijvoorbeeld, het type besturingssysteem en versienummer van de applicatie) kan worden verzonden naar Google wanneer u installeren of verwijderen die dienst of wanneer die service periodiek contact opneemt met onze servers, zoals voor automatische updates.
Lokale opslag
We kunnen verzamelen en opslaan van informatie (inclusief persoonlijke informatie) lokaal op uw apparaat met mechanismen zoals browserwebopslag (inclusief HTML 5) en applicatiegegevenscaches.
Cookies en soortgelijke technologieën
Wij en onze partners gebruiken verschillende technologieën om informatie verzamelen en opslaan wanneer u een bezoek aan een Google-service, en dit kan zijn het gebruik van cookies of soortgelijke technologieën om uw browser of apparaat te identificeren. We gebruiken deze technologieën ook voor het verzamelen en opslaan van informatie wanneer je interactie met de diensten die wij aanbieden aan onze partners, zoals reclame services of Google-functies die op andere sites kunnen worden weergegeven. Onze Google Analytics product helpt bedrijven en site-eigenaren te analyseren het verkeer naar hun websites en apps. Bij gebruik in combinatie met onze reclame-diensten, zoals die met behulp van de DoubleClick-cookie, Google Analytics informatie wordt gekoppeld, door de klant van Google Analytics of door Google, met behulp van Google-technologie, met informatie over bezoeken aan meerdere sites.
Informatie die we verzamelen wanneer u bent aangemeld bij Google, in aanvulling op de informatie die we over u van partners, kan worden geassocieerd met uw Google-account. Wanneer informatie is gekoppeld aan uw Google-account, we behandelen als persoonlijke informatie. Voor meer informatie over hoe u gebruik kunt, beheren of informatie die is gekoppeld aan uw Google-account verwijdert, een bezoek aan de transparantie en de keuze gedeelte van dit beleid.

Gevolgen van Big Data: datalekken

Waar komt de gemiddelde pc-gebruiker staan ​​in al deze big data puinhoop? Wat gebeurt er met al deze data wanneer een grote online dienst wordt gehackt?

Hoe meer je te delen over jezelf, je automatisch kennis over de mensen die je kent te delen - je vrienden, en de vrienden van hun vrienden ... Al deze vrijwillige uitwisseling van gegevens kan gewoon steek je in de rug!

Een zeer persoonlijke kwaadaardige campagne werd onlangs begonnen, gericht op de LinkedIn-gebruikers in Europa. payload van de campagne werd banking malware. Specifieke mensen ontvangen op maat kwaadaardige e-mails in verschillende talen. geloofsbrieven van de gebruikers die voor verkoop op de zwarte markt werden aangeboden na de mega LinkedIn schending van 2012 zijn blijkbaar in gebruik genomen door cybercriminelen. Misschien is dit slechts het begin van een reeks post-schending exploits.

Accounts kunnen worden gelekt op andere manieren, ook. Een ander vers voorbeeld betreft 32 miljoen unieke Twitter accounts. Een hacker onder de naam Tessa88, die blijkbaar is betrokken bij de recente mega inbreuken op LinkedIn, tumblr, Mijn ruimte, beweert een Twitter-database bestaat uit miljoenen accounts te hebben verkregen.

De database heeft e-mailadressen (in sommige gevallen twee per gebruiker), gebruikersnamen, en platte tekst wachtwoorden. Tessa88 is te verkopen voor 10 Bitcoins, of ongeveer $5,820. LeakedSource van mening dat het lek van de rekeningen is niet omdat van een data-inbreuk, maar als gevolg van malware. Tientallen miljoenen mensen besmet raken met malware, en de malware naar huis gestuurd om de opgeslagen gebruikersnaam en wachtwoord van browsers zoals Chrome en Firefox van alle websites, waaronder Twitter.

Echter, niet alleen persoonlijke informatie van individuen gevoelig voor exploits. Naties, ook!

Rapid7, een beveiligingsbedrijf, heeft zojuist een enorme rapport (“Nationale Index Exposure: Afleiden van Internet Security Posture per land via Port Scanning”) gericht op de naties vooral blootgesteld aan de risico's van op internet gebaseerde aanvallen. Onderzoekers vinden dat rijkere en meer ontwikkelde landen zijn meer bedreigd, vooral als gevolg van het hoge aantal onbeveiligde systemen aangesloten op het internet. Lees meer over de nationale onderzoeksprogramma exposure.

Hoe kunnen we Bescherm onze gegevens?

De Business Approach: Data Loss Prevention Software (DLP)

Via de goedkeuring van data loss prevention software die is ontworpen voor het opsporen en voorkomen van mogelijke datalekken.

DLP software producten vertrouwen op business rules te classificeren en vertrouwelijke informatie te beschermen, zodat onbevoegden geen gegevens naar de organisatie in gevaar kunnen delen. Als een werknemer geprobeerd om een ​​zakelijke e-mail te sturen buiten het bedrijfsnetwerk domein of uploaden van een corporate-bestand naar een consument cloud storage dienst als Dropbox, de werknemer zou toestemming worden geweigerd, zoals door TechTarget.

De Gebruiker Approach: Tips voor Online Privacy

  • 1. Geen persoonlijke informatie roekeloos onthullen, om onbekende, geïdentificeerde partijen.
  • 2. Schakel de cookie mededelingen in de webbrowser, of gebruik cookie-management software.
  • 3. Houd een schone e-mail adres, anti-spam technieken. Je mag niet willen hetzelfde e-mailadres te gebruiken voor al uw online accounts, desktop en mobiel.
  • 4. Vermijd het versturen van persoonlijke e-mails naar mailinglijsten. Scheid uw computer op het werk van uw persoonlijk. Bewaar geen gevoelige informatie op uw werk machine.
  • 5. Wees een slimme online surfer en klik niet op willekeurige koppelingen. En vermijd verdachte inhoud!
  • 6. Niet, onder alle omstandigheden, beantwoorden aan spammers.
  • 7. Let goed op de privacy policy, zelfs voor de meest legitieme diensten. Realiseer je dat iedereen wil uw persoonlijke gegevens!
  • 8. Vergeet niet dat het is aan jou om te beslissen welke gegevens u te delen over jezelf. Als een dienst of app lijkt te veeleisend, gewoon niet gebruiken. Er is een beter alternatief, zeker.
  • 9. Onderschat niet het belang van encryptie!

Wat is Data Encryption?

Zoals uitgelegd door Heimdals Andra Zaharia, codering is een proces dat toegankelijke gegevens of informatie omzet in een onduidelijk code niet kan worden gelezen of begrepen normale manier. Het coderingsproces maakt gebruik van een sleutel en een algoritme om de toegankelijke gegevens om te zetten in een gecodeerd stuk informatie. De cyber security auteur heeft ook een lijst van de 9 gratis encryptietools overwegen.

Referenties


https://www.sas.com/en_ph/insights/big-data/what-is-big-data.html
https://www.import.io/post/data-mining-vs-data-collection/
https://searchsqlserver.techtarget.com/definition/data-aggregation
https://www.eff.org/wp/effs-top-12-ways-protect-your-online-privacy

Milena Dimitrova

Een bevlogen schrijver en contentmanager die sinds de start van het project bij SensorsTechForum werkt. Een professional met 10+ jarenlange ervaring in het creëren van boeiende inhoud. Gericht op de privacy van gebruikers en malware ontwikkeling, ze gelooft sterk in een wereld waar cybersecurity speelt een centrale rol. Als het gezond verstand heeft geen zin, ze zullen er zijn om aantekeningen te maken. Deze toelichtingen kunnen later om te zetten in artikelen! Volg Milena @Milenyim

Meer berichten

Volg mij:
Tjilpen

Laat een bericht achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *

This website uses cookies to improve user experience. By using our website you consent to all cookies in accordance with our Privacybeleid.
Daar ben ik het mee eens