“Als u de gegevens lang genoeg martelen, het zal bekennen.”
– Ronald Coase, Econoom
big data. Het verzamelen van gegevens. data mining. data-aggregatie. gegevens technologie. Data Privacy. Gegevenslek. Wat betekenen al die big data termen betekenen en hoe zijn ze verwant - aan elkaar, en ons? Waarom zouden we de zorg over hun betekenis? Dit artikel is een poging om iets uit te leggen (we konden bedenken) verbonden zijn met jou, de gebruiker, data en web. Een poging, want als het gaat om grote hoeveelheden gegevens geen verklaring is groot genoeg.
First Thing's First. Wat is Big Data?
Big data is een relatief nieuwe term voor iets dat altijd in de buurt is geweest. De term illustreert de exponentiële groei en de beschikbaarheid van data - gestructureerde en ongestructureerde. Sommige deskundigen zeggen zelfs dat big data is net zo belangrijk voor moderne bedrijven als het internet zelf. Ze zijn niet verkeerd.
In 2001, analist Doug Laney geschetst een coherente definitie van grote data, bestempeld als de drie Vs van big data: volume, snelheid en variatie.
- Volume. Vele factoren dragen bij aan de toename van het volume data. Transactie-gebaseerde data opgeslagen door de jaren heen. Ongestructureerde data streaming vanuit social media. Toenemende hoeveelheden sensor en machine-naar-machine data verzameld.
- Snelheid. Data wordt streaming in op een ongekende snelheid en moeten worden behandeld in een tijdig. RFID-tags, sensoren en slimme meters rijdt de noodzaak om te gaan met stromen van data in bijna realtime. Snel reageren genoeg om te gaan met data snelheid is een uitdaging voor de meeste organisaties.
- Verscheidenheid. Gegevens die vandaag komt in alle soorten formaten. gestructureerde, numerieke gegevens in traditionele databases. Informatie gemaakt op basis van line-of-business applicaties. Ongestructureerde tekstdocumenten, e-mail, video-, audio, ticker gegevens en financiële transacties. Managing, samenvoegen en met betrekking tot verschillende soorten data is iets wat veel organisaties nog steeds worstelen met.
Betekent dit alles lijkt abstract voor u? Net als u niet kan betrekking hebben op het onderwerp helemaal? denk opnieuw. Omdat je deel uit van het proces, in ieder geval uw digitale aanwezigheid is. omdat grote (online) data wordt gegenereerd door alles ... en iedereen verbonden via het web. Dientengevolge, big data is afkomstig uit verschillende bronnen, en het afleiden relevante waarde ervan vereist een optimale verwerkingscapaciteit en goede analysemogelijkheden. Data is de nieuwe meest waardevolle uitwisseling eenheid, en is misschien wel meer waard dan geld. Zakelijk, data is de nieuwe munt, en iedereen wil wat, of alle (Google, Microsoft?) ervan.
Dit is hoe we aan data mining en data-aggregatie. Nadat u alle gegevens hebt verzameld, wat moet je er mee doen?
Het verschil tussen Data Collection, Data Mining en data-aggregatie
Wat is Data Collection?
Het verzamelen van gegevens is precies wat het zegt het is - de accumulatie van informatie, meestal via software (instrumenten voor gegevensverzameling). Er zijn veel verschillende soorten van het verzamelen van gegevens technieken. Als u volgen Sensor Holly Forum regelmatig, je zou een ding of twee heb gelezen over de duistere praktijken van online dataverzameling, bij derden. Het verzamelen van gegevens kan betrekking hebben op verschillende benaderingen en resultaten, en afhankelijk van het veld dat u op zoek bent naar, u zult een andere definitie van de term te krijgen.
Echter, zijnde een online gebruiker, moet u zeker geïnteresseerd zijn in alle opzichten online diensten aan te schaffen uw persoonlijk identificeerbare informatie. Uw PII is wat je waardevol maakt. Hoe meer je, vrij en vrijwillig, aandeel over jezelf, hoe makkelijker het is voor bedrijven om “krijgen” aan jou.
Hier is een lijst van basis en verplichte dataverzamelingstechnieken, zonder welke uw favoriete diensten niet kunnen bestaan:
- Koekjes
- Active Web Inhoud
- JavaScript
- Fingerprinting van Browser (HTTP) Hoofd
- Browser cache
- Webbugs
- IP adres
- Mac adres
Nu, een meer interactieve scherm:
Wat is Data Mining?
data mining, anderzijds, vraagt om een stukje software en een computationeel proces dat je helpt patronen ontdekken in uitgebreide data-instellingen. Data mining is als cruciaal voor moderne marketing en business development als de investeringen. Veel bedrijven investeren in data mining - om hun winst-en product positionering door verkoop forecasting verhogen. Dit is hoe je naar het gedrag te begrijpen (en voorkeuren) van uw klanten, en het verbeteren van uw toekomstige benaderingen.
Data mining betreft het gebruik van kunstmatige intelligentie, machine learning, statistieken, voorspellende analyse, en database-systemen. Met dank aan data mining, kunt u belangrijke patronen te vinden, en deze kennis, Zoals hierboven vermeld, kan u helpen om conclusies te trekken. De gegevens zullen niet alles doen om uw bedrijf betekenen als u geen waarde kan ontlenen.
Hoe zit het met data-aggregatie?
Data-aggregatie is het geval van een samenvatting van verzamelde gegevens voornamelijk voor analytische doeleinden. Waarom zou u gegevens aggregeren? Om meer inzicht te krijgen over bepaalde groepen mensen krijgen (zoals uw klanten - huidige en potentiële) en in staat zijn te groeperen naar leeftijd, beroep, inkomen, etc. Waarom is dit proces waardevol voor bedrijven? Personalisatie verbeteren, en maak uw klanten tevreden met de service die u aanbiedt.
Als u besteden veel of geen aandacht aan privacy-beleid, weet je precies wat we bedoelen.
Je bent een Google-gebruiker, ben je niet? Bent u bekend met privacybeleid van Google?
Dit is een fragment, klik op de accordeon om het te lezen:
Gevolgen van Big Data: datalekken
Waar komt de gemiddelde pc-gebruiker staan in al deze big data puinhoop? Wat gebeurt er met al deze data wanneer een grote online dienst wordt gehackt?
Hoe meer je te delen over jezelf, je automatisch kennis over de mensen die je kent te delen - je vrienden, en de vrienden van hun vrienden ... Al deze vrijwillige uitwisseling van gegevens kan gewoon steek je in de rug!
Een zeer persoonlijke kwaadaardige campagne werd onlangs begonnen, gericht op de LinkedIn-gebruikers in Europa. payload van de campagne werd banking malware. Specifieke mensen ontvangen op maat kwaadaardige e-mails in verschillende talen. geloofsbrieven van de gebruikers die voor verkoop op de zwarte markt werden aangeboden na de mega LinkedIn schending van 2012 zijn blijkbaar in gebruik genomen door cybercriminelen. Misschien is dit slechts het begin van een reeks post-schending exploits.
Accounts kunnen worden gelekt op andere manieren, ook. Een ander vers voorbeeld betreft 32 miljoen unieke Twitter accounts. Een hacker onder de naam Tessa88, die blijkbaar is betrokken bij de recente mega inbreuken op LinkedIn, tumblr, Mijn ruimte, beweert een Twitter-database bestaat uit miljoenen accounts te hebben verkregen.
De database heeft e-mailadressen (in sommige gevallen twee per gebruiker), gebruikersnamen, en platte tekst wachtwoorden. Tessa88 is te verkopen voor 10 Bitcoins, of ongeveer $5,820. LeakedSource van mening dat het lek van de rekeningen is niet omdat van een data-inbreuk, maar als gevolg van malware. Tientallen miljoenen mensen besmet raken met malware, en de malware naar huis gestuurd om de opgeslagen gebruikersnaam en wachtwoord van browsers zoals Chrome en Firefox van alle websites, waaronder Twitter.
Echter, niet alleen persoonlijke informatie van individuen gevoelig voor exploits. Naties, ook!
Rapid7, een beveiligingsbedrijf, heeft zojuist een enorme rapport (“Nationale Index Exposure: Afleiden van Internet Security Posture per land via Port Scanning”) gericht op de naties vooral blootgesteld aan de risico's van op internet gebaseerde aanvallen. Onderzoekers vinden dat rijkere en meer ontwikkelde landen zijn meer bedreigd, vooral als gevolg van het hoge aantal onbeveiligde systemen aangesloten op het internet. Lees meer over de nationale onderzoeksprogramma exposure.
Hoe kunnen we Bescherm onze gegevens?
De Business Approach: Data Loss Prevention Software (DLP)
Via de goedkeuring van data loss prevention software die is ontworpen voor het opsporen en voorkomen van mogelijke datalekken.
DLP software producten vertrouwen op business rules te classificeren en vertrouwelijke informatie te beschermen, zodat onbevoegden geen gegevens naar de organisatie in gevaar kunnen delen. Als een werknemer geprobeerd om een zakelijke e-mail te sturen buiten het bedrijfsnetwerk domein of uploaden van een corporate-bestand naar een consument cloud storage dienst als Dropbox, de werknemer zou toestemming worden geweigerd, zoals door TechTarget.
De Gebruiker Approach: Tips voor Online Privacy
- 1. Geen persoonlijke informatie roekeloos onthullen, om onbekende, geïdentificeerde partijen.
- 2. Schakel de cookie mededelingen in de webbrowser, of gebruik cookie-management software.
- 3. Houd een schone e-mail adres, anti-spam technieken. Je mag niet willen hetzelfde e-mailadres te gebruiken voor al uw online accounts, desktop en mobiel.
- 4. Vermijd het versturen van persoonlijke e-mails naar mailinglijsten. Scheid uw computer op het werk van uw persoonlijk. Bewaar geen gevoelige informatie op uw werk machine.
- 5. Wees een slimme online surfer en klik niet op willekeurige koppelingen. En vermijd verdachte inhoud!
- 6. Niet, onder alle omstandigheden, beantwoorden aan spammers.
- 7. Let goed op de privacy policy, zelfs voor de meest legitieme diensten. Realiseer je dat iedereen wil uw persoonlijke gegevens!
- 8. Vergeet niet dat het is aan jou om te beslissen welke gegevens u te delen over jezelf. Als een dienst of app lijkt te veeleisend, gewoon niet gebruiken. Er is een beter alternatief, zeker.
- 9. Onderschat niet het belang van encryptie!
Wat is Data Encryption?
Zoals uitgelegd door Heimdals Andra Zaharia, codering is een proces dat toegankelijke gegevens of informatie omzet in een onduidelijk code niet kan worden gelezen of begrepen normale manier. Het coderingsproces maakt gebruik van een sleutel en een algoritme om de toegankelijke gegevens om te zetten in een gecodeerd stuk informatie. De cyber security auteur heeft ook een lijst van de 9 gratis encryptietools overwegen.
Referenties
https://www.sas.com/en_ph/insights/big-data/what-is-big-data.html
https://www.import.io/post/data-mining-vs-data-collection/
https://searchsqlserver.techtarget.com/definition/data-aggregation
https://www.eff.org/wp/effs-top-12-ways-protect-your-online-privacy