“データを十分に長く拷問した場合, 告白します。”
– ロナルド・コース, エコノミスト
ビッグデータ. データ収集. データマイニング. データ集約. データ技術. データのプライバシー. データ侵害. これらすべてのビッグデータ用語は何を意味し、それらはどのように関連していますか–相互に, そして私たちに? なぜ私たちはそれらの意味を気にする必要があります? この記事は何かを説明する試みです (私たちは考えることができます) あなたに関連付けられています, ユーザー, データとウェブ. 試み, ビッグデータに関しては、説明が十分に大きいわけではないからです.
ファーストシングズファースト. ビッグデータとは?
ビッグデータは、常に存在しているものの比較的新しい用語です. この用語は、データの指数関数的成長と可用性を示しています–構造化および非構造化. 一部の専門家は、ビッグデータはインターネット自体と同じくらい現代のビジネスにとって重要であるとさえ言っています. 彼らは間違っていません.
の 2001, 業界アナリストのダグ・レイニーは、ビッグデータの非常に首尾一貫した定義について概説しました, ビッグデータの3つのVにラベルを付けました: 音量, 速度と多様性.
- 音量. 多くの要因がデータ量の増加に寄与しています. 何年にもわたって保存されたトランザクションベースのデータ. ソーシャルメディアからの非構造化データストリーミング. 収集されるセンサーおよびマシンツーマシンデータの量の増加.
- 速度. データは前例のない速度でストリーミングされており、タイムリーに処理する必要があります. RFIDタグ, センサーとスマートメータリングにより、大量のデータをほぼリアルタイムで処理する必要性が高まっています。. データ速度に対処するのに十分な速さで対応することは、ほとんどの組織にとって課題です.
- バラエティ. 今日のデータはあらゆる種類の形式で提供されています. 構造化, 従来のデータベースの数値データ. 基幹業務アプリケーションから作成された情報. 非構造化テキストドキュメント, Eメール, ビデオ, オーディオ, 株式相場表示データと金融取引. 管理します, さまざまな種類のデータをマージして管理することは、多くの組織が今なお取り組んでいることです。.
これはすべてあなたにとって抽象的なように見えますか? あなたが主題にまったく関係することができないように? もう一度考えてみて. あなたはプロセスの一部だからです, 少なくともあなたのデジタルプレゼンスは. 大きいので (オンライン) データはすべてのものによって生成されています…そしてすべての人がWeb経由で接続しています. 結果として, ビッグデータはさまざまなソースから到着しています, そこから関連する価値を引き出すには、最適な処理能力と適切な分析機能が必要です。. データは新しい最も価値のある交換ユニットです, おそらくお金よりも価値があります. ビジネス面で, データは新しい通貨です, そして誰もがいくつかを望んでいます, またはすべて (グーグル, マイクロソフト?) それの.
これが、データマイニングとデータ集約に到達する方法です。. すべてのデータを収集したら, あなたはそれで何をしますか?
データ収集の違い, データマイニングとデータ集約
データ収集とは?
データ収集はまさにそれが述べていることです–情報の蓄積, 通常はソフトウェア経由 (データ収集ツール). データ収集手法にはさまざまな種類があります. あなたが従うなら SensorsTechForum 定期的, あなたはオンラインデータ収集の怪しげな慣行について1つか2つ読んだかもしれません, 第三者に雇用されている. データ収集は、さまざまなアプローチと結果に関連する可能性があります, 調べている分野によっては, 用語の別の定義が得られます.
でも, オンラインユーザーであること, オンラインサービスが個人を特定できる情報を取得するすべての方法に確実に関心を持ってください。. あなたのPIIはあなたを価値あるものにします. もっとあなた, 自由にそして喜んで, あなた自身について共有する, 企業にとっては簡単です “得る” あなたへ.
これは、基本的および必須のデータ収集手法のリストです。, それなしではあなたの好きなサービスは存在できません:
- クッキー
- アクティブなWebコンテンツ
- JavaScript
- ブラウザのフィンガープリント (HTTP) ヘッダ
- ブラウザキャッシュ
- Webbugs
- IPアドレス
- Macアドレス
今, よりインタラクティブなディスプレイ:
データマイニングとは?
データマイニング, 一方で, 広範なデータ設定でパターンを発見するのに役立つソフトウェアと計算プロセスが必要です. データマイニングは、投資と同様に、現代のマーケティングとビジネス開発にとって非常に重要です。. 多くの企業がデータマイニングに投資しており、売上予測を通じて利益と製品の位置付けを向上させています。. これがあなたが行動を把握する方法です (と好み) あなたの顧客の, 将来のアプローチを改善します.
データマイニングには、人工知能の採用が含まれます, 機械学習, 統計学, 予測分析, およびデータベースシステム. データマイニングのおかげで, あなたは重要なパターンを見つけることができます, そしてこの知識, 上記のように, 結論を出すのに役立ちます. データから価値を引き出すことができなければ、データはあなたのビジネスにとって何の意味もありません.
データ集約についてはどうですか?
データ集約は、主に分析目的で収集されたデータを要約する場合です。. なぜデータを集約したいのですか? 特定の人々のグループについてより多くの洞察を得るため (あなたの顧客のように–現在および潜在的) 年齢別にグループ化できる, 職業, 所得, 等. このプロセスが企業にとって価値があるのはなぜですか? パーソナライズを改善するには, そしてあなたが提供しているサービスであなたの顧客を幸せにします.
プライバシーポリシーに細心の注意を払うか注意を払う場合, あなたは私たちが何を意味するかを正確に知っています.
あなたはGoogleユーザーです, あなたじゃない? あなたは精通していますか Googleのプライバシーポリシー?
これは抜粋です, アコーディオンをクリックして読んでください:
ビッグデータの結果: データ侵害
平均的なPCユーザーは、このビッグデータの混乱のどこに立っていますか? 主要なオンラインサービスがハッキングされると、このすべてのデータはどうなりますか?
自分自身について共有すればするほど, あなたはあなたが知っている人々-あなたの友人についての知識を自動的に共有します, そして彼らの友人の友人…このすべての自発的なデータ共有はあなたを後ろから刺すかもしれません!
高度にパーソナライズされた悪意のあるキャンペーンが最近開始されました, ヨーロッパのLinkedInユーザーを対象. キャンペーンのペイロードはバンキングマルウェアでした. 特定の人々がさまざまな言語でカスタマイズされた悪意のある電子メールを受信しました. LinkedInのメガブリーチ後、闇市場で売りに出されたユーザーのクレデンシャル 2012 明らかにサイバー犯罪者によって使用されています. おそらくこれは一連のシリーズの始まりにすぎません 侵害後のエクスプロイト.
アカウントは他の方法でリークされる可能性があります, それも. 別の新鮮な例の懸念 32 百万のユニークなTwitterアカウント. Tessa88という名前のハッカー, LinkedInの最近の大規模な侵害に関与していると思われる人, タンブラー, 私のスペース, 数百万のアカウントで構成されるTwitterデータベースを取得したと主張しています.
データベースにはメールアドレスがあります (場合によっては、ユーザーごとに2つ), ユーザー名, およびプレーンテキストのパスワード. Tessa88はそれを販売しています 為に 10 ビットコイン, またはおおよそ $5,820. LeakedSourceは、アカウントの漏洩はデータ侵害によるものではなく、マルウェアによるものであると考えています. 何千万人もの人々がマルウェアに感染しています, マルウェアは、保存されているすべてのユーザー名とパスワードを、すべてのWebサイトのChromeやFirefoxなどのブラウザーから自宅に送信しました。, Twitterを含む.
でも, 個人情報だけでなく、エクスプロイトの影響を受けやすい. 国家は, それも!
Rapid7, 警備会社, 膨大なレポートをリリースしました (“全国暴露指数: ポートスキャンによる国別のインターネットセキュリティ姿勢の推測”) インターネットベースの攻撃のリスクに主にさらされている国に焦点を当てた. 研究者は、より裕福でより先進国がより危険にさらされていることを発見しました, 主にインターネットに接続されているセキュリティで保護されていないシステムの数が多いため. についてもっと読む 全国暴露研究.
データを保護するにはどうすればよいですか?
ビジネスアプローチ: 情報漏えい対策ソフトウェア (DLP)
潜在的なデータ侵害を検出して防止するように設計されたデータ損失防止ソフトウェアの採用による.
DLPソフトウェア製品は、ビジネスルールに依存して機密情報を分類および保護し、権限のない当事者がデータを共有して組織を危険にさらすことができないようにします。. 従業員が企業ドメイン外にビジネスメールを転送しようとした場合、または企業ファイルをDropboxなどのコンシューマークラウドストレージサービスにアップロードしようとした場合, 従業員は許可を拒否されます, TechTargetによって説明されているように.
ユーザーアプローチ: オンラインプライバシーのヒント
- 1. 個人情報を無謀に開示しないでください, 不明へ, 身元不明の当事者.
- 2. WebブラウザでCookieの通知をオンにします, またはCookie管理ソフトウェアを使用する.
- 3. クリーンなメールアドレスを維持する, スパム対策技術を採用する. すべてのオンラインアカウントに同じ電子メールアドレスを使用したくない場合があります, デスクトップとモバイル.
- 4. メーリングリストに個人的な電子メールを送信することは避けてください. 仕事用のコンピューターを個人用のコンピューターから分離します. 機密情報を作業機械に保管しないでください.
- 5. スマートなオンラインサーファーになり、ランダムなリンクをクリックしないでください. 疑わしいコンテンツは避けてください!
- 6. しない, どんな状況下でも, スパマーに返信する.
- 7. プライバシーポリシーに細心の注意を払ってください, 最も合法的なサービスにも. 誰もがあなたの個人情報を望んでいることを認識してください!
- 8. 自分自身についてどのような詳細を共有するかを決めるのはあなた次第であることを忘れないでください. サービスやアプリの要求が厳しすぎると思われる場合, 使用しないでください. より良い代替案があります, 確かに.
- 9. 暗号化の重要性を過小評価しないでください!
データ暗号化とは?
ハイムダルが説明したように アンドラ・ザハリア, 暗号化は、アクセス可能なデータまたは情報を、通常の方法では読み取ったり理解したりできない理解できないコードに変換するプロセスです。. 暗号化プロセスでは、キーとアルゴリズムを使用して、アクセス可能なデータをエンコードされた情報に変換します. サイバーセキュリティの作者はまた、のリストを提供しています 9 無料の暗号化ツール 考慮する.
参考文献
https://www.sas.com/en_ph/insights/big-data/what-is-big-data.html
https://www.import.io/post/data-mining-vs-data-collection/
https://searchsqlserver.techtarget.com/definition/data-aggregation
https://www.eff.org/wp/effs-top-12-ways-protect-your-online-privacy