>> サイバーニュース > ビッグデータへの執着: シェア, 収集, 違反, 繰り返す
サイバーニュース

ビッグデータへの執着: シェア, 収集, 違反, 繰り返す

データ収集

“データを十分に長く拷問した場合, 告白します。”
– ロナルド・コース, エコノミスト

ビッグデータ. データ収集. データマイニング. データ集約. データ技術. データのプライバシー. データ侵害. これらすべてのビッグデータ用語は何を意味し、それらはどのように関連していますか–相互に, そして私たちに? なぜ私たちはそれらの意味を気にする必要があります? この記事は何かを説明する試みです (私たちは考えることができます) あなたに関連付けられています, ユーザー, データとウェブ. 試み, ビッグデータに関しては、説明が十分に大きいわけではないからです.

ファーストシングズファースト. ビッグデータとは?

ビッグデータは、常に存在しているものの比較的新しい用語です. この用語は、データの指数関数的成長と可用性を示しています–構造化および非構造化. 一部の専門家は、ビッグデータはインターネット自体と同じくらい現代のビジネスにとって重要であるとさえ言っています. 彼らは間違っていません.

の 2001, 業界アナリストのダグ・レイニーは、ビッグデータの非常に首尾一貫した定義について概説しました, ビッグデータの3つのVにラベルを付けました: 音量, 速度と多様性.

  • 音量. 多くの要因がデータ量の増加に寄与しています. 何年にもわたって保存されたトランザクションベースのデータ. ソーシャルメディアからの非構造化データストリーミング. 収集されるセンサーおよびマシンツーマシンデータの量の増加.
  • 速度. データは前例のない速度でストリーミングされており、タイムリーに処理する必要があります. RFIDタグ, センサーとスマートメータリングにより、大量のデータをほぼリアルタイムで処理する必要性が高まっています。. データ速度に対処するのに十分な速さで対応することは、ほとんどの組織にとって課題です.
  • バラエティ. 今日のデータはあらゆる種類の形式で提供されています. 構造化, 従来のデータベースの数値データ. 基幹業務アプリケーションから作成された情報. 非構造化テキストドキュメント, Eメール, ビデオ, オーディオ, 株式相場表示データと金融取引. 管理します, さまざまな種類のデータをマージして管理することは、多くの組織が今なお取り組んでいることです。.

これはすべてあなたにとって抽象的なように見えますか? あなたが主題にまったく関係することができないように? もう一度考えてみて. あなたはプロセスの一部だからです, 少なくともあなたのデジタルプレゼンスは. 大きいので (オンライン) データはすべてのものによって生成されています…そしてすべての人がWeb経由で接続しています. 結果として, ビッグデータはさまざまなソースから到着しています, そこから関連する価値を引き出すには、最適な処理能力と適切な分析機能が必要です。. データは新しい最も価値のある交換ユニットです, おそらくお金よりも価値があります. ビジネス面で, データは新しい通貨です, そして誰もがいくつかを望んでいます, またはすべて (グーグル, マイクロソフト?) それの.

これが、データマイニングとデータ集約に到達する方法です。. すべてのデータを収集したら, あなたはそれで何をしますか?

データ収集の違い, データマイニングとデータ集約

データ収集とは?

データ収集はまさにそれが述べていることです–情報の蓄積, 通常はソフトウェア経由 (データ収集ツール). データ収集手法にはさまざまな種類があります. あなたが従うなら SensorsTechForum 定期的, あなたはオンラインデータ収集の怪しげな慣行について1つか2つ読んだかもしれません, 第三者に雇用されている. データ収集は、さまざまなアプローチと結果に関連する可能性があります, 調べている分野によっては, 用語の別の定義が得られます.

でも, オンラインユーザーであること, オンラインサービスが個人を特定できる情報を取得するすべての方法に確実に関心を持ってください。. あなたのPIIはあなたを価値あるものにします. もっとあなた, 自由にそして喜んで, あなた自身について共有する, 企業にとっては簡単です “得る” あなたへ.

これは、基本的および必須のデータ収集手法のリストです。, それなしではあなたの好きなサービスは存在できません:

  • クッキー
  • アクティブなWebコンテンツ
  • JavaScript
  • ブラウザのフィンガープリント (HTTP) ヘッダ
  • ブラウザキャッシュ
  • Webbugs
  • IPアドレス
  • Macアドレス

今, よりインタラクティブなディスプレイ:
data-collection-infographics-stforum-22

データマイニングとは?

データマイニング, 一方で, 広範なデータ設定でパターンを発見するのに役立つソフトウェアと計算プロセスが必要です. データマイニングは、投資と同様に、現代のマーケティングとビジネス開発にとって非常に重要です。. 多くの企業がデータマイニングに投資しており、売上予測を通じて利益と製品の位置付けを向上させています。. これがあなたが行動を把握する方法です (と好み) あなたの顧客の, 将来のアプローチを改善します.

データマイニングには、人工知能の採用が含まれます, 機械学習, 統計学, 予測分析, およびデータベースシステム. データマイニングのおかげで, あなたは重要なパターンを見つけることができます, そしてこの知識, 上記のように, 結論を出すのに役立ちます. データから価値を引き出すことができなければ、データはあなたのビジネスにとって何の意味もありません.

データ集約についてはどうですか?

データ集約は、主に分析目的で収集されたデータを要約する場合です。. なぜデータを集約したいのですか? 特定の人々のグループについてより多くの洞察を得るため (あなたの顧客のように–現在および潜在的) 年齢別にグループ化できる, 職業, 所得, 等. このプロセスが企業にとって価値があるのはなぜですか? パーソナライズを改善するには, そしてあなたが提供しているサービスであなたの顧客を幸せにします.

プライバシーポリシーに細心の注意を払うか注意を払う場合, あなたは私たちが何を意味するかを正確に知っています.

あなたはGoogleユーザーです, あなたじゃない? あなたは精通していますか Googleのプライバシーポリシー?

これは抜粋です, アコーディオンをクリックして読んでください:

Googleのプライバシーポリシー
収集する情報
私たちは、あなたが話す言語などの基本的なことを理解することから、すべてのユーザーにより良いサービスを提供するために情報を収集します, どの広告が最も役立つかなど、より複雑なものに, オンラインであなたにとって最も重要な人々, またはあなたが好きかもしれないどのYouTubeビデオ.
以下の方法で情報を収集します:
あなたが私たちに提供する情報. 例えば, Googleのサービスの多くでは、Googleアカウントにサインアップする必要があります. あなたがするとき, 個人情報をお伺いします, あなたの名前のように, 電子メールアドレス, アカウントに保存する電話番号またはクレジットカード. 私たちが提供する共有機能を最大限に活用したい場合, また、公開されているGoogleプロフィールの作成をお願いする場合があります, あなたの名前と写真が含まれている可能性があります.
当社のサービスの利用から得られる情報. 私たちはあなたが使用するサービスとあなたがそれらをどのように使用するかについての情報を収集します, YouTubeでビデオを見るときのように, 当社の広告サービスを使用するウェブサイトにアクセスしてください, または当社の広告やコンテンツを表示して操作する. この情報には以下が含まれます:
デバイス情報
デバイス固有の情報を収集します (ハードウェアモデルなど, オペレーティングシステムのバージョン, 一意のデバイス識別子, および電話番号を含むモバイルネットワーク情報). Googleは、デバイスIDまたは電話番号をGoogleアカウントに関連付ける場合があります.
ログ情報
Googleのサービスを使用したり、Googleが提供するコンテンツを表示したりする場合, 特定の情報を自動的に収集してサーバーログに保存します. これも:
あなたが私たちのサービスをどのように使用したかの詳細, 検索クエリなど.
あなたの電話番号のような電話ログ情報, 発呼者番号, 転送番号, 電話の日時, 通話時間, SMSルーティング情報と通話の種類.
インターネットプロトコルアドレス.
クラッシュなどのデバイスイベント情報, システムアクティビティ, ハードウェア設定, ブラウザの種類, ブラウザ言語, リクエストの日時と紹介URL.
ブラウザまたはGoogleアカウントを一意に識別する可能性のあるCookie.
位置情報
Googleサービスを使用する場合, 私たちはあなたの実際の場所に関する情報を収集して処理することがあります. さまざまな技術を使用して場所を特定します, IPアドレスを含む, GPS, およびその他のセンサー, 例えば, 近くのデバイスに関する情報をGoogleに提供する, Wi-Fiアクセスポイントとセルタワー.
固有のアプリケーション番号
特定のサービスには、固有のアプリケーション番号が含まれています. この番号とインストールに関する情報 (例えば, オペレーティングシステムの種類とアプリケーションのバージョン番号) そのサービスをインストールまたはアンインストールしたとき、またはそのサービスが定期的にサーバーに接続したときに、Googleに送信される場合があります, 自動更新など.
ローカルストレージ
情報を収集して保存する場合があります (個人情報を含む) ブラウザのWebストレージなどのメカニズムを使用してデバイス上でローカルに (HTMLを含む 5) およびアプリケーションデータキャッシュ.
クッキーおよび同様の技術
Googleとパートナーは、さまざまなテクノロジーを使用して、Googleサービスにアクセスしたときに情報を収集および保存します, これには、Cookieまたは同様のテクノロジーを使用してブラウザまたはデバイスを識別することが含まれる場合があります. また、これらのテクノロジーを使用して、パートナーに提供するサービスを利用する際に情報を収集および保存します。, 他のサイトに表示される可能性のある広告サービスやGoogleの機能など. Google Analytics製品は、企業やサイト所有者がWebサイトやアプリへのトラフィックを分析するのに役立ちます. 当社の広告サービスと組み合わせて使用する場合, DoubleClickCookieを使用しているものなど, GoogleAnalyticsの情報はリンクされています, GoogleAnalyticsの顧客またはGoogleによる, Googleテクノロジーを使用する, 複数のサイトへの訪問に関する情報.
Googleにサインインしたときに収集する情報, パートナーからお客様について取得した情報に加えて, Googleアカウントに関連付けられている可能性があります. 情報がGoogleアカウントに関連付けられている場合, 個人情報として扱います. アクセス方法の詳細については, Googleアカウントに関連付けられている情報を管理または削除する, このポリシーの透明性と選択のセクションにアクセスしてください.

ビッグデータの結果: データ侵害

平均的なPCユーザーは、このビッグデータの混乱のどこに立っていますか? 主要なオンラインサービスがハッキングされると、このすべてのデータはどうなりますか?

自分自身について共有すればするほど, あなたはあなたが知っている人々-あなたの友人についての知識を自動的に共有します, そして彼らの友人の友人…このすべての自発的なデータ共有はあなたを後ろから刺すかもしれません!

高度にパーソナライズされた悪意のあるキャンペーンが最近開始されました, ヨーロッパのLinkedInユーザーを対象. キャンペーンのペイロードはバンキングマルウェアでした. 特定の人々がさまざまな言語でカスタマイズされた悪意のある電子メールを受信しました. LinkedInのメガブリーチ後、闇市場で売りに出されたユーザーのクレデンシャル 2012 明らかにサイバー犯罪者によって使用されています. おそらくこれは一連のシリーズの始まりにすぎません 侵害後のエクスプロイト.

アカウントは他の方法でリークされる可能性があります, それも. 別の新鮮な例の懸念 32 百万のユニークなTwitterアカウント. Tessa88という名前のハッカー, LinkedInの最近の大規模な侵害に関与していると思われる人, タンブラー, 私のスペース, 数百万のアカウントで構成されるTwitterデータベースを取得したと主張しています.

データベースにはメールアドレスがあります (場合によっては、ユーザーごとに2つ), ユーザー名, およびプレーンテキストのパスワード. Tessa88はそれを販売しています 為に 10 ビットコイン, またはおおよそ $5,820. LeakedSourceは、アカウントの漏洩はデータ侵害によるものではなく、マルウェアによるものであると考えています. 何千万人もの人々がマルウェアに感染しています, マルウェアは、保存されているすべてのユーザー名とパスワードを、すべてのWebサイトのChromeやFirefoxなどのブラウザーから自宅に送信しました。, Twitterを含む.

でも, 個人情報だけでなく、エクスプロイトの影響を受けやすい. 国家は, それも!

Rapid7, 警備会社, 膨大なレポートをリリースしました (“全国暴露指数: ポートスキャンによる国別のインターネットセキュリティ姿勢の推測”) インターネットベースの攻撃のリスクに主にさらされている国に焦点を当てた. 研究者は、より裕福でより先進国がより危険にさらされていることを発見しました, 主にインターネットに接続されているセキュリティで保護されていないシステムの数が多いため. についてもっと読む 全国暴露研究.

データを保護するにはどうすればよいですか?

ビジネスアプローチ: 情報漏えい対策ソフトウェア (DLP)

潜在的なデータ侵害を検出して防止するように設計されたデータ損失防止ソフトウェアの採用による.

DLPソフトウェア製品は、ビジネスルールに依存して機密情報を分類および保護し、権限のない当事者がデータを共有して組織を危険にさらすことができないようにします。. 従業員が企業ドメイン外にビジネスメールを転送しようとした場合、または企業ファイルをDropboxなどのコンシューマークラウドストレージサービスにアップロードしようとした場合, 従業員は許可を拒否されます, TechTargetによって説明されているように.

ユーザーアプローチ: オンラインプライバシーのヒント

  • 1. 個人情報を無謀に開示しないでください, 不明へ, 身元不明の当事者.
  • 2. WebブラウザでCookieの通知をオンにします, またはCookie管理ソフトウェアを使用する.
  • 3. クリーンなメールアドレスを維持する, スパム対策技術を採用する. すべてのオンラインアカウントに同じ電子メールアドレスを使用したくない場合があります, デスクトップとモバイル.
  • 4. メーリングリストに個人的な電子メールを送信することは避けてください. 仕事用のコンピューターを個人用のコンピューターから分離します. 機密情報を作業機械に保管しないでください.
  • 5. スマートなオンラインサーファーになり、ランダムなリンクをクリックしないでください. 疑わしいコンテンツは避けてください!
  • 6. しない, どんな状況下でも, スパマーに返信する.
  • 7. プライバシーポリシーに細心の注意を払ってください, 最も合法的なサービスにも. 誰もがあなたの個人情報を望んでいることを認識してください!
  • 8. 自分自身についてどのような詳細を共有するかを決めるのはあなた次第であることを忘れないでください. サービスやアプリの要求が厳しすぎると思われる場合, 使用しないでください. より良い代替案があります, 確かに.
  • 9. 暗号化の重要性を過小評価しないでください!

データ暗号化とは?

ハイムダルが説明したように アンドラ・ザハリア, 暗号化は、アクセス可能なデータまたは情報を、通常の方法では読み取ったり理解したりできない理解できないコードに変換するプロセスです。. 暗号化プロセスでは、キーとアルゴリズムを使用して、アクセス可能なデータをエンコードされた情報に変換します. サイバーセキュリティの作者はまた、のリストを提供しています 9 無料の暗号化ツール 考慮する.

参考文献


https://www.sas.com/en_ph/insights/big-data/what-is-big-data.html
https://www.import.io/post/data-mining-vs-data-collection/
https://searchsqlserver.techtarget.com/definition/data-aggregation
https://www.eff.org/wp/effs-top-12-ways-protect-your-online-privacy

ミレーナ・ディミトロワ

プロジェクトの開始以来SensorsTechForumに所属しているインスピレーションを得たライター兼コンテンツマネージャー. の専門家 10+ 魅力的なコンテンツの作成における長年の経験. ユーザーのプライバシーとマルウェア開発に焦点を当てています, 彼女はサイバーセキュリティが中心的な役割を果たす世界を強く信じています. 常識が意味をなさない場合, 彼女はメモを取るためにそこにいます. それらのメモは後で記事になる可能性があります! Milena@Milenyimをフォローする

その他の投稿

フォローしてください:
ツイッター

コメントを残す

あなたのメールアドレスが公開されることはありません. 必須フィールドは、マークされています *

This website uses cookies to improve user experience. By using our website you consent to all cookies in accordance with our プライバシーポリシー.
同意します