みんながあなたについて知っていること:あなたのブラウザ

What Everybody Knows About You: Your Browser

ブラウザによるデータ収集

本記事は、現代におけるデータ収集をテーマにした連載の一部です。前回の記事では、スマートウォッチやその他の個人用デバイスについて取り上げました。

ブラウザからデータを収集するサイトの多くは小売業者ですが、ブラウザには特有の技術的課題があるため、本連載ではあえて独立したセクションとして扱います。


クッキーの仕組みとその進化

ユーザーを追跡する古典的な手段は、サーバーから送られる符号化されたメッセージをブラウザに保存させる仕組みで、「クッキー(cookie)」と呼ばれています。この少し変わった名称には興味深い背景があります。

コンピュータプログラミングの初期には、開発者たちは特定の文字列をファイル内に埋め込むことでファイル形式を識別していました。たとえば、PostScriptファイルは必ず「%!PS-Adobe」という文字列で始まり、PDFファイルは「%PDF」に続いてバージョン番号が記載されます。こうした文字列は、ファイルを処理するプログラムにとって形式を判別するための手がかり、いわば「クッキー」のような役割を果たしていました。

ブラウザにおけるクッキーは、もともとはセッション管理を助けるために導入されたものです。同じサーバー内のページを移動してもログイン状態を維持したり、設定を保存したりできるようにするのが目的でした。

しかしやがて、サイト運営者は、クッキーを使えば繰り返し訪問するユーザーを識別できることに気づきました。これはマーケティングにとって大きな利点となりました。たとえば、過去の訪問時に靴の写真を閲覧していたことをクッキーで記憶し、次回の訪問時に靴の割引を提示するといったことが可能になります。


DoubleClickとデータの拡大

クッキーによって得られる情報は、DoubleClick(現在はGoogleの一部)が複数の提携小売業者に配信するクッキーを管理し始めたことで飛躍的に増大しました。

これにより、ある小売業者は、自社サイトで過去に閲覧した内容だけでなく、DoubleClickを利用している他の小売サイトで閲覧した内容まで把握できるようになりました。同社はブラウザ上の行動履歴に加え、大量の個人情報も保有しています。


「Do Not Track」はなぜ効果が薄いのか

ブラウザの設定でクッキーを無効化することは可能です(その場合、利便性もプライバシー上の影響も同時に失われます)。しかし、一般に「Do Not Track」設定として知られるこの方法は、実際には効果が薄いと考えられています。

その理由は、現代のサーバーが非常に高度な技術を用いているからです。例えるなら、クッキーをやめたとしても、代わりにもっと洗練された追跡手法(いわばクッキーの代わりにクレームブリュレを差し出すようなもの)を使われてしまう、という状況なのです。


ブラウザ・フィンガープリンティング

最初の情報源は、ブラウザの「navigator」設定です。これは主にJavaScriptによって利用されます(なお、プライバシーなどの理由からJavaScriptを無効にする人もいます)。

navigatorに含まれる多くの項目は、個々のユーザーにとって特別な価値のある情報ではありません。しかし設定項目が非常に多いため、それらを組み合わせるとほぼブラウザごとに固有の特徴を持つことになります。

この情報収集は「ブラウザ・フィンガープリンティング(ブラウザ指紋採取)」と呼ばれ、クッキーを使用しなくても、ほぼ同じ精度でユーザーを識別することが可能になります。


IPアドレスとさらなる情報収集

すべてのサーバーは、ユーザーのIPアドレス(より正確には、インターネットプロバイダが設置した中継装置のIPアドレス)を把握しています。これにより、企業はユーザーのおおよその地理的位置を特定できます。

さらに、サーバーはブラウザやコンピュータに関する追加情報も収集できます。場合によっては、バッテリーの状態までも取得可能です。


まとめと今後

以上で、デバイスに焦点を当てた解説は一区切りとなります。本連載の残りの記事では、こうして収集された情報が、私たちの生活における大規模な組織や機関によってどのように利用されているのかを見ていきます。


<< 本シリーズの前の記事を読む | 本シリーズの次の記事を読む >>

Author

  • Andrew Oram

    Andy is a writer and editor in the computer field. His editorial projects at O'Reilly Media ranged from a legal guide covering intellectual property to a graphic novel about teenage hackers. Andy also writes often on health IT, on policy issues related to the Internet, and on trends affecting technical innovation and its effects on society. Print publications where his work has appeared include The Economist, Communications of the ACM, Copyright World, the Journal of Information Technology & Politics, Vanguardia Dossier, and Internet Law and Business. Conferences where he has presented talks include O'Reilly's Open Source Convention, FISL (Brazil), FOSDEM (Brussels), DebConf, and LibrePlanet. Andy participates in the Association for Computing Machinery's policy organization, USTPC.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です