Nomination Google et le Big Brother
Lorsque la nomination a été annoncée, certaines personnes l’ont considérée comme le signe d’un acte répréhensible de Google dans le domaine de la protection de la vie privée. C’était une erreur, car il n’y a pas eu de vérification des candidatures acceptées. N’importe qui pouvait contribuer. Google pourrait tout aussi bien renverser la vapeur et nommer Google Watch pour les prix.
De plus, Google n’a pas été sélectionné parmi les finalistes de Big Brother, ce qui indique certainement que Privacy International elle-même ne considérait pas l’entreprise comme l’une des plus grandes menaces pour la vie privée.
Néanmoins, la nomination a amené certains à s’interroger sur la confidentialité de leurs demandes de recherche chez Google. De plus, certaines allégations formulées dans la candidature ont été transformées par d’autres en preuves de violations de la vie privée, sans être examinées de près.
Dans cet article, j’explorerai chacune des principales allégations que Google Watch a faites contre Google comme preuve qu’il s’agit d’une menace pour la vie privée et du comportement de Big Brother. À la fin de chaque allégation, je fournirai mon propre verdict sur le sérieux avec lequel une personne typique peut souhaiter considérer chaque réclamation.
Soyez prévenu. C’est un long article. Si vous êtes intéressé par une accusation en particulier, utilisez les liens ci-dessous pour sauter au début de l’exploration de chaque accusation. Vous pouvez également accéder directement au verdict pour chaque accusation.
Le cookie immortel de Google
Google Watch (aucun lien avec Search Engine Watch) est un site Web soutenu par le groupe à but non lucratif Public Information Research. Il a été lancé au milieu de l’année dernière par le président du PIR, Daniel Brandt.
À cette époque, l’une des principales plaintes de Brandt à propos de Google était son utilisation d’un cookie persistant ou de longue durée, qui n’expire qu’en 2038. C’est une plainte qui a été réitérée comme le premier point de Brandt dans la nomination de Google pour le Big Brother. prix.
Les cookies aident Google à mémoriser toutes les préférences personnelles que vous pourriez avoir définies, telles que le fait que vous aimiez voir plus de 100 résultats à la fois ou que vous aimiez rechercher des pages en anglais plutôt que dans toutes les langues.
Compte tenu de cela, ma réaction personnelle au fait que le cookie n’expire pas depuis des années a été, et alors ? Si j’ai défini des préférences, je souhaite que Google s’en souvienne le plus longtemps possible. C’est aussi l’explication de Google pour laquelle son cookie dure si longtemps.
Si vous aviez défini un cookie temporaire, il expirerait. Nous ne saurions plus les langues que vous avez choisies ou un certain nombre de choses comme ça », a déclaré le cofondateur et président de la technologie de Google, Sergey Brin.
Au cas où vous vous poseriez la question, cette étrange date de 2038 est liée aux caprices du système d’exploitation Unix. C’est la date la plus longue que Google puisse définir en raison d’un bogue de type millénaire avec Unix.
Quel est le point de vue d’un expert en confidentialité sur les cookies persistants de Google ? Pour obtenir de l’aide, j’ai parlé à Parry Aftab. C’est une avocate spécialisée dans le cyberespace, avec une expertise sur les questions de sécurité et de confidentialité. Aftab siège au conseil d’administration de TRUSTe, l’un des groupes de protection de la vie privée les plus anciens et les plus importants du Web, et est directeur exécutif de WiredSafety.
Le fait qu’ils expirent tard, c’est juste pour plus de facilité. Cela ne signifie rien. Si vous possédez un ordinateur que vous allez utiliser en 2038, c’est une perspective intéressante », a déclaré Aftab. La plupart des sites ont des cookies qui expirent dans 50 ans ou autre.
En outre, Aftab estime que l’accent mis sur la durée de vie d’un cookie est dans la mauvaise direction, détournant l’attention des véritables problèmes de confidentialité, tels que la manière dont les informations personnelles identifiables sont utilisées, par exemple via un système d’enregistrement de site qui collecte les noms et les adresses.
Au lieu d’attaquer des sites comme Google et certains autres qui n’essayent pas d’abuser de la vie privée, traitez ceux qui le sont vraiment », a déclaré Aftab.
Fait intéressant, même Brandt de Google Watch admet que la durée d’un cookie n’est pas un problème. Lorsqu’on lui a demandé combien de temps un cookie devrait durer, Brandt a expliqué qu’il serait bien qu’il dure éternellement, tant qu’il continue de se renouveler » par des visites régulières sur le site Web.
En termes de durée, je recommanderais un cookie de 30 jours qui réécrit la date d’expiration de 30 jours à chaque accès. De cette façon, si quelqu’un n’utilise pas Google pendant 30 jours, le cookie sera supprimé par le navigateur.
En d’autres termes, chaque fois que vous visitez Google, votre cookie est prolongé de 30 jours. En bref, il resterait en vie tant que vous resteriez en vie grâce à des visites régulières sur le site.
Problème d’identification unique
Google fait plus que stocker vos préférences avec son cookie. Le cookie contient également un identifiant unique attribué à votre navigateur. Chaque fois que vous accédez à Google, le cookie l’aide à savoir qu’il a déjà vu votre navigateur particulier.
C’est cet identifiant unique qui préoccupe le plus Brandt, plutôt que la longue date d’expiration du cookie.
Combien de temps il dure est moins important que le fait qu’il contienne un identifiant unique. Vous n’avez pas besoin d’un identifiant unique pour la configuration des préférences de l’utilisateur. Il se passe autre chose ici, et Google ne dira pas ce que c’est.
En fait, Google dit ce que c’est, à quiconque lit la politique de confidentialité de l’entreprise :
Google utilise des cookies pour améliorer la qualité de notre service et mieux comprendre notre base d’utilisateurs. Google le fait en stockant les préférences des utilisateurs dans les cookies et en suivant les tendances et les modèles de recherche des utilisateurs.
En d’autres termes, oui, Google aime suivre ce que fait un utilisateur individuel sur le site Web. L’utilisateur est anonyme – littéralement juste un numéro plutôt qu’une personne nommée – mais Google peut alors voir comment cette personne numérotée unique a interagi avec ses résultats de recherche (pour plus d’informations sur les raisons pour lesquelles un identifiant utilisateur est anonyme, consultez mon Search Privacy At Google & Other Search article moteurs).
Nous effectuons beaucoup de travail de qualité avec des cookies uniques. Si nous présentons une correction orthographique aux gens, nous voyons souvent à quel point ils l’utilisent », a déclaré Brin, citant un exemple de surveillance du comportement des utilisateurs à des fins de qualité.
Si nous voulions savoir à quelle fréquence lorsqu’un utilisateur fait une requête de quatre mots, il finit par la raffiner, un cookie peut nous y aider », a ajouté Brin, offrant un autre exemple.
Quant à l’expert en confidentialité Aftab, elle ne s’inquiète pas de l’utilisation d’un identifiant unique, car en soi, il ne fournit aucune donnée réelle sur qui est vraiment une personne.
L’identifiant unique n’est pas lié à des informations personnellement identifiables », a-t-elle déclaré. Franchement, l’identifiant unique leur apprend plus que tout autre comment améliorer leur produit », a déclaré Aftab.
Verdict 1 : l’expiration des cookies n’a pas d’importance
En conclusion, ne vous inquiétez pas, le cookie de Google n’expirera pas avant 35 ans. Même Brandt convient que ce n’est pas le problème. Il n’aime tout simplement pas la partie ID unique du cookie.
Se débarrasser de l’identifiant unique est la chose la plus importante. La date d’expiration est un deuxième indicateur de leur sensibilité aux problèmes de confidentialité, même sans identifiant unique. Mais le problème de la date d’expiration est presque insignifiant une fois que l’identifiant unique a disparu », a déclaré Brandt.
Verdict 2 : Vous n’aimez pas les identifiants uniques ? Ne pas accepter le cookie
Faut-il s’inquiéter de l’identifiant unique ? Voilà, c’est trois contre un. Moi, Google et l’expert en confidentialité Aftab ne pense pas que ce soit un problème, et l’article sur la confidentialité de la recherche chez Google et autres moteurs de recherche explique pourquoi plus en détail.
Toujours pas convaincu ? Alors vous avez une solution facile. N’acceptez simplement pas le cookie de Google, si vous avez peur. Vous n’aurez pas d’identifiant unique et vos problèmes de confidentialité, si vous vous abonnez aux vues de Brandt, disparaîtront. Pratiquement tout ce que vous voulez faire sur Google, en particulier la recherche sur le Web, fonctionne très bien sans eux. Pour obtenir de l’aide sur la suppression et le blocage des cookies, consultez l’excellente page FAQ sur les cookies non officiels.
Verdict 3: les changements de Google pourraient réduire la peur des cookies
Pour sa part, Google pourrait envisager l’idée de Brandt d’un cookie basé sur le renouvellement, ne serait-ce que pour apaiser les inquiétudes que certains pourraient, aussi infondées soient-elles. Les préférences de l’utilisateur peuvent également être stockées dans un cookie qui n’a pas d’ID utilisateur, ce qu’un récent sondage a révélé que Teoma fait. Peut-être que Google pourrait permettre aux utilisateurs d’accepter cela comme alternative au rejet pur et simple d’un cookie.
Accusation 2 :
Google enregistre tout ce qu’ils peuvent
Le deuxième point de Brandt dans sa nomination Big Brother de Google rend l’entreprise avide d’informations qu’elle recueille lorsque vous visitez :
Pour toutes les recherches, ils enregistrent l’identifiant du cookie, votre adresse IP Internet, l’heure et la date, vos termes de recherche et la configuration de votre navigateur », écrit-il.
Une certaine perspective s’impose. La plupart des serveurs Web sont configurés pour enregistrer toutes ces mêmes informations dans leurs fichiers journaux, donc Google ne fait rien d’inhabituel. En effet, même les sites Web de l’organisation de Brandt enregistrent ce type d’informations autres que les termes de recherche, a-t-il confirmé.
Nous avons une politique de conservation de 30 jours pour tous les journaux d’accès. Sur un site, nous utilisons des cookies de configuration à court terme, comme expliqué dans notre politique de confidentialité ». Sur le proxy Google Watch, nous n’utilisons pas du tout de cookies et nous n’avons aucun enregistrement des termes de recherche », a-t-il déclaré.
Alors pourquoi le comportement de Google, qui est assez normal, est-il considéré comme quelque chose d’apparemment faux par Brandt ?
Les 150 millions de recherches par jour signifient que Google définit la norme pour ce que les autres administrateurs de serveurs jugent correct. Si Google le fait et s’en tire, alors Yahoo sait qu’ils peuvent le faire, tout comme MSN, et Overture aussi. Ils sont tous coupables, mais il faut bien commencer quelque part. Si Google commençait à bien faire les choses demain, je créerais un site Yahoo-Watch », a-t-il déclaré.
Pour moi, c’est un tronçon géant. L’enregistrement des données du serveur Web, telles que l’adresse IP, l’heure de la visite, l’identifiant du cookie et même les termes de recherche, était une norme bien avant l’apparition de Google en 1998. Google n’existait pas lorsque le format de journal commun (juillet 1995) et le format de journal étendu ( mars 1996) ont été établis (et ils étaient même en usage avant ces dates formelles).
Quant à Google, Brin a déclaré que les informations standard que Google enregistre avec chaque demande sont utiles pour la recherche susmentionnée sur l’amélioration de la qualité, ainsi que pour pouvoir montrer aux annonceurs des audits sur la fréquence d’apparition des annonces, sur la base d’informations agrégées (les informations individuelles limitées Google a n’est JAMAIS partagé avec les annonceurs, souligne l’entreprise).
Verdict : Google n’est pas excessif dans la journalisation des informations
Comme on le voit, Google enregistre simplement les mêmes informations que n’importe quel serveur Web typique peut enregistrer. Dire que Google enregistre tout » serait plus juste de dire, Google enregistre les mêmes choses que tout le monde enregistre « . Sur le plan pratique, je ne pense pas que cela vaille la peine pour la grande majorité des gens de s’inquiéter à ce sujet.
Pas convaincu? Ensuite, pour empêcher Google ou quiconque d’enregistrer les informations limitées et impersonnelles qu’un serveur Web recueille régulièrement, envisagez un outil ou un proxy d’anonymisation. Ils empêcheront Google et d’autres de voir vos informations. Bien sûr, l’outil lui-même saura ce que vous visitez, vous devrez donc avoir confiance que les choses sont en place pour détruire ces données régulièrement.
Enfin, il convient de noter que même Brandt qui dit que Google enregistre tout » ne pouvait pas dire quelle quantité minimale d’informations il jugerait acceptable.
Je ne connais pas assez leur fonctionnement pour savoir ce qu’ils jugent important d’enregistrer. Ils n’ont pas besoin d’un identifiant unique dans le cookie. Au-delà de cela, une limite de conservation des données est la chose la plus importante », a déclaré Brandt.
Accusation 3 :
Google conserve toutes les données indéfiniment »
Récapitulons ce que nous avons couvert jusqu’à présent. Cela ne dérange vraiment pas Brandt que Google utilise un cookie de longue durée ni qu’il enregistre des données de journal standard. Au lieu de cela, sa principale préoccupation, comme nous l’avons exploré dans les deux points précédents, revient à son objection selon laquelle Google utilise un identifiant unique pour savoir s’il a déjà vu un navigateur particulier.
Avec cela, nous passons au troisième point de Brandt, qu’il veut que Google purge régulièrement les données.
Google n’a pas de politique de conservation des données. Il est prouvé qu’ils sont en mesure d’accéder facilement à toutes les informations utilisateur qu’ils collectent et enregistrent », écrit Brandt, dans sa nomination Big Brother de Google.
Encore une fois, c’est une autre déclaration effrayante, suggérant qu’il existe une politique de conservation des données que Google devrait suivre. Alors, quelle est la norme ? L’expert en confidentialité Aftab dit qu’il n’y en a pas :
Personne n’a de politique de conservation des données. C’est là que tout le monde tombe de la carte, même les gentils », a déclaré Aftab.
Aftab n’est pas non plus trop préoccupé par cela, dans le cas de Google. En effet, pour l’internaute moyen, l’entreprise ne dispose d’aucune information personnelle identifiable.
Si vous savez qui je suis, alors je m’en préoccupe davantage. Si vous avez mon nom et mon adresse, et que je vous fais confiance pour les avoir, alors je vais vous faire confiance pour les avoir aussi longtemps que vous les aurez. C’est très probablement par le biais d’une politique de confidentialité disant que vous le protégerez et ne le partagerez pas et que si je ne veux pas que vous l’ayez, faites-le nous savoir et nous le supprimerons dans la mesure du possible », a-t-elle déclaré. mentionné.
Google : Protégez, ne détruisez pas
Quant à Google, Brin affirme avoir une politique de conservation des données, à savoir que Google ne détruit pas ses données mais protège plutôt qui peut y accéder.
Nous avons une politique existante et sommes en train d’en créer une nouvelle, qui sera assez stricte. Il y a des problèmes plus importants. Où est-ce que tu le gardes? Qui y a accès ? Nous avons déjà mis en place de nombreuses garanties et nous en ajoutons beaucoup d’autres », a-t-il déclaré.
Quelle sorte de garanties ? Tout d’abord, il est important de comprendre qu’il manque à Google certaines données, en grande partie quelques lacunes dans la journalisation depuis ses débuts. Quant aux données dont on dispose, elles restent au format brut et ne sont pas facilement accessibles, pour le moment.
Nous avons en fait un accès beaucoup plus limité que nous aimerions dans la mesure où nous ne pouvons pas exécuter facilement certains de ces agrégats », a déclaré Brin. À l’avenir, nous le mettons en place où nous pouvons répondre très facilement à certaines questions sans avoir à accéder à des journaux bruts, mais plutôt à des données récapitulatives ou à un ordinateur intermédiaire », a-t-il déclaré.
Fournir uniquement un accès limité aux données récapitulatives, plutôt qu’aux données brutes du journal, est un type de protection. Il est plus difficile pour une personne déterminée de suivre un utilisateur individuel réel, même si, même dans ce cas, il est important de se rappeler que l’individu n’est toujours pas personnellement connu de Google.
Brandt : Ce que vous détruisez, le gouvernement ne peut pas l’obtenir
Quant à Brandt, la sauvegarde ne suffit pas. Il souhaite que Google ne conserve pas les données plus de 30 à 60 jours, afin d’éviter qu’elles ne soient exploitées par le gouvernement américain.
Les bibliothécaires professionnels aux États-Unis sont désormais tenus de remettre au FBI tout document emprunté, et c’est un crime pour un tel bibliothécaire de même mentionner que le FBI a demandé de tels documents. L’American Library Association et des organisations similaires recommandent que tous les documents soient détruits dès qu’un livre est rendu. Si vous n’avez pas les données, ce n’est pas un crime de ne pas fournir les données. Mais si vous avez les données et que vous dites au FBI que vous ne les avez pas, alors vous avez commis deux crimes : mentir au FBI et entrave à la preuve. La solution évidente consiste à ne conserver que les données absolument essentielles à votre opération », a déclaré Brandt.
Peur du gouvernement américain
En effet, en discutant avec Brandt, il s’avère que c’est le problème clé qu’il a avec Google. Il ne semble vraiment pas inquiet que Google lui-même abuse des données limitées qu’il collecte. Au lieu de cela, il est plus préoccupé par le fait que le gouvernement américain dispose de pouvoirs lui permettant d’exploiter les données – et surtout, d’avoir la possibilité d’obtenir des adresses Internet enregistrées avec des requêtes de recherche liées aux comptes d’utilisateurs réels des FAI (comme expliqué plus en détail dans mon Search Privacy Dans l’article Google et autres moteurs de recherche). Cela permettrait alors au gouvernement américain d’exploiter plus facilement les journaux de Google pour lier les demandes de recherche à un individu.
Cela semble tiré par les cheveux ? Plutôt que de rejeter Brandt comme paranoïaque, il est important de noter qu’il récite simplement ce que la très respectée Electronic Frontier Foundation a à dire dans son analyse du USA Patriot Act :
Faites attention à ce que vous mettez dans cette recherche Google. Le gouvernement peut désormais espionner la navigation sur le Web d’Américains innocents, y compris les termes entrés dans les moteurs de recherche, en disant simplement à un juge n’importe où aux États-Unis que l’espionnage pourrait conduire à des informations « pertinentes » pour une enquête criminelle en cours. La personne espionnée n’a pas à être la cible de l’enquête. Cette demande doit être acceptée et le gouvernement n’est pas obligé de faire rapport au tribunal ou de dire à la personne espionnée ce qu’il a fait.
Devriez-vous craindre ?
Des trucs assez effrayants. Mais de manière réaliste, l’expert en confidentialité Aftab dit que la plupart des gens ne devraient pas s’inquiéter.
À moins que quelqu’un ne soit vraiment, vraiment sous surveillance en tant qu’espion irakien ou quelque chose du genre, ils ne vont tout simplement pas regarder ce que quelqu’un fait sur Google », a déclaré Aftab.
Aftab a ajouté que lorsqu’elle aidait les agences à traquer les criminels impliqués dans le cyberespace, les données de recherche ne sont pas quelque chose qui sont ciblées.
Nous ne passons pas beaucoup de temps là-bas », a-t-elle déclaré. Lorsque les forces de l’ordre s’appuient sur quoi que ce soit sur Internet, elles jalonnent la maison. Ils ne montreront pas seulement qu’il a été téléchargé sur l’ordinateur, mais qu’il est clair que personne d’autre que le suspect n’a effectué le téléchargement », a-t-elle déclaré.
Vue de l’EFF
L’avocat principal de l’EFF, Lee Tien, n’est pas aussi prompt qu’Aftab à rejeter une éventuelle surveillance gouvernementale du trafic de recherche.
Je pense que Brandt » a raison de dire que Google serait une cible populaire. Ce genre de juste sens. Le moteur de recherche le plus populaire au monde, ou AOL, Yahoo ou toute personne qui gère beaucoup de trafic serait intéressant », a déclaré Tien.
Cependant, Tien ne considère pas l’ID unique comme un problème, et la rédaction de l’EFF sur le Patriot Act ne fait pas référence aux données enregistrées. Au lieu de cela, la préoccupation de l’EFF est que le Patriot Act permet aux autorités gouvernementales américaines d’effectuer plus facilement une surveillance en temps réel des activités sur Internet.
Ce type de surveillance était à l’origine destiné à capturer les numéros de téléphone, plutôt que le contenu réel » d’un appel téléphonique – ce dont on parlait, comme avec une écoute téléphonique. Cependant, la possibilité de capturer les URL transmises entre un navigateur et un site Web capture dans une certaine mesure par inadvertance une conversation en cours. En particulier, avec un moteur de recherche, il est courant que ce que vous recherchez soit renvoyé intégré à l’URL.