Durcir le site vis à vis des robots de collectes automatiques d'informations

Fonctionnement du forum. Présentations.
Répondre
--gilles--
Membre actif
Membre actif
Messages : 526
Inscription : 24 août 2016, 19:35
Localisation : Gnome 43 - debian 12
Status : Hors-ligne

Puisque certains sujets que nous écrivons récemment évoquent la confidentialité des données, nous pourrions balayer devant notre porte et aussi nous interroger sur le fait que quand des articles de consommation sont évoqués ici sur ce forum et particulièrement dans la section qui nécessite un mot de passe comme Pause café, comme je l'ai fait récemment lors d'un sujet que j'avais ouvert sur les cadeaux de Noël, cette même catégorie d'article m'est apparu ensuite dans pas mal de sites en tant que publicité.

Peut-être est-ce une conclusion trop hâtive, c'est à dire qu'il faudrait la vérifier, mais comme Googlebot et Yahoobot, bien qu'il ne soient pas membres du forum, apparaissent parfois dans la liste des membres connectés, je suis assez enclin à penser que c'est par leur canal que sont passés ces publicités ciblées.

N'étant pas un spécialiste de la question, je m'adresse aux personnes chevronnées qui pourraient nous déjà infirmer ou confirmer mon intuition et si c'est le cas, nous indiquer des pistes pour éviter que notre site ne soit pas une amorce à publicités.
Parler de liberté n'a de sens qu'à condition que ce soit la liberté de dire aux gens ce qu'ils n'ont pas envie d'entendre. Eric Blair, George Orwell
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 4958
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

Excellent sujet.
Pour moi le problème n'est pas coté serveur mais coté client (à moins que lol nous ai caché quelque chose :))
Lol, est ce que les cookies utilisés par debian-fr.xyz sont chiffés ?
Google à les infos pour faire le lien entre une page visitée et un couple machine /navigateur.
Quel navigateur utilises tu ? Quels plugins ?
--gilles--
Membre actif
Membre actif
Messages : 526
Inscription : 24 août 2016, 19:35
Localisation : Gnome 43 - debian 12
Status : Hors-ligne

Je suppose que cette partie de réponse s'adresse à moi et l'autre à lol :
piratebab a écrit : 21 déc. 2017, 14:46 [...] [...]
Google a les infos pour faire le lien entre une page visitée et un couple machine /navigateur.
Quel navigateur utilises tu ? Quels plugins ?
Qutebrowser et Firefox + Request Policy ( que je suis obligé parfois de débrayer et alors je vois les pubs ). Entre le moment où j'ai remarqué le phénomène et maintenant, j'ai modifié mon /etc/systemd/resolved.conf pour y mettre des serveurs de noms de domaine indépendant de Google d'après :

https://debian-facile.org/doc:systeme:r ... nameserver et man resolved.conf

Peut-être que cela va suffire pour faire cesser ce phénomène, en tout cas pour bien faire la discrimination entre plusieurs hypothèses, notamment l'hypothèse d'une transmission par la messagerie où j'avais aussi évoqué ces cadeaux, je viens de laisser un gros hameçon à publicités sur autre partie du forum et je verrais bien le résultat en ce qui me concerne.
Parler de liberté n'a de sens qu'à condition que ce soit la liberté de dire aux gens ce qu'ils n'ont pas envie d'entendre. Eric Blair, George Orwell
--gilles--
Membre actif
Membre actif
Messages : 526
Inscription : 24 août 2016, 19:35
Localisation : Gnome 43 - debian 12
Status : Hors-ligne

Bon, même sans remettre le /etc/systemd/resolved.conf d'origine, je vois des publicités ( liées à mon dernier message récent sur les cadeaux de Noël dans le forum) dans ma messagerie gratuite Free. Pour moi, c'est clair, c'est passé par le forum. J'attends d'autres avis et la réaction de lol.
Parler de liberté n'a de sens qu'à condition que ce soit la liberté de dire aux gens ce qu'ils n'ont pas envie d'entendre. Eric Blair, George Orwell
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,
Je ne vois pas comment cela a pu passer "par le forum".
La section dont tu parles n'est pas accessible par les robots (il faut être inscrit).
Et quand bien même les robots visiteraient pause café: Comment faire le rapport entre un post et toi ??? A par le navigateur, je ne vois pas...
piratebab a écrit :Excellent sujet.
Pour moi le problème n'est pas coté serveur mais coté client (à moins que lol nous ai caché quelque chose :))
Lol, est ce que les cookies utilisés par debian-fr.xyz sont chiffés ?
Google à les infos pour faire le lien entre une page visitée et un couple machine /navigateur.
Quel navigateur utilises tu ? Quels plugins ?

Oui, les cookies sont chiffrés (Ils ne sont lisibles que par le forum (Qui lui-même est en https...).
Image

Il n'y a que moi qui serait capable de déchiffrer les cookies du forum - et je ne sais même pas comment faire... :003:
Image

Je pense que tu as du ouvrir une messagerie ou un service qui aurait collecté la liste des pages visités.
Mais ce n'est pas "moi" (le fofo), je ne crois pas.

Voici ma façon de procéder:
Sur mon navigateur principal JAMAIS autre chose que le fofo, wiki et des recherches Debian.
J'ai une autre session Firefox (Avec un autre profil) avec uniquement gmail.
Pour d'autre recherches autres que Linux j'utilise un autre navigateur (Chrome ou Chromium) avec lesquels je ne me connecte à aucun service (Ou à ce que j'appelle des services poubelles...). Bien entendu jamais de mails sur Chrome ou Chromium (et surtout pas google).

Si tu n'utilise qu'un seul navigateur, sépare bien les choses avec des profils; ainsi un site malintentionné (ou simplement trop curieux) n'aura pas accès aus données de navigation des autres profils...

Et comme par enchantement je n'ai jamais de publicités ciblées.
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
--gilles--
Membre actif
Membre actif
Messages : 526
Inscription : 24 août 2016, 19:35
Localisation : Gnome 43 - debian 12
Status : Hors-ligne

lol a écrit : 21 déc. 2017, 16:32 Salut,
Je ne vois pas comment cela a pu passer "par le forum".
La section dont tu parles n'est pas accessible par les robots (il faut être inscrit).
Et quand bien même les robots visiteraient pause café: Comment faire le rapport entre un post et toi ??? A par le navigateur, je ne vois pas...
Je ne veux pas faire une affaire personnelle de ce sujet, mais comprendre.

Le canal publicitaire est initié par le forum puisque c'est le seul endroit d'Internet où j'ai écrit au sujet de cadeau de chaussures de randonnée, j'ai écrit un post exprès sur le forum pour vérifier cette hypothèse, je n'en ai parlé qu'à cette amie et que cette amie n'a pas d'ordinateur. Très vite après avoir posté ce message « hameçon » la publicité associée à ma messagerie Zimbra de Free m'a affiché des messages en rapport avec le sport alors qu'auparavant ils étaient en rapport avec des tee-shirts et des vestes. Les messages publicitaires de la messagerie Zimbra de Free sont affichés par googletagservices.com et le robot d'indexation Googlebot est régulièrement présent sur le forum. Googlebot est parfois présent dans la liste des membres connectés alors qu'il est absent de la liste des membres.

Pour le lien entre moi et ma contribution postée sur le forum, ce ne sont pas les cookies du forum puisque tu l'affirmes et je ne mets pas en doute ta bonne foi, ni les serveurs de noms de domaines puisque j'ai viré les serveurs Google, je suppose plutôt l'empreinte du navigateur comme le suggère piratebab.


https://panopticlick.eff.org/results?aa ... printTable

Googlebot a accès à tout le forum debian-fr.xyz, même les parties qui nécessitent un mot de passe. Je ne l'aurais pas cru sans l'avoir vérifié. Évidemment si quelqu'un bloque efficacement les publicités, cette personne ne s'en apercevra jamais que ses messages sont analysés et évalués en terme de rendement publicitaire.

Je me demande si il est possible de créer une partie de forum étanche aux robots d'indexation tout en laissant une partie publique indexée.
Parler de liberté n'a de sens qu'à condition que ce soit la liberté de dire aux gens ce qu'ils n'ont pas envie d'entendre. Eric Blair, George Orwell
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,
Je pense que tu mélange les choses.

Les robots n'ont pas accès aux parties protégées par mot de passe du forum. C'est certain.
D'ailleurs fais une recherche "glyphosphate + debian-fr.xyz" aucun résultats ne sortira.

Si un message dans une section protégée provoque de la publicité dans ta messagerie, c'est le navigateur qui est en cause, pas les robots indexateurs.
Ni les cookies de navigation, ils ne sont lisibles que pas le forum.

Impossible donc, comme tu le suggère, de remonter à ta messagerie à partir d'un post fait sur le forum.

Si tu veux comprendre et non mettre en cause comme tu le dis il faut aussi peut-être repenser ta façon de naviguer.
Je pense que tes habitudes de navigation ne sont pas bonnes si tu souhaite te protéger efficacement contre ce genre de désagrément.
- Je suppose que tu ne te déconnecte pas de ton webmail quand tu navigue - (D'ailleurs même en étant déconnecté il existe des mécanismes de suivi...
- Tu fais tout dans le même profil c'est normal qu'il soit possible de tracer ton activité...

Isole les profils comme je le proposais dans un post précédent, c'est la seule solution.
C'est le principe du chroot... Le navigateur est isolé dans un profil, il n'a pas accès au reste.

Essaye avec un nouveau profil tout frais - dans lequel tu ne te connectera jamais à ta messagerie: Poste un truc en rapport avec de la vente en ligne.
Je suis sur que la publicité ciblée de ta messagerie ne proposera rien en rapport avec ton message sur le forum.

Ou si tu veux en être absolument convaincu, va dans un cybercafé ou utilise le pc d'un un copain (ou une copine...). Ouvre juste le forum et publie sur le sujet qui te viens à l'esprit (si possible un sujet qui intéresse les sites marchands...). Évidemment n'ouvre pas ta messagerie dans le même navigateur...
Reviens chez toi, ouvre ta messagerie: Il n'y aura pas de publicité en rapport avec ton post sur le forum.

Les moteurs de recherche/suivi d'activité Internet sont forts mais il y a des limites à leur puissance...
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Hello,
De toute façon ce n'est pas "simple" d'empêcher le tracking (la faute aux navigateurs ou aux sites).
Le site http://www.lemonde.fr par exemple ne respecte pas mon souhait de ne pas être tracké:

Mes paramètres Chrome:
Image

Le site avec une pub ciblée en fonction de ma zone.
Image

Ici le navigateur n'est pas en cause, c'est le site du monde (lemonde.fr) qui refuse ma demande de ne pas être géolocalisé...
192 cookies, rien que ça...
Image

Yahoo, google, twitter, xiti, amazon, facebook, tous les encul.. sont dans mon navigateur.

D’où l'importance de ne pas naviguer avec ce browser sur un autre site web susceptible de collecter et utiliser ces cookies (Aucun des 192 cookies n'est chiffré...).
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
--gilles--
Membre actif
Membre actif
Messages : 526
Inscription : 24 août 2016, 19:35
Localisation : Gnome 43 - debian 12
Status : Hors-ligne

Je viens de tenter deux choses pour bloquer le pistage avec Firefox :

A] Utiliser et activer First Party Isolation, avec about:config. Pour activer FPI, les utilisateurs doivent définir « privacy.firstparty.isolate » sur true. Plus d'explications ici : https://www.developpez.com/actu/174643/ ... icitaires/

B1] Puisque la publicité était affichée avec googletagservices.com :
1/ Décochez les deux paramètres suivantes dans les préférences de Firefox, onglet "Sécurité" : Block reported attack sites, et, Block reported web forgeries - puis fermez FF !
2/ Ensuite, il faut supprimer manuellement le cookie par les étapes suivantes :
2.1/ Tapez la commande suivante pour repérer le chemin de la base 'cookie.sqlite' : find ~/.mozilla/firefox -name cookies.sqlite
2.2/ Installez le paquet sqlite3
2.3/ En mode console, tapez la commande suivante : sqlite3 suivi du chemin restitué par le commande en 2.1
2.4/ Dans le prompt sqlite3, tapez la commande : DELETE FROM moz_cookies WHERE baseDomain = "googletagservices.com";

3/ Empêcher ces cookies de revenir en les bloquant : Bloquer les cookies venant de googletagservices.com

Dans le navigateur Firefox :
Menu > Options > Onglet "Vie privée"
Paramétrer le menu "Règles de conservation" sur "Utiliser les paramètres personnalisés pour l'historique" .
Puis dans "Accepter les cookies" -> "Exception" Rajouter l'adresse web : googletagservices.com puis "Bloquer", puis "Enregistrer les modifications"

B2] Refait la démarche avec googletagmanager.com

Partie B] : Adapté du post de PingouinPrésident : viewtopic.php?f=7&t=426#p7662

Je vais tester cette solution pendant quelques jours. C'est vrai que cela n'est pas facile d'échapper aux pisteurs.
Parler de liberté n'a de sens qu'à condition que ce soit la liberté de dire aux gens ce qu'ils n'ont pas envie d'entendre. Eric Blair, George Orwell
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,
Intéressantes tes manipulations.
--gilles-- a écrit : 27 déc. 2017, 21:48Je vais tester cette solution pendant quelques jours. C'est vrai que cela n'est pas facile d'échapper aux pisteurs.

Ceci dit, avec les profils je m'emmerde moins, je crois.
J'ai des profils "poubelle" ou des navigateurs fais pour surfer sans me casser le tête: être pisté dessus ne me gêne pas je n'utilise pas de "services collecteurs" dedans (Google, FB, Twitter, etc.).
Les éventuels services collecteurs que j'utilise sont isolés dans d'autres profils.

Mon Beauf s'est payé ma tête... "J'utilise thunderbird pour gmail, je suis jamais emmerdé..." :003:
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,
Certains croient (encore) que les robots ont accès à toutes les sections.
Je le répète, je l'affirme (et je viens encore une fois de vérifier dans le panneau de contrôle d'administration) : Non, aucun robot n'a accès à la section Pause café (Pas plus qu'a la section modération et administration... et c'est heureux !).

Image
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
--gilles--
Membre actif
Membre actif
Messages : 526
Inscription : 24 août 2016, 19:35
Localisation : Gnome 43 - debian 12
Status : Hors-ligne

Bonjour lol, ton affirmation est peut-être vraie, mais tu m'aiderais plus à y croire si tu m'expliquais pourquoi Google [Bot] et Google Feedfetcher arrivent à être présents en tant qu'utilisateurs connectés alors qu'ils ne sont pas dans la liste officielle des utilisateurs.

https://www.forum-debian.fr/memberlist.p ... memberlist



Cela me chiffonne, merci de ta patience cordiale.
Parler de liberté n'a de sens qu'à condition que ce soit la liberté de dire aux gens ce qu'ils n'ont pas envie d'entendre. Eric Blair, George Orwell
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,

Les robots sont tous répertoriés (un peu moins de 150*) dans phpBB et ils sont tous membres (oui).
Ces membres spéciaux font partie d'un groupe aux droits restreints: Les Robots. Ils ont à peu près les même droits que les utilisateurs non inscrits.
Le groupe des Robots n'a pas accès à Pause café (ni à d'autres parties du forum) comme je te l'ai montré dans la capture précédente.

C'est pour mieux les contrôler qu'ils sont répertoriés et inscrits! Ils ont une puce dans le cul et ne vont pas ou je ne le souhaite pas! :icon_mrgreen:

Mais je l'ai déjà dit plus haut... Je ne sais pas comment te convaincre.
Penses-tu vraiment que je laisserais les robots fouiner dans tous les recoins du forum ? NON!

Donc tu peux te coucher plus tranquille ce soir, notre conversation (celle sur Forum Interne) ne sera pas scannée par les robots ni indexée.

Image



Je te mets au défi de trouver une discussion de Pause café indexée sur Google, Yahoo, Bing ou Yandex!

(*)Edit : 153 Robots exactement.
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 4958
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

lol, sur un autre forum dont je suis admin, des propos tenus dans le forum des modérateurs ont été lus par des personnes non autorisées. S'agissant d'un forum de respect de la vie privée sur internet, les "attaquants" ont certes les moyens et compétences pour les faire, mais cela nous à casser la confiance que nous avions avec PHPBB. (Les fournisseurs de logiciels de pseudo sécu qui se font descendre dans les tests n'apprécient Pas vraiment ....)
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Hello,
On parle alors d'autre chose que des robots indexateurs (Le sujet je le rapelle).
Pour ce qui est des robots ils n'ont pas accès aux parties interdites, j'en suis certain (Même si vous m'avez fait douter au début).

Tous les logiciels sont faillibles et je ne voue pas un culte particulier à phpBB. Il est surement piratable.
Mais je suis prudent, et à jour, ça ne fait pas tout, mais c'est un non début...
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 4958
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

lol, c'est ce que je voulais dire. Seule une personne motivée et compétente à réussi à accéder à un forum qui ne lui était pas autorisé. Un robot n'a pas ces compétences. Et si c'était le cas, cela aurait déja été remarqué et dénoncé. Je vois mal google et consort se faire bannir le moitié du web suite à une telle annonce.
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 4974
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

piratebab a écrit : 11 févr. 2018, 17:06lol, c'est ce que je voulais dire. Seule une personne motivée et compétente à réussi à accéder à un forum qui ne lui était pas autorisé. Un robot n'a pas ces compétences. Et si c'était le cas, cela aurait déja été remarqué et dénoncé. Je vois mal google et consort se faire bannir le moitié du web suite à une telle annonce.

Ok, nous sommes d'accord.
1) Les robots n'ont pas accès à tout le forum;
2) Un enculé motivé pourrait y parvenir.

Qu'il passe son chemin, il n'y a rien d'intéressant ici. :198:
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Répondre