Debian-fr sans google

Tags: #<Tag:0x00007f50a1375548> #<Tag:0x00007f50a1375458>

Remarquez que tous les sites sont passés à ça depuis quelques mois. Sans compter le google captcha ( dont se passe ants.gouv.fr )
chez moi tous les google sont virés de base

pareil pour les javascripts , et tout le reste.

Je comprends bien ton dilemme, mais tu attends quoi comme réponse ?

Tu veux que l’on dégage les fonts provenant de l’API de google ?
Personnellement moi ça me fait ni chaud ni froid si on change, mais c’est pas moi qui me tape la maintenance.

exactement

Ton exemple est mauvais puisque tu recherche un site en entrant son nom, que se passe-t-il si on cherche son contenu? Sur le fond on est d’accord, Analytics n’a rien à voir avec le référence, sauf que j’ai lu plusieurs fois qu’il permettait de l’être mieux. Logique dans le sens où Google pousse à l’utilisation de ses outils (même constat avec AdSense).

Oui et non. La base c’est d’utiliser une police existante sur tous les systèmes ou des noms générique. L’inconvénient c’est qu’il faut tester le site en question sur tous les navigateurs, sur tous les OS (toutes versions). C’est lourd, mais les polices dans les pages web, c’est pas si vieux que ça. Encore un bel exemple de la fainéantise des développeurs (que je pratique et comprend).

Le mieux c’est de ne pas en avoir, comme moi, mais bon, les sites sont forcément un peu moins “bling-bling”.

Je pense que c’est effectivement la demande de @dindoun, le problème c’est que sur un CMS, on a pas forcément le temps ni l’envie de modifier un thème de base dont il faudra assurer la maintenance à chaque montée de version…

@dindoun: ça serai pas mal que tu ne fasses pas de multi-post mais que tu édites ton message lorsque personne n’a encore répondu. On se tape des notifications en plus pour rien.

Héhé justement : pas d’icône compréhensibles : que des carrés avec les codes google, voire pas d’icône : l’utilisation du site est devenu problématique pour moi.

Et probablement que ça correspond à ma façon de séparer les problèmes

Pour être franc, quand je vais sur un icone absent ( rien donc ) ou sur un icone avec les codes , le alt marche, je vois la fonction.

Et puis j’y vois vraiment le similaire des discussions “windows vs linux” : ok ça a des avantages, tout le monde le fait, mais on peut choisir l’alternative libre.

J’ai fait une recherche avec un texte du même site trouvé en cliquant au hasard ( “Ainsi pour le calendrier des Kan et des Che reposant sur des cycles de 60 ans” ) : sur google.com j’obtiens la page.
Sur mes sites sans google je vois des appels venant des sites de google : ils indexent même s’il n’y a pas de google analytics ; à leur place je ne me dirais pas “pas de google analytics, je ne référence pas”.

Et puis dans des années les articles internet seront impossibles à lire, même ici.

J’ai rien compris… tu parles de quoi ?

On est d’accord, mais les arguments se tiennent quand même.

Tu confonds référencement et indexation… Le référencement c’est ta place dans les résultat, l’indexation c’est être référencé.
Tu donnes en plus, encore une fois, un mauvais exemple. Une phrase tirer du texte d’un site a forcément plus de chance de sortir le site attendu. Une recherche se fait par mot clef, ce sont eux qui définissent si tu es bien référencé ou non. Un exemple “calendrier Kan”.

Pourquoi ?

donc j’ai cherché du contenu : j’ai pris une phrase entière volontairement pour te montrer ce qui se passe si on cherche son contenu. Mais si tu changes les conditions à chaque post …

Justement tout ce post est sur ce sujet des caractères. ^^ Voir message #8.

Alors là, si je peux me permettre, c’est mon métier de référencer, et toutes ces idées comme quoi google pourrait mieux classer les sites pour des raisons de business (on dit aussi que ceux qui se payent de la pub sont mieux classé, et c’est faux - enfin presque, mais ce n’est pas lié directement à un biais introduit par google) ne sont que des rumeurs idiotes.
D’abord parce que google fait justement trés attention à éviter de donner prise au moindre soupçon d’abus de position dominante, ils sont déjà la cible de lois antitrust et on parle de démanteler alphabet, donc ne pas donner de grain à moudre pour les batailles juridiques à venir.
Ensuite, le moteur est la poule aux oeufs d’or, pas parce que c’est directement payant, mais parce que ça lui permet de vendre de l’espace publicitaire et de la donnée comportementale, ce qui est le vrai business de google. Donc là encore ne surtout pas laisser penser aux internautes que le moteur fournit des résultats classés selon d’autres caractéristiques que la plus pure satisfaction du visiteur, il ne faut surtout pas écorcher l’image.
Donc non, c’est de la rumeur.

Sur le fond de la question, tu installes un proxy cache http entre toi et le net, tu charges une fois et tu sers en statique ensuite (en les figeant à la version cachée) les urls de ressources google les plus courantes et tu bloques les autres non chargées au niveau de ton proxy, et aprés, tu n’aura plus fuite de signaux.
Mais pour ce qui est de faire bosser ed sur une modif du site un peu ch14nte, je pense que c’est déjà courageux de sa part d’avoir entretenu si longtemps le forum, alors que ça fait bien longtemps qu’il ne le fréquente plus vraiment.

Combien de personne arrivant sur le site dont tu as testés le référencement tombent dessus en cherchant son nom ou une phrase exacte qu’il contient? Il faut que les tests soient un minimum réalistes pour être probant.

Je veux bien te croire, mais comment en être sûr ?
Y a autant de pour que de contre sur internet et Google ne fait que donner sa parole, sans montrer patte blanche.

Je suppose que tu dois pouvoir télécharger et installer la police sur ton poste/profil pour que ça s’affiche correctement. Le soucis c’est que pour suivre d’éventuelles mises à jour, bon courage!

Ben tu testes, avec/sans analytics search consoles, etc, et tu vois si ça change les rankings ou si ça améliore globalement le trafic.
Mon expérience est que ça n’a aucun impact.

Ou mieux, tu fais une étude (comme celle faite sur la correlation entre sous rankings et critères de spam par les Peyrronet) avec un gros dataset de sites ou tu vérifies s’il y a une corrélation entre la présence d’analytics, la connection à la search console, adwords, adsense, ce genre de choses rumorisées. Je n’en ai pas sous la main, mais j’en ai vu passer, et toutes confirment: ce sont des foutaises.

Je reviens là dessus:
non, indexation et référencement veulent fondamentalement dire la même chose:
un référencement, c’est la présence dans un index à la base, que ce soit un index de produits dans un supermarché ou de pages dans un moteur de recherche.
C’est référencement et “optimisation pour les moteurs de recherche” (SEO) par contre qui sont différents.
Et ce n’est que par amalgame et faute d’avoir de meilleurs termes initialement qu’on a traduit SEO par référencement, et qu’on confond ça avec l’optimisation.

Je reviens là dessus aussi.
Rechercher un site par sa marque, c’est ce qu’on appelle une requête navigationnelle, les gens veulent aller sur un site, et ils demande à google le lien en tapant le nom.
C’est donc une requête comme les autres.
Amusant: la plus forte recherche dans google, c’est le mot “google”, car les gens le tapent dans la barre d’url pour trouver google, donc google leur répond.
Ensuite, il y a une première étape pour vérifier si une url (car google référence - on dit indiféremment indexe - des urls, et non des sites) est bien indexée par google: tu fais une requête dite “technique” (un dork) du type cache:https://www.debian.org/ :
http://webcache.googleusercontent.com/search?q=cache%3Ahttps%3A%2F%2Fwww.debian-fr.org%2F&oq=cache%3Ahttps%3A%2F%2Fwww.debian-fr.org%2F&aqs=chrome..69i57j69i58.3063j0j7&sourceid=chrome&ie=UTF-8
Et là, tu vois que le forum debian est super mal indexé par google, qui ne charge pas le js avec son bot, donc le rendu est pourri, donc le forum se classe mal.

[edit: le probleme vient peut être, dans le fichier https://www.debian-fr.org/robots.txt de la ligne:
Disallow: /assets/browser-update*.js
mais il faudrait vérifier si ce sont bien des js qui participent au rendu, et le bloquage peut aussi venir de n’importe quel Disallow qui bloquent le chargement de certains js et/ou de css.
un patch rapide, c’est de rajouter une exception pour autoriser tous les js/css avec les lignes suivantes à rajouter:
Allow: /********************.js
Allow: /********************.css
Avec autant d’* que la plus grande ligne de disallow, car c’est comme ça que google détermine - je sais c’est trés sale - la règle qui va prendre le dessus entre le Allow et le Disallow.
/edit]

Deuxième étape aprés le “cache:”, vérifier si le site n’est pas filtré par google pour cause de faible qualité ou défaut technique, et la tu cherches le nom de domaine:
si le site n’est pas en première position sur son nom de domaine tu as un problème.
Il faut disons qu’il soit au moins en page 1, car il peut y avoir quelques sites “forts” avec une grande similarité de nom, ou ton site peut être un emd (“exact match domain”, un site dont le nom de domaine est une expression de recherche exact), auquel google va appliquer à la fois un bonus sur l’expression de son nom de domaine sans le tld, et un malus sur toutes les autres expressions ou il pourrait apparaitre.

Ensuite, quand tu t’intéresse au référencement d’un site, tu vas regarder des éléments exacts de son contenu (des bouts du texte des pages, mis entre guillemets), pour voir si google donne du poids au texte, et vérifier surtout que personne n’a copié le contenu.

Ce n’est qu’aprés ça que tu regardes si il apparait un peu sur les expressions plus larges ou tu souhaites le voir apparaitre, mais bien aprés la vérification de la bonne indexation, du bon référencement de base.
Et la, tu entres dans l’optimisation, et la création de liens car fondamentalement, il n’y a que ça qui marche vraiment pour se positionner.
Attention, je dis bien pour se positionner, car au delà de la position, ce qui fait un gros trafic, c’est la multiplication des expressions sur lesquelles un site se postionne bien, mais c’est différent du pur positionnement.

Bref, j’adore parler de mon boulot, mais on s’éloigne du sujet, non ?

1 J'aime

un peu mais pas tant que ça. car au fond mettre google font ou google analystics ou google captcha sur son site , c’est toujours juste mettre du google sur son site, parce qu’on a pas choisit son cms , ses polices, ses js, ses captcha sans google.

2 J'aime

C’est aussi maintenir au plus simple un service, avec le minimum d’effort :wink:

C’est exactement la même problématique sur l’utilisation des npm ou des dockerfile certifié, quelqu’un a fais un travail correct mais il ne faudrait surtout pas réutiliser son travail car on serait lié à cette personne.

Encore une fois je comprends très bien ce qui te dérange mais seul la personne qui s’occupe de la maintenance décidera.

1 J'aime

et la c’est mieux?

3 J'aime

C’est parfait.
Merci beaucoup de ton travail.

Moi j’ai plus rien.
image

Ah ben là c’est revenu.
Merci @ed
image

Bonjour,
Euh, l’extinction des dinosaures, c’est les GAFAM, tu es sûr ?