Danger : duplicate content / Danger : Google

Tous les blo­gueurs et tous les éditeurs n’ont que ça à la bouche : « Sur­tout je ne veux pas que mes textes soient repro­duits, Google me péna­li­se­rait. » Je suis sen­sible à ce cette crainte parce qu’avec coZop nous dupli­quons jus­te­ment des contenus.

Mais cette crainte est-elle légi­time ? Est-ce qu’en dupli­quant sur des cen­taines de sites la Décla­ra­tion des droits l’homme nous dimi­nuons sa valeur ? Est-ce que Google doit la péna­li­ser ? Est-ce qu’on doit la trou­ver moins facilement ?

Est-ce qu’un jour un écri­vain s’est plaint de voir ses livres édités en poche, en paper back, dans les clubs, en tirage de tête ? Au contraire, il est plu­tôt heu­reux. Ce qu’il n’apprécie pas c’est les éditions pirates mais où est le pro­blème si la dupli­ca­tion est accepté par lui. Plus son livre est dupli­qué, plus c’est le signe que son livre a de l’importance. Google devrait au contraire favo­ri­ser les conte­nus dupli­qués pour témoi­gner qu’ils génèrent de l’intérêt.

Si un de mes billets se retrou­vait repris par des cen­taines de blo­gueurs, j’en serais heu­reux. J’aurais la preuve que j’ai écrit quelque chose qui inté­resse et je ne vois pas pour­quoi Google me pénaliserait.

Mais à quoi joue Google ?

J’avoue que je n’en sais rien. J’ai remar­qué que depuis la fin novembre son algo­rithme a été modi­fié et que coZop reçoit moins de visites. J’ai noté la même baisse sur mon blog, presque sou­daine, donc tech­nique. Je sais que d’autres sites ont vu la même chose se pro­duire (qu’ils dupliquent ou non). Où part le tra­fic qui ne vient plus chez nous ? Chez TF1 ? Ce serait bien que nous le sachions pour savoir à quoi Google joue exac­te­ment avec inter­net mais nous ne le savons pas (je n’ai jamais vu de baisse tra­fic en décembre, c’est tout le contraire qui se pro­duit traditionnellement).

La pho­bie du dupli­cate content est-elle légi­time ou non ? J’ai mon­tré, j’espère, que la dupli­ca­tion devrait être un cri­tère de qua­lité (ça me donne l’idée d’un busi­ness) mais que fait Google de cette information ?

Je ne serais pas sur­pris qu’il péna­lise les conte­nus dupli­qués tout sim­ple­ment parce que ça com­plique son tra­vail. Qui est l’auteur ? Facile quand la dupli­ca­tion pointe vers la source. On peut remon­ter à elle. Plus dif­fi­cile quand ce n’est pas le cas. Quelle dupli­ca­tion faire appa­raître en tête des recherches ? Celle publiée sur le site le plus popu­laire, celle qui semble être la source, celle qui rap­porte le plus en reve­nus Ad Sense ?

On le voit Google n’est plus du tout neutre. Il ne fait pas que nous aider à cher­cher le web, il est en train de la façon­ner à sa convenance.

Idéa­le­ment, et je le sens venir depuis long­temps dans ses recom­man­da­tions, Google vou­drait que les choses ne soient pré­sentes qu’une fois et qu’il y ait très peu de liens entre les pages. Il vou­drait que plu­tôt que nous navi­guions de site en site comme c’était le cas à l’origine, nous navi­guions tou­jours par lui, c’est-à-dire que nous allions où il nous laisse aller.

Google n’aime plus les pages avec beau­coup de liens externes. Ils jugent qu’elles res­semblent à des résul­tats de recherche, c’est-à-dire à des pages Google, donc des pages concur­rentes et il les dépré­cie dans son index (ce qui condamne en réfé­ren­ce­ment par exemple les pro­jets de link­jou­na­lism comme aaaliens.com même s’ils sont légi­times et impor­tants pour nous).

Tout est fait pour iso­ler les conte­nus les uns des autres. Tout est fait pour que l’architecture mas­si­ve­ment dis­tri­buée du web devienne pyra­mi­dale. Nous sommes peut-être en train d’assister à la mort du web tel que nous l’avons connue durant les quinze pre­mières années de son his­toire. Nous ris­quons de nous rap­pe­ler d’elles comme d’un âge d’or où tout était permis.

Que devons-nous faire ?

Nous cou­cher devant les dic­tats de Google ?

Je pose la ques­tion parce que je ne sais pas quoi faire…

PS : Pour esti­mer com­bien de fois ce billet sera repris, j’inscris ici un water­mark : crou­ton­de­ba­la­ruc. Ne l’effacez pas :-) .

Suivi via Google

  1. Publié le 15/12/2008 à 11:31, sur Google à 11h45.
  2. Vu sur coZop à 16h30.
  3. Vu sur lespacearcenciel.com le 16/12/1008 à 2h.
  • del.icio.us
  • Facebook
  • LinkedIn
  • Posterous
  • Google Bookmarks
  • Netvibes
  • Wikio FR
  • FriendFeed
  • Twitter
  • Identi.ca
  • Print

/ Coup de gueule

46 commentaires à “Danger : duplicate content / Danger : Google”

  1. gravatar.com Laurent Bervas ip:1
    15 December 2008 @ 12:37

    Ton billet me rap­pelle l’affaire d’Allociné concu­rencé par les ser­vices de Google.

    Toutes ces affaires montrent tout sim­ple­ment que les site qui dépendent prin­ci­pa­le­ment d’un réfé­ren­ce­ment natu­rel sont expo­sés. Cela va obli­ger les SEO a être plus ima­gi­ni­tifs … et c’est tant mieux :-)

  2. gravatar.com Paul .ca ip:2
    15 December 2008 @ 12:41

    Après le chaud, encore le froid. Thierry, s’il te plait relis un mini­mum ce que tu écris. Oui je sais bien que le temps c’est de l’argent.

    > J’ai mon­tré, j’espère, que la dupli­ca­tion devrait être un cri­tère de qualité

    Tu peux pas le démon­trer puisque c’est faux !
    La dupli­ca­tion n’est même pas un cri­tère de popu­la­rité puisqu’il faut regar­der les ventes. Est ce qu’un film popu­laire est un film de qua­lité ? C’est pos­sible mais loin d’être un syno­nyme.
    Google regarde la popu­la­rité comme cri­tère mais pas uni­que­ment. il écarte ceux qui abusent des tech­niques qui sont faci­le­ment repro­duc­tible a l’infini sur le net. Impri­mer un ouvrage et faire une copie numé­rique n’a pas le même cout. La com­pa­rai­son est un peu mal­hon­nête. Amé­liores ton coZop. As tu besoin d’idées ? je t’en don­ne­rai gra­tui­te­ment. As tu besoin d’un déve­lop­peur ? Trouve le. :D

  3. gravatar.com Laurent Bervas ip:1
    15 December 2008 @ 12:44

    PS : j’ai observé sur les sites que je gère que Google déclas­sait for­te­ment les sites avec “trop” des liens sor­tants. Dès que j’ai sup­primé les flux RSS pla­cés en home, le traf­fic est revenu …

  4. gravatar.com Thierry Crouzet ip:3
    15 December 2008 @ 12:52

    @Paul La dupli­ca­tion sur inter­net = reprise. Quand des gens reprennent quelque chose, c’est parce qu’ils ont une rai­son (leur rai­son n’est pas m’ont affaire) mais c’est qu’ils jugent inté­res­sant de reprendre (que ce soit plus facile sur le web ne change rien pour moi… je sais que tu es maso mais bon).

    Il n’y a aucun lien entre nombre de reprises et nombre de lec­tures. Un article scien­ti­fique cité par mille autres a peut-être pas plus de mille lec­teurs (voire sou­vent moins). Le PR est basé sur les cita­tions (ce qu’on appelle la popu­la­rité), par sur le suc­cès (le nombre de lectures).

    @Laurent Tout le monde passe par Google pour accé­der au web, même aux sites qu’ils connaissent. Tu peux déve­lop­per le site que tu veux, t’as pas le choix que de te sou­mettre. Tout le monde dépend à 80% du réfé­ren­ce­ment (ou de Ad Sense).

    Que tu sois obligé de virer un contenu de ton site pour aug­men­ter son ren­de­ment (cela à cause de Google), c’est le monde à l’envers.

  5. gravatar.com Paul .ca ip:2
    15 December 2008 @ 13:14

    A l’esprit googleisé,

    Je connais pas le voca­bu­laire de Google.
    il se trouve que j’ai repris ta lettre pour en rire pas pour la qua­lité du contenu.
    Ne parle pas de qua­lité mais juste de popu­la­rité de liens ou de visite.

    Quand au monde à l’envers, c’est tous ces films qui sont popu­laires mais que je trouve sou­vent de médiocre inté­rêt et qualité.

    Arrêtes d’essayer de psy­cha­na­ly­ser les gens, tu es mau­vais et ça décré­di­bi­lise ta vision du reste. Ça serait dommage.

    Quand je rigole a tes attaques c’est parce que ça tombe à l’eau et que tu crois viser juste, excité comme une pucelle.

  6. gravatar.com Manuel Vila ip:4
    15 December 2008 @ 13:17

    « Que devons-nous faire ? »

    Repen­ser le web en géné­ra­li­sant les prin­cipes décen­tra­li­sa­teurs qui ont fait la force du réseau TCP/IP sur lequel il repose.

    Si le sto­ckage des don­nées a une ten­dance à se cen­tra­li­ser (You­Tube, Fli­ckr, etc.) c’est qu’il n’y a pas de solu­tion simple pour que ce soit autre­ment (sto­ckage par les gens eux-mêmes ou par des héber­geurs neutres).

    Si les réseaux sociaux engendrent des mas­to­dontes tels que Face­book ou MyS­pace c’est que les tech­no­lo­gies et les stan­dards qui per­met­traient de décen­tra­li­ser tout ça n’existent pas encore.

    Si les moteurs de recherche se réduisent aujourd’hui à un seul, Google, c’est que d’une part quelques méca­nismes fon­da­men­taux tels que les data­hubs res­tent à créer et que d’autre part la forme du web elle-même, met­tant sur le même plan le conte­nant et le contenu, per­met à la publi­cité de se déve­lop­per d’une façon démesurée.

  7. gravatar.com greg ip:5
    15 December 2008 @ 13:42

    Avec toute l’admiration que j’ai pour vous Thierry, lorsque vous par­lez de réfé­ren­ce­ment j’ai l’impression d’entendre par­ler d’économie sur TF1

    Le PR est basé sur les cita­tions“
    Ha? Vous avez la for­mule mise à jour? Parce que celle d’origine se base sur les liens, pas sur les cita­tions. Et d’ailleurs, si vous savez à quoi sert le Page­Rank aujourd’hui je veux bien une explication…

    Tout le monde dépend à 80% du réfé­ren­ce­ment (ou de Ad Sense).“
    Ama­zon? Face­book? Mys­pace? Craig­slist? Flickr? …

    Au fond quel est le pro­blème? Que lorsque-vous reco­piez mot pour mot un contenu (prin­cipe de coZop) Google pré­fère mettre l’original dans ses résul­tat plu­tôt que la copie? Cela me parait plus que logique, non?

    Mais cette crainte est-elle légi­time ?“
    Si vous posez la ques­tion c’est que vous n’avez pas la réponse, donc pour­quoi faire un billet pour dire que ce n’est pas normal???

    Google devrait au contraire favo­ri­ser les conte­nus dupli­qués“
    Je pousse le rai­son­ne­ment, mais quelle preuve avez-vous qu’il ne le fait pas lorsqu’il est sur de la source?

    Où part le tra­fic qui ne vient plus chez nous ?“
    Si vous ne le savez pas, c’est que vous n’avez pas ana­lysé sur quelles requêtes vous avez moins de tra­fic. Et si vos posi­tions ont baissé sur ce requêtes, quels sites ont pris votre place. Donc vous ne savez pas s’il s’agit d’un déclas­se­ment, d’une baisse des volumes de recherche, ou de requêtes sur les­quelles au fond il est légi­time que vous soyez moins bien placé…

  8. gravatar.com Laurent Bervas ip:1
    15 December 2008 @ 15:15

    @Thierry
    > Tout le monde dépend à 80% du réfé­ren­ce­ment (ou de Ad Sense).
    Je pense que tu te trompes … (c’est limite ne pas être res­pec­tueux des autres SEO ;-) )

    Un exemple que je connais bien Linutop.com.
    – 56% Refe­ring sites
    – 25% Direct Traf­fic
    – 19% Search engine.

    Si j’enlève les requêtes Google conte­nant Linu­top, on tombe à 9% en pro­ve­nance des moteurs de recherche (on est donc loin des 80%). De plus le taux de trans­for­ma­tion des visi­teurs en pro­ve­nance de Google est inférieur.

    L’apport de tra­fic s’est fait à tra­vers un vrai tra­vail de réfé­ren­ce­ment, en pro­dui­sant du contenu repris par d’autres sites, ne com­mu­ni­quant avec la presse … en un mot on à bossé ;-)

    Comme je te le disais un peu plus haut en com­men­taire, il faut faire preuve d’imagination. Grosso modo ton busi­ness avec CoZop et bon­web repose sur la mise en place d’un algo­rithm qui va essayer de battre l’algorithm de Google. C’est pas tenable … enfin ce que j’en dis … en toute ami­tiée :-)

  9. gravatar.com Thierry Crouzet ip:3
    15 December 2008 @ 16:23

    @Greg Lien = cita­tion (c’est henri qui joue sur les mots d’habitude). J’ai encore relu il y a pas long­temps le papier ori­gi­nal à la base de Google.

    Le nombre de liens vers un site reste déter­mi­nant dans l’algo de popu­la­rité de Google. Pour s’en convaincre, il faut avoir un site qui fait du tra­fic et voir com­ment en fonc­tion des liens le tra­fic bouge mécaniquement.

    C’est le drame de la tech­nique Google d’ailleurs qui favo­rise la quan­tité à d’autres cri­tères qui seraient qua­li­ta­tifs. Plus tu es cité (linké), sur­tout par des sites eux-mêmes cités, plus tu reçois de visi­teurs. C’est le people qui prime.

    Fau­drait avoir les chiffres mais je suis sûr que Face­book reçoit beau­coup de visites des moteurs… car je vois sou­vent les pro­fils face­book sor­tir dès que je cherche quelqu’un.

    En plus pra­ti­que­ment tous les uti­li­sa­teurs aujourd’hui sai­sissent le nom du site vers lequel ils vont depuis la fenêtre d’accueil de google. Rien que par ce méca­nisme Google a un rôle cen­tral dans la géné­ra­tion de tra­fic (des gros sites bien sûr).

    @Laurent Tes chiffres ne peuvent être appré­ciés qu’en regard du tra­fic. C’est sûr que si tu fais moins de 10 000 visi­teurs uniques par jour, tu peux te pas­ser de Google. Mon blog qui fait en ce moment 1000 unique/jours reçois 11% de visi­teurs de tous les moteurs confondus.

    Tous les sites qui traitent des sujets chauds reçoivent 80% de leurs visi­teurs des moteurs. Tous les sites d’actualités dépendent vita­le­ment des Google. Je ne donne pas de chiffres, parce que ce ne sont pas les miens, mais je parle de temps à autres avec cer­tains éditeurs et je sais que c’est le cas. Google les tiens par les couilles.

    Ce qui me sur­prend le plus c’est de voir com­bien tout le monde est naïf au regard de Google.

    Je crois que nous sommes dans une situa­tion critique.

    PS : Mon busi­ness c’est d’écrire… je vis prin­ci­pa­le­ment de mes livres/conf depuis 1997. Tout le reste c’est pour jouer avec la techno pour m’aérer la tête. N’inverse pas tout. Si j’ai gagné du fric en jouant, c’est exac­te­ment comme si j’avais gagné au loto. Je ne fais pas des confs pour par­ler de Bon­web ou de coZop. D’ailleurs bon­web n’a pas d’algo et coZop en aura un peut-être un jour, ce qui n’est pas encore le cas, et le but ne sera jamais de concur­ren­cer Google mais d’autres médias. C’est Wikio qui joue à concur­ren­cer Google et qui uti­lise les tech­niques que j’ai jadis employées avec bon­Web (prou­vant qu’elles marchent tou­jours fort bien).

  10. gravatar.com Laurent Bervas ip:1
    15 December 2008 @ 16:40

    @Thierry
    Je pense que ton argu­men­ta­tion est faible car elle s’appuie sur deux affir­ma­tions non vérifiées :

    1) sur google qui péna­li­se­rait aveu­glé­ment le “dupli­cate content“
    2) sur la dépen­dance à 80% de traf­fic de Google pour les gros site

    Voici les stats octobre 2008 (média­mé­trie) en France :

    1 Google 28 530 000
    2 Micro­soft 27 871 000
    3 France Tele­com 21 708 000
    4 Pages­Jaunes 17 040 000
    5 Iliad 16 889 000
    6 eBay 16 545 000

    Je pense que Micro­soft, France tele­com, Pages­jaunes, etc … ne dépendent pas à 80% de Google ?

    > Ce qui me sur­prend le plus c’est de voir com­bien tout le monde est
    > naïf au regard de Google.

    Je pense que tu n’es pas le seul a te poser des ques­tions mais tu te trompes de combat …

  11. gravatar.com Phyrezo ip:6
    15 December 2008 @ 17:21

    Hors sujet :

    Presse-Citron fait un post sur la joie d’être un connec­teur :
    http://www.presse-citron.net/cette-machine-vaut-100000-euros-ou-plus

  12. gravatar.com Thierry Crouzet ip:3
    15 December 2008 @ 17:22

    Jus­te­ment.
    En géné­ral le nombre de visi­teurs est pro­por­tion­nel au nombre de pages réfé­ren­cées.
    http://www.google.com/search?q=site%3Aebay.com
    195 000 000 pour ebay !!!
    http://www.google.com/search?hl=fr&rls=com.microsoft
    37 000 000 pour ms (un seul de ses sites alors que media­me­trie agrège les domaines)
    Il y’a pas de magie.
    Ça marche pas pour Page Jaune mais est-ce vrai­ment ces acteurs hégé­mo­niques qui ont besoin d’un moteur ?

    Et puis quel rap­port au fond avec ma dis­cus­sion sur le dupli­cate content. Dès que je parle de google on ramène le débat sur moi. Quel rap­port fran­che­ment ? Ok j’ai gagné des tunes avec ça… c’est ça qui vous emmerde ?

    En bri­co­lant coZop j’espère un jour trou­ver une méca­nique pour faire émer­ger des papiers qui sinon n’émergeront jamais s’ils sont publiés par des blo­gueurs épiso­diques et sur des blogs iso­lés. C’est la même logique que der­rière tous les sites médias actuels. Si des solu­tions de ce type ne voient pas le jour je ne donne pas lourd de notre blogosphère.

    Et le jour où je gagne­rai des tunes avec coZop je te ferai signe.

    Si je vou­lais gagner des tunes je serai allé voir un finan­cier. J’aurais fait comme les autres… et je me refuse ce jeu.

  13. gravatar.com caizinho ip:7
    15 December 2008 @ 17:44

    je dirais 90% pour google, :)

    pour pour­suivre cette dis­cu­tion digne t’ intêr­rer, je penses qu’ il ne faud pas oublié un point fon­da­men­tale qui le W3C!

    Avant toute choses, c’est le point fort du réfé­ren­ce­ment et du clas­se­ment de google.

  14. gravatar.com J ip:8
    15 December 2008 @ 20:59

    Quoi qu’il en soit, si tes craintes sont fon­dées, nous le sau­rons bien vite. Inter­net est encore ouvert, et Google n’est pas en mesure d’empêcher ce genre d’information de faire le tour du monde à vitesse grand V.

    Wait and see.

  15. gravatar.com Thierry Crouzet ip:3
    15 December 2008 @ 21:14

    Pour le dupli­cate content, je n’ai jamais dit que Google péna­li­sait. C’est une para­noïa qui s’installe sur le web. Je dis si Google fait ça, ça craint. J’espère qu’il ne le fait pas…

  16. gravatar.com caizinho ip:7
    15 December 2008 @ 21:50

    Défi­ni­tion : Dupli­cate content
    En fran­çais : Contenu dupli­qué
    Par contenu dupli­qué, on entend géné­ra­le­ment des blocs de contenu impor­tants, appar­te­nant à un même domaine ou répar­tis sur plu­sieurs domaines, qui sont iden­tiques ou sen­si­ble­ment simi­laires. À l’origine, la plu­part de ces conte­nus ne sont pas mal­veillants. (Google)

    C’est sans doute l’une des pre­mières choses que l’on apprend quand on se lance dans l’e-marketing et le réfé­ren­ce­ment : Éviter à tout prix le contenu dupli­qué.
    Cela signi­fie deux choses concrètement :

    Que les textes doivent être originaux.

    Le contenu, tou­jours le contenu, encore le contenu
    Google à tou­jours eu un mot d’ordre récu­rant : Créez du contenu unique et ori­gi­nal et votre site sera bien réfé­rencé.
    Une notion simple à com­prendre, per­pé­tuel­le­ment répété par Google (et les autres moteurs). Plus que les sanc­tions, ce sont les risques et les cas les plus cou­rants de dupli­cate que Google a déjà défini dans son Centre d’aide pour web­mas­ter : Contenu en double C’est donc confirmé, le contenu dupli­qué n’est pas syno­nyme de pénalité(s) à par­tir du moment ou cer­taines règles sont res­pec­tées :
    Ne pas créer plu­sieurs pages, sous-domaines ou domaines pré­sen­tant un contenu en double.
    Évitez les pro­grammes d’affiliation avec peu ou pas de contenu ori­gi­nal.
    Dans le cas d’une par­ti­ci­pa­tion à un pro­gramme d’affiliation, s’assurer que le site a une vrai valeur ajou­tée.
    Le contenu doit être unique et per­ti­nent pour don­ner aux uti­li­sa­teurs une rai­son de visi­ter ce site en pre­mier.
    La copie d’articles dans leurs inté­gra­li­tés (sur­tout si la source n’est pas citée et “lin­kée”) est a éviter.

    La conclu­sion de Google sur le contenu dupli­qué :
    Si Google garde quelques secrets, son dis­cours (sur le blog ou sur la docu­men­ta­tion offi­cielle) est quand même ras­su­rant au sujet du duplicate.

    -“Géné­ra­le­ment, vous n’avez pas besoin de sou­mettre une demande de réexa­men lorsque vous sup­pri­mez du contenu dupli­qué.” (sup­pres­sion des urls en double donc)

    Si vous êtes un web­mas­ter débu­tant ou confirmé, il est inutile de dépen­ser trop d’énergie à se pré­oc­cu­per de contenu en double car la plu­part des moteurs de recherche ont les moyens de faire le tri.”

    Vous pou­vez aider vos amis web­mas­ters en ne per­pé­tuant pas le mythe des sanc­tions dues au contenu dupliqué.”

  17. gravatar.com Hugues ip:9
    15 December 2008 @ 23:20

    Tu sais quoi Thierry, je suis encore entiè­re­ment Ok avec tes ana­lyses, j’en suis arrivé au même point. Une des rai­sons qui me pousse à ne plus mettre de pub Google sur mon site (70 €) par mois envi­ron , pas de quoi deve­nir mil­lion­naire…( Rires…)
    Quand au fait à ce que le contenu soit dupli­qué. (C’est un des moyens qui per­met­tra un jour à ce que la Résis­tance prenne Forme sur le net. Perso, c’est ce que je fais avec cer­tains textes ou vidéos. Essen­tiel­le­ment du Web 2 Zéro. Et j’en ai rien à foutre d’avoir mon pr qui est tombé de 4 à 3 !!! Je contourne le pro­blème, ce qui ne m’empêche pas d’avoir du monde sur mon site.
    Quant à Google, il y a un dilemne de Taille. Va t-il conti­nuer à bien nous réfé­ren­cer si nous ne jouons pas son jeu ??? Facile de répondre, s’il ne le fait pas la résis­tance face au Mamouth arri­vera encore plus vite. Faut juste être Patient et Opti­miste quant au 5ème pouoir. N’est ce pas ce que tu nous dis chaque jours… Il n’y a donc pas péril en la demeure…

    Ami­tiés ;-)

  18. gravatar.com Danger : duplicate content/Danger : Google | lespacearcenciel.com ip:10
    15 December 2008 @ 23:24

    […] les blo­gueurs et tous les éditeurs n’ont que ça à la bouche : « Sur­tout je ne veux pas que mes textes […]

  19. gravatar.com jpd ip:11
    16 December 2008 @ 0:37

    http://www.infos-du-net.com/actualite/dossiers/126-moteurs-recherche-alternatifs.html

  20. gravatar.com Equilibrium ip:12
    16 December 2008 @ 1:43

    Je ne vous éton­ne­rais pas si je dis que les enjeux dépassent de très loin ce qui peut être ici assi­mi­lable à de simple inté­rêts publi­ci­taires (on peut appe­ler ça “stra­té­gie de réfé­ren­ce­ment” si on veut mais la struc­ture autour de laquelle se basent les acteurs est quasi simi­laire, voire pour ceux qui n’en sont déjà plus là, découle direc­te­ment des inté­rêts d’annonces). Google étant en posi­tion de quasi mono­pole à des choses bien plus sur­pre­nantes en vue.

    Pour débrou­sailler un peu le ter­rain, je deman­de­rais si vous avez tous entendu par­ler d’ “algo­rithmes d’anticipation” ?

  21. gravatar.com caizinho ip:7
    16 December 2008 @ 3:01

    Contudo, o ponto de dis­tin­ção do Google é a ante­ci­pa­ção das neces­si­dades que ainda não foram expres­sas por nosso público glo­bal, e atendê-las com pro­du­tos e ser­vi­ços que defi­nem novos padrões. Essa constante insa­tis­fa­ção com o momento atual é a força motriz do mel­hor meca­nismo de pes­quisa do mundo.
    j’ ai pu lire, sur google bré­sil, je penses.
    la phy­lo­so­phie de google les 10 véritées.

  22. gravatar.com Didier ip:13
    16 December 2008 @ 7:55

    S@lut,
    Tout est fait pour iso­ler les conte­nus les uns des autres. Tout est fait pour que l’architecture mas­si­ve­ment dis­tri­buée du web devienne pyra­mi­dale. Nous sommes peut-être en train d’assister à la mort du web tel que nous l’avons connue durant les quinze pre­mières années de son his­toire. Nous ris­quons de nous rap­pe­ler d’elles comme d’un âge d’or où tout était per­mis.
    Mal­heu­reu­se­ment, pour confir­mer les craintes de Thierry (et d’autres), voici une confé­rence de Thierry Stœhr aux 8e ren­contres mon­diales du logi­ciel libre, à Amiens, le 13 juillet 2007.
    La vidéo de la confé­rence est dis­po­nible ici :
    http://www.fdn.fr/minitel.avi (durée 1h04’17, 99Mo), le sup­port de confé­rence en PDF est dis­po­nible là :
    http://www.fdn.fr/minitel.pdf
    La vidéo est cadrée sur le confé­ren­cier, le fait d’avoir le sup­port sous les yeux, dans une autre fenêtre, per­met de mieux suivre, même si ce n’est pas rigou­reu­se­ment indis­pen­sable. Par contre, le sup­port de confé­rence seul n’a aucun intérêt.

    Ré@gissons, p@rticipons…

  23. gravatar.com Laurent Bervas ip:14
    16 December 2008 @ 9:08

    @Thierry
    > Et puis quel rap­port au fond avec ma dis­cus­sion sur le dupli­cate content.
    > Dès que je parle de google on ramène le débat sur moi.
    > Quel rap­port fran­che­ment ? Ok j’ai gagné des tunes avec ça…
    > c’est ça qui vous emmerde ?

    je te fai­sais remarque qu’à par­tir de ton cas per­son­nel :
    déclas­se­ment de CoZop par google tu déve­lop­pais un rai­son­ne­ment qui était “faible” :
    1) La péna­li­sa­tion aveugle du “dupli­cat content” n’est pas prou­vée
    2) La dépen­dance à 80% a Google n’est pas prouvée

    En revanche le sujet de l’hégémonie de Google et de la mise en place d’un contre pou­voir est une bonne ques­tion … à condi­tion de le com­men­cer sur de bonnes bases.

    take care :-)

  24. gravatar.com Thierry Crouzet ip:3
    16 December 2008 @ 9:27

    1/ coZop n’a pas été déclassé (je ne sais pas ce que ça veut dire d’ailleurs pour un site comme coZop car on se pro­si­tionne sur aucun mot clé en par­ti­cu­lier… on a juste perdu en nombre pages réfé­ren­cées, mais rien de gigan­tesque).
    2/ J’ai parlé de ça parce que tous les éditeurs en parlent et s’inquiètent.
    3/ 80% Google n’est pas prouvé mais pas loin de la vérité si on prend l’ensemble du tra­fic web (juste parce que les gens se servent main­te­nant de Google comme page d’accueil et n’utilisent plus la barre d’adresses).

  25. gravatar.com Un passant ip:15
    16 December 2008 @ 9:43

    Que lorsque-vous reco­piez mot pour mot un contenu (prin­cipe de coZop) Google pré­fère mettre l’original dans ses résul­tat plu­tôt que la copie? Cela me parait plus que logique, non?”

    assez d’accord avec ça.

    Google ne devrait pas ren­voyer vers Cozop ou Wikio, mais vers l’article source.

    Et des sites comme wikio ou cozop devraient gagner leurs lec­teurs en fai­sant un vrai tra­vail d’éditorialisation.

    On irait spon­ta­né­ment voir wikio ou cozop pour retrou­ver un ensemble d’articles ordon­nés de telle façon, pour une revue du Web en somme.

    Google est en train de modi­fier sa métho­do­lo­gie, et pas mal de choses vont chan­ger je pense suite à cela. Les vieilles cer­ti­tudes sur le réfé­ren­ce­ment vont en prendre un coup, et les sites créés pour four­nir du contenu auto­ma­tique à Google, sans tri qua­li­ta­tif ni valeur ajou­tée, vont tomber.

    Où part le tra­fic qui ne vient plus chez nous ?”

    Peut-être sur les sites médias. Le Post grimpe en flèche, par exemple.

    A noter que les sites médias ont for­te­ment amé­lioré leur réfé­ren­ce­ment, font moins de liens externes (ou uti­lisent sou­vent le nofol­low, notam­ment pour le groupe Le Monde, Le Post etc).

  26. gravatar.com Thierry Crouzet ip:3
    16 December 2008 @ 9:59

    Je suis d’accord pour le tra­fic aille à la source.

    C’est pour ça que le lien vers l’article source est indis­pen­sable (ce qu’on fait sur coZop en dur).

    Et c’est pour ça que la peur du dupli­cate content est infon­dée j’espère. Si Google est hon­nête et fait bien son tra­vail, il doit auto­ri­ser la dupli­ca­tion, et tou­jours favo­ri­ser la source. Mais sans inter­dire la réédi­tion, ni spé­cia­le­ment la péna­li­ser, car la réédi­tion est sou­vent pour un auteur une occa­sion de plus d’exister.

    Mais qu’on soit aujourd’hui obligé de mettre par­tout des nofol­low me paraît une aber­ra­tion impo­sée par google et qui va à l’encontre de l’idée même du web, le lien.

  27. gravatar.com Un passant ip:15
    16 December 2008 @ 10:19

    Le nofol­low sys­té­ma­tique du groupe Le Monde est scan­da­leux en effet.

    Un mec comme Pisani par exemple, qui a priori serait un bon orien­ta­teur qua­li­ta­tif, avec des liens per­ti­nents, n’existe plus dans ce rôle, tous ses liens étant en nofol­low, comme tous les blogs du Monde.

    Je serais favo­rable à des mesures de rétor­sion: ne plus faire de liens actifs vers Le Monde, les blogs du Monde, et le Post: cas­ser les liens, ou les faire en nofol­low également.

  28. gravatar.com Thierry Crouzet ip:3
    16 December 2008 @ 10:44

    Au final tout le monde met­tra des nofol­low et tous les sites vont se retrou­ver iso­lés, tout ça pour rendre Google encore plus puissant.

  29. gravatar.com Didier ip:16
    16 December 2008 @ 10:51

    Par rap­port au fait que “80% des gens utilsent Google comme page d’accueil”, perso j’utilise Net­vibes en boot-page avec l’affichage des flux RSS de mes sites réfé­rences en terme d’actu (bien évidem­ment ce blog en fait par­tie). Pour les recherche je me sers de la barre de recherche de Hoo­seek ( http://www.hooseek.com/ ) qui a récem­ment retiré Google de la recherche web ( http://www.hooseek.com/blog.php?2008/12/04/33-retrait-de-la-recherche-google-web ), les rares fois ou le résul­tat de cette recherche n’est pas per­ti­nent, j’utilise Gogole :-p

  30. gravatar.com Un passant ip:15
    16 December 2008 @ 11:03

    En même temps il y a un bon côté à apprendre à se pas­ser de Google.

    Repen­ser qualité.

    Repen­ser lec­teurs: que cherchent-ils ? Que peut-on leur apporter ?

    Le sys­tème Google était devenu com­plè­te­ment débile: il fal­lait accu­mu­ler des mots clés & du réfé­ren­ce­ment, et peu impor­tait que le lec­teur reparte en une seconde, déçu du contenu.

    Cela aussi, c’était la mort du Web. Pas d’avenir.

    Il faut repen­ser éditorialisation.

    C’est beau­coup plus satis­fai­sant d’être un éditeur de contenu, de faire un choix qua­li­ta­tif, et d’attirer des lec­teurs direc­te­ment pour la qua­lité du contenu, plu­tôt que d’avoir des mil­liers de types qui passent pour un mot clé motorisé.

    On a un peu vite annoncé la mort des Une. Et si le lec­teur reve­nait au plai­sir de décou­vrir une Une, lui pré­sen­tant un contenu choisi, le plai­sir de la décou­verte de l’inconnu ? Plu­tôt que d’arriver uni­que­ment sur ce qu’on cherche via un moteur.

    Plu­tôt que d’accumuler 100000 articles à des­ti­na­tion des moteurs, un site pour­rait ne pro­po­ser qu’un petit nombre de sujets, mais tel­le­ment bien choi­sis qu’un plus grand nombre de gens vien­drait spontanément.

    Moins tra­vailler le réfé­ren­ce­ment, et mieux tra­vailler la répu­ta­tion qua­li­ta­tive via les réseaux.

  31. gravatar.com Thierry Crouzet ip:3
    16 December 2008 @ 11:12

    C’est vers là qu’il faut aller.

    Sur ce blog j’ai jamais cher­ché à atti­rer du monde au hasard.

    Sur coZop j’espère qu’on trou­vera un algo qui réus­sira à faire remon­ter les articles inté­res­sants… et à construire de véri­tables unes pour les uti­li­sa­teurs (ce qui n’est pas le cas aujourd’hui).

    On a une approche techno/sociale , là ou d’autres comme Nico Voi­sin cherchent à faire du manuel. Ces approches sont pas anta­go­nistes, trop de choses s’écrivent pour croire que des humains auront la puis­sances de les trier toutes. Nous avons aussi besoin de l’intelligence des machines.

  32. gravatar.com caizinho ip:7
    16 December 2008 @ 11:16

    Notre moteur de recherche du futur com­mence déjà à poin­ter le bout de son nez. Les recherches en lan­gage natu­rel com­mencent à deve­nir une réa­lité, les sys­tèmes de questions/réponses comme Yahoo ans­wer se mul­ti­plient et alors que le grand public n’a pas encore conscience de ce que sera le web séman­tique, Google et Micro­soft font déjà des rachats de star­tups pré­sen­tant ces nou­velles technologies.

  33. gravatar.com Un passant ip:15
    16 December 2008 @ 11:34

    Ce qui man­quait aux blogs, c’était les réseaux sociaux.

    Pour se faire connaître, il n’y avait que le réfé­ren­ce­ment, Google et les blo­grolls sur quelques sites amis.

    Main­te­nant ça a changé avec les réseaux comme MyS­pace et Facebook.

    Sur cer­tains sujets dont le contenu est per­ti­nent, on peut rece­voir davan­tage de visites en pro­ve­nance de groupes MyS­pace et Face­book, qu’en pro­ve­nance de Google.

    (MyS­pace et Face­book sont par ailleurs en nofol­low, donc n’ont pas d’incidence sur Google.
    Il y a un vrai monde paral­lèle à Google qui est en train de se créer, avec un “recru­te­ment” de lec­teurs qui ne passent plus par lui.)

  34. gravatar.com Thierry Crouzet ip:3
    16 December 2008 @ 11:43

    Perso… je ne vais plus sur face­book car ça me gonfle, la com­mu­nauté ici sur le blog et celle des gens que je ren­contre in vivo suf­fisent à me stimuler.

    Mes billets sont repu­bliés sur mon pro­fil face­book et je n’ai aucune idée s’ils sont lus là-bas ou non. Je n’ai pas le temps pour recru­ter des lec­teurs. C’est le tra­vail de mon éditeur. :-)

    On ne peut pas tout faire…

  35. gravatar.com Un passant ip:15
    16 December 2008 @ 11:47

    Pour Face­book il faut sup­pri­mer toutes les applications.

    Cela rede­vient vivable après.

  36. gravatar.com Didier ip:17
    16 December 2008 @ 11:51

    @ un pas­sant :
    Parce que tu crois que les réseaux sociaux à la sauce Face­book ou Mys­pace vont contre la cen­tra­li­sa­tion des réseaux et donc vont aider à orga­ni­ser la résis­tance à Google? Si cela se fait ce sera uni­que­ment dans un concur­ren­tiel, l’enjeu est la connais­sance par­faite des inter­nautes afin de leur four­nir un contenu publi­ci­taire méga-ciblé et e but ultime et de retrou­ver en posi­tion de mono­pole incour­tour­nable façon Google ou Micro$oft.
    Si l’on veut réel­le­ment s’affranchir de ces dérives, il nous faut deve­nir des arti­sans (ou des cyber-@cteurs) de nos conte­nus édito­riaux comme Thierry l’explique ici (http://blog.tcrouzet.com/2008/12/06/decentraliser-le-capital/ ).

    P.S : Tu devrais chan­ger de pseudo car pour un pas­sant tu ès là plus sou­vent que Thierry :-)

  37. gravatar.com Un passant ip:15
    16 December 2008 @ 12:10

    vont contre la cen­tra­li­sa­tion des réseaux”

    ça c’est un autre débat.

    Je constate juste qu’un blog peut désor­mais rece­voir plu­sieurs mil­liers de visites par jour en pro­ve­nance de MyS­pace et Facebook.

    Donc ne plus dépendre uni­que­ment de Google.

    Mais cela impose d’avoir un contenu qua­li­ta­tif. C’est le bouche à oreille qua­li­ta­tif qui amène des visites en pro­ve­nance des réseaux sociaux. Un fonc­tion­ne­ment très dif­fé­rent des mots clés Google.

  38. gravatar.com Thierry Crouzet ip:3
    16 December 2008 @ 12:21

    C’est bon si tu parles des star­lettes et de bran­lettes… un peu comme sur Google non ? T’es pas obligé d’utiliser les tags à la mode mais au fond n’est-ce pas les mêmes sujets qui font des hits ?

  39. gravatar.com Henri A ip:18
    16 December 2008 @ 12:30

    De toutes les façons, les jours du Pas­sant sont comp­tés, je lui ai mis un contrat des­sus pour blas­phème illogique.

  40. gravatar.com Un passant ip:15
    16 December 2008 @ 12:38

    Tu retombes natu­rel­le­ment sur le pro­blème éter­nel : qu’est-ce qui inté­resse le public ? C’est sou­vent les conne­ries à la mode.

    Mais si tu as tra­vaillé un réseau de niche, tu peux avoir des visites plus intéressantes.

    Per­son­nel­le­ment j’ai expé­ri­menté un grand nombre de visites en pro­ve­nance de mys­pace sur des sujets plu­tôt pointus:

    opéra, musique baroque…

    Tu deviens le direc­teur de pro­gramme d’une com­mu­nauté, qui s’agrandit par bouche à oreille.

    (Bien plus qu’avec l’ancien sys­tème des blo­grolls, parce qu’il y a bcp plus de monde sur mys­pace et face­book, qu’il n’y avait de lec­teurs de blogs).

  41. gravatar.com Didier ip:19
    16 December 2008 @ 12:42

    @ Un Pas­sant (encore…)
    En fait tout le débat porte sur la cen­tra­li­sa­tion (par Google, et autres fesses de bouc) d’internet.
    Thierry l’explique bien quand il dit, entre autres : “Tout est fait pour iso­ler les conte­nus les uns des autres. Tout est fait pour que l’architecture mas­si­ve­ment dis­tri­buée du web devienne pyra­mi­dale.
    De mon point de vue c’est toi qui est hors-sujet (par igno­rance du sujet ou par mau­vaise foi chro­nique) quand tu pro­poses des outils comme Mys­pace pour contrer cette ten­ta­tive des pompes à fric de deve­nir les grands cen­tra­li­sa­teurs du web.
    La solu­tion serait très cer­tai­ne­ment proche de ce qu’évoque Manuel Vila ( http://blog.tcrouzet.com/2008/12/15/danger-duplicate-content-danger-google/#comment-62445 ) : ” Repen­ser le web en géné­ra­li­sant les prin­cipes décen­tra­li­sa­teurs qui ont fait la force du réseau TCP/IP sur lequel il repose.”.

  42. gravatar.com Un passant ip:15
    16 December 2008 @ 12:54

    c’est toi qui est hors-sujet”

    Il y a deux sujets:

    1 : la dépen­dance vis à vis d’un acteur unique : Google
    = pro­blème du monopole

    2 : la dépen­dance vis à vis d’un sys­tème de cen­tra­li­sa­tion : et alors tu as rai­son de ne pas faire de dif­fé­rence entre Google, MyS­pace et Facebook.

    Mais le point 1 est important.

    C’est très dif­fé­rent de dépendre d’un seul four­nis­seur d’accès comme Google, ou de dépendre de 3 four­nis­seurs d’accès : Google, MyS­pace, Face­book.
    Même si tous les 3 sont centralisés.

    Si tu dépends entiè­re­ment de Google, tu peux tout perdre d’un coup, comme Thierry avec Bonweb.

    On a donc inté­rêt à avoir plu­sieurs acteurs cen­traux : Google, Micro­soft, Face­book, Myspace…

    La lutte contre tous les grands groupes étant une autre affaire, dis­tincte de la lutte contre le mono­pole d’un seul acteur.

  43. gravatar.com Thierry Crouzet ip:3
    16 December 2008 @ 14:01

    Un début de dis­cus­sion ailleurs
    http://carnets.opossum.ca/mario/archives/2008/12/google_duplicate_content.html

    Ma réponse… qui pro­longe le débat ici.

    Dire que la nature déteste la dupli­ca­tion c’est un peu étrange non? Il y a une cen­taine d’atomes dif­fé­rents pour construire tout le reste.

    C’est la même chose dans le domaine bio­lo­gique où cer­taines séquences se retrouvent partout.

    Mon exemple des droits de l’homme me paraît per­ti­nent. Ne faut-il pas les dupli­quer ? Je crois que si… c’est le prin­cipe des tracts qu’on colle par­tout. Plus des textes sont dupli­qués, plus ils ont de chances de trou­ver des lecteurs.

    Je n’ai pas dit que Google péna­li­sait les dupli­cate content, j’ai dit que chez les éditeurs il y avait une para­noïa à ce sujet. J’espère qu’elle est injustifiée.

    D’ailleurs mon billet sur le dupli­cate content a été repu­blié par coZop et cette ver­sion du texte sort en pre­mier si je lance sur Google une requête avec le water­mark placé à la fin du texte. C’est la preuve que Google n’a pas péna­lisé coZop pour avoir repris mon texte.

    Google sait en plus que j’en suis l’auteur car il avait ini­tia­le­ment détecté ce texte chez moi et que chez coZop un lien pointe vers le billet ori­gi­nal. On peut peut-être repro­cher à Google de ne pas favo­ri­ser la source. Pour Moi ce qui compte c’est que mon texte trouve des lec­teurs. Dans une logique finan­cière, on pour­rait accu­ser coZop de voler du tra­fic. Mais coZop rému­nère les textes et offre des stats détaillées (donc que le tra­fic soit généré ici ou là m’importe peu… je me moque qu’on lise mes livres dans son lit, sur ses toi­lettes, dans un café…).

    Cette expé­rience semble donc prou­ver que Google ne péna­lise pas les dupli­cates et que c’est avant tout une paranoïa.

    J’espère que c’est le cas et que ça le res­tera. Car il me semble de notre devoir de dupli­quer les choses qui nous paraissent impor­tantes, tou­jours en res­pec­tant leur auteur.

    PS : en réponse Michael Car­pen­tier pointe vers un papier où Google confirme ne pas péna­li­ser : http://www.michaelcarpentier.com/index.php/2008/pour-en-finir-avec-les-supposees-penalites-pour-contenu-duplique/

  44. gravatar.com BGR ip:20
    20 December 2008 @ 15:26

    Pas sûr que les chaînes soient ta tasse de thé, mais celle-ci per­met de don­ner un éclai­rage inté­res­sant sur le Mou­ve­ment Démo­crate que tu as fré­quenté à Seignosse :

    http://bgr.hautetfort.com/archive/2008/12/20/chaine-du-modem1.html

  45. gravatar.com Thierry Crouzet ip:21
    20 December 2008 @ 17:47

    J’ai peu d’espoir concer­nant le Modem… car Bay­rou ne pense que pyra­mi­dal, il ne pense qu’à lui et nous avons besoin d’autres choses à l’échelle fran­çaise comme planétaire.

  46. gravatar.com Encre de Lune ip:22
    5 February 2009 @ 16:25

    La phi­lo­so­phie de coZop…

    Cozop et le dupli­cate content, suite. Réponse sur leur blog, à laquelle je réponds ici : la phi­lo­so­phie est une chose, mais tech­ni­que­ment, cela ne change rien aux risques et aux consé­quences du dupli­cate content.
    .…..

Commenter “Danger : duplicate content / Danger : Google”




Titre (facultatif)

L'alternative nomade
télécharger / acheter
Vers une complexité volontaire.

Propulseurs dans le flux
télécharger / acheter
Nous sommes tous des pousseurs d'informations.

J’ai eu l’idée
télécharger / acheter
« Du sérieux, du pro­fond, du léger, du comique… » Henri Alberti

Croisade
télécharger / acheter
Un techno-thriller dont vous pourriez être la victime.

Genius locus
télécharger / acheter
Polar écolo-minimaliste.