Retour sur SEO Camp Day Lille Mars 2016 – Partie 1

Laisser un commentaire
Pas de commentaire

C’est le 4/03 dernier que s’est déroulé le Seocamp à Lille, pour la troisième édition, toujours dans un endroit d’exception. Cette année, c’est le salon Châtillon – Espace Inkermann.

Après un petit-déjeuner d’accueil, direction le premier étage pour une journée de conférences sur le thème du Seo. Mais avant tout, une petite introduction du président nous attend, suivie d’un rappel sur la certification CESEO nouvelle formule : une série de 100 questions mise à jour régulièrement permettra aux candidats d’obtenir la certification. Pour plus de renseignements, je vous invite à vous rendre sur le site de l’association à cette adresse.

Entrons maintenant dans le vif du sujet avec la première conférence de Vincent Terrasi et de Thibault Willerval  sur l’optimisation de vos outils Seo avec R.

Optimisation de vos outils SEO avec R

Cette conférence, bien que la première de la journée, a été pour moi la plus intéressante, les deux intervenants utilisant au quotidien l’outil pour le groupe M6 et CuisineAz, filiale du groupe.

La technologie R permet la gestion plus rapide de gros datas, et vous permettra en quelques lignes de code d’obtenir des résultats sous la forme de votre choix, aussi bien en tableau comme le ferait Excel mais sans le plantage qui va avec, ou bien sous forme de graphique.

Doté d’une interface simple, R permet d’obtenir rapidement des rapports de votre analytics de manière automatique. Plusieurs outils permettent ces exports, ils répondent au nom de Query Explorer pour analytics, Shiny pour du développement dynamique, il est possible de créer simplement des rapports en filtrant les différentes informations et même de supprimer les bruits en quelques minutes.

R est fourni avec des centaines de packs et je ne pourrais pas détailler toutes les possibilités, mais pour vous donner un véritable aperçu de l’outil mais aussi de la conférence, Vincent Terrassi vous propose de suivre sa présentation sur https://youtu.be/aIwJB9vWu7M et encore plus d’infos sur data-SEO.com

Optimisation de vos outils SEO avec R

Pièges à éviter pour l’analyse sémantique

Pour cette seconde conférence c’est Antoine Brisset qui prend les rênes, il nous explique l’importance de l’analyse sémantique de nos contenus, le calcul de la densité, du n-grammes ainsi que du TF X IDF

Plusieurs niveaux différents d’analyse existent, l’analyse morpho-lexicale, l’analyse syntaxique, la sémantique, et la pragmatique.

Pour le SEO, seuls les deux premiers niveaux sont intéressants, et la procédure pour la mise en œuvre est bien hiérarchisée et s’effectue en plusieurs étapes, le passage de vos pages Html en format texte en supprimant au passage l’ensemble des balises pour ne conserver que le textes, mais attention, il faudra cependant s’assurer que les balises « script, noscript, vos styles et vos commentaires » soient elles aussi filtrées. Il faudra aussi remplacer les caractères invalides, les redirections etc…

D’autres étapes sont ensuite nécessaires, comme la tokenisation pour convertir les chaines de caractères avec encore une fois un piège qui peut fausser vos résultats, si vous ne tenez compte que des espaces dans votre texte pour vos traitements. Mais attention aussi à la ponctuation !

Pour l’élaboration de vos corpus, il faudra ensuite étiqueter vos tokens en groupe, c’est l’étiquetage morpho-syntaxique suivi de l’étape suivante de conversion des majuscules en minuscules pour le dédoublonnage de vos mots exemple Maman>maman .

Il faut ensuite rassembler les différentes formes d’un mot, on appelle cela la lemmatisation. L’objectif est la suppression des différentes formes de mots par exemple Parfums > parfum

Enfin on pense à supprimer les stop-words car ils ne servent à rien lors d’une analyse.

Pièges à éviter pour l'analyse sémantique

Quand Google parle, que peut-on lire entre les lignes?

Troisième conférencier de la matinée, avec le retour de Sebastien Monnier (président de l’asso) qui nous parle de la communication de Google, lui même ancien googler, il a toute légitimité sur le sujet.

Quelques infos tout d’abord : l’équipe de la Search Quality Team est composée de 200 personnes, et elle est basée à Dublin pour toutes les langues européennes, et en Inde pour l’anglais pour des raisons de coût apparemment (sachant que GG génère des milliards de dollars de chiffre d’affaires…).

L’équipe antispam (Webspam Team) est quant à elle basée à Mountain View, cette équipe est très peu communicante, ils développent surtout les algorithmes et supervisent les équipes de qualité des résultats.

Google utilise des moyens de communication divers comme Twitter, Youtube ou même Hangout.

Actuellement Google communique exclusivement sur le mobile, comme le démontre Sébastien Monnier avec un avant / après des communications du groupe sur le blog insight search. Google met l’accent sur le tout mobile et il est maintenant impossible de passer à coté des différentes évolutions des résultats.

Google n’annonce pas officiellement de changements dans ses guidelines concernant notamment le https, l’accessibilité des sites pour le mobile ou aux personnes handicapées mais aussi sur le nombre limité des liens sortants présents sur une seule page : pas plus de 1500 selon l’intervenant.

Depuis 2015, la chasse aux backlinks ne semble plus être une priorité pour Google, la preuve en est, la rareté des pénalités manuelles visibles dans la Search console.

Mais que fait Matt Cutts ? Là encore, pas de communication sur le sujet, est-il encore en congé (sabbatique depuis 2 ans) ou a-t-il repris le travail auprès de l’équipe anti-spam?

Un point important : le départ de Amit Singhal qui n’est autre que le fondateur de l’algo depuis les années 2000, Google c’est lui ! À présent c’est Giannandrea qui le remplace, c’est un spécialiste du Deep learning (reconnaissance vocale par exemple).

Beaucoup de tâches tendent à être automatisées, l’algo tente d’apprendre par lui-même, et à présent GG se contente de vérifier les dommages collatéraux et se concentre sur l’expérience des utilisateurs.

Credit photo @jringard sur twitter

Credit photo @jringard sur twitter

C’est la fin de la première matinée, pause déjeuner pour tout le monde et donc fin de la première partie pour moi, la seconde est à suivre rapidement.

Article publié par JIMENEZ Julien (Korleon) :


Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.
Les commentaires sont fermés après 15 jours.