Accueil > Blog > Comment Fonctionne l’Algorithme de X / Twitter ?
algorithme recommandation twitter

Comment Fonctionne l’Algorithme de X / Twitter ?

Comment fonctionne l’algorithme de X / Twitter ? Comment Twitter (renommĂ© X par Elon Musk) priorise les tweets ayant accĂšs Ă  la Timeline de chaque utilisateur ? Quels sont les critĂšres et facteurs de classement des tweets ? Comment l’algorithme de X / Twitter pondĂšre les signaux d’engagement pour donner de la visibilitĂ© (ou non) Ă  votre compte ? Elon Musk l’avait annoncĂ© : X / Twitter a rĂ©vĂ©lĂ© son code source et notamment sa partie algorithme avec Ă  la clĂ© une vue inĂ©dite sur ce qui permet Ă  un tweet d’obtenir du reach ou non. Autant de tactiques et bonnes pratiques Ă  appliquer par vous.

Note de Rudy : Si vous ĂȘtes expert en marketing, vous pouvez proposer vos articles en me contactant sur la page dĂ©diĂ©e.
Avant de dĂ©buter votre tutoriel, rĂ©cupĂ©rez mon systĂšme et mes stratĂ©gies pour gĂ©nĂ©rer +100 000 visiteurs et des 100aines de prospects et clients chaque mois : Entrez dĂšs maintenant dans mon programme Trafic & Clients si vous voulez passer un cap rapidement (accĂšs Ă  vie Ă  mes formations + accompagnement). Testez enfin les outils que j'utilise pour ajouter des 1000iers d'abonnĂ©s emails Ă  ma newsletter chaque mois et gĂ©nĂ©rer des 100aines de rendez-vous clients par tĂ©lĂ©phone : - Mon outil de collecte d'emails [Paiement en 1x au lieu de l'abonnement] - Mon outil de crĂ©ation de page [14 jours d’essai gratuits] - Mon outil d'email automation [14 jours d’essai gratuits + offres] - Mon outil de cold email [Paiement en 1x au lieu de l'abonnement] - Mon outil de rĂ©fĂ©rencement / SEO [14 jours d’essai gratuits] - Mon outil de paiement [Paiement en 1x au lieu de l'abonnement]

L’algorithme de X / Twitter : fonctionnement et historique


A l’origine des rĂ©seaux sociaux, le nombre de compte ou amis que chaque utilisateur suivait Ă©tait relativement limitĂ©, l’usage de Facebook ou Twitter en Ă©tant Ă  ses balbutiements.

La valeur d’un rĂ©seau Ă©tant « égale au nombre de ses noeuds Ă  la puissance 2 », l’augmentation du nombre de connexions a permis la dĂ©multiplication du nombre de publications circulant sur ces rĂ©seaux.

  • Si vous ĂȘtes seul Ă  disposer d’un smartphone, vous n’appellerez personne (logique).
  • Si vous ĂȘtes deux Ă  disposer d’un smartphone, vous appellerez rĂ©guliĂšrement votre ami.
  • Si 90% de vos proches disposent disposent d’un smartphone, il devient un outil central de communication (et potentiellement de votre vie).

L’explosion du nombre de contenus et de posts publiĂ©s chaque jour sur Facebook, Twitter ou Instagram a nĂ©cessitĂ© de repenser l’organisation des fils d’actualitĂ© pour 4 raisons :

  1. DĂ©livrer une expĂ©rience personnalisĂ©e Ă  chaque utilisateur en poussant les thĂšmes, contenus et comptes qu’il apprĂ©cie.
  2. Donner plus d’écho aux « meilleures » publications pour augmenter le temps passĂ© sur la plateforme (et augmenter les revenus publicitaires).
  3. En miroir, rendre silencieux les contenus non désirés (selon les priorités de chaque plateforme).
  4. Laisser de la place à la publicité (et donner une bonne raison aux annonceurs de payer pour obtenir de la visibilité).

A ce titre, Twitter a longtemps rĂ©sistĂ© Ă  l’appel des algorithme en conservant son classement purement chronologique qui Ă©tait l’ADN de la plateforme Ă  ses dĂ©buts (preuve que la mise en place d’algorithmes de classement par l’engagement n’était pas un chemin obligatoire) mais, non sans scandale, les algorithmes ont commencĂ© Ă  pondĂ©rer l’apparition ou non des tweets dans vos fils d’actualitĂ©.

Cette modification date sauf erreur de ma part de 2016 avec l’apparition d’une option « Show me the best tweets first » qui laissait alors la main Ă  l’utilisateur entre l’ordre chronologie et un classement algorithmique. Jusqu’à Ă©videmment l’extension de cette fonction Ă  l’ensemble des tweets.

Globalement, ce que l’on savait sans forcĂ©ment avoir de donnĂ©es sur ces facteurs de classement :

  1. L’engagement sur vos tweets impacte votre portĂ©e (votre reach en anglais donc la portĂ©e de vos publications).
  2. La visibilité de vos tweets démarre par votre premier cercle (vos followers les plus actifs).
  3. Si vous ne passez pas les filtres, vos tweets ne sont pas diffusés (ou peu diffusés).
  4. Si vous passez votre premier cercle avec un fort engagement, votre tweet pourra ĂȘtre diffusĂ© Ă  de nouveaux utilisateurs.
  5. Jusqu’à lentement mourir et que de nouveaux tweets plus engageants viennent prendre la place de votre contenu.

Plongeons maintenant dans les nouvelles donnĂ©es officielles et/ou issues directement de l’étude du code pour confirmer ou infirmer ce feeling.

L’algorithme de recommandation de X / Twitter

Regardons d’abord ce que l’on apprend du cĂŽtĂ© de l’annonce officielle de X / Twitter (nous verrons ensuite ce que l’analyse du code source montre de nouveau et que vous ne trouverez pas dans le communiquĂ© officiel).

Je vous donne en français de ce communiqué publié sur le blog de X :

X / Twitter vise Ă  vous offrir le meilleur de ce qui se passe dans le monde en ce moment. Cela nĂ©cessite un algorithme de recommandation pour distiller les environ 500 millions de Tweets publiĂ©s quotidiennement jusqu’à une poignĂ©e de Tweets les plus importants qui apparaissent finalement sur la chronologie « Pour vous » de votre appareil.

Comment choisissons-nous les Tweets ?

La base des recommandations de X / Twitter repose sur un ensemble de modĂšles et de fonctionnalitĂ©s essentiels qui extraient des informations latentes Ă  partir des donnĂ©es de Tweet, d’utilisateur et d’engagement.

Ces modĂšles visent Ă  rĂ©pondre Ă  des questions importantes concernant le rĂ©seau X, telles que : « Quelle est la probabilitĂ© que vous interagissiez avec un autre utilisateur Ă  l’avenir ? » ou « Quelles sont les communautĂ©s sur X et quels sont les Tweets tendances au sein de celles-ci ? ». RĂ©pondre Ă  ces questions avec prĂ©cision permet Ă  X de proposer des recommandations plus pertinentes.

Le pipeline de recommandation est composé de trois étapes principales qui utilisent ces fonctionnalités :

  1. Récupérer les meilleurs Tweets provenant de différentes sources de recommandation dans un processus appelé « sourcing des candidats ».
  2. Classer chaque Tweet à l’aide d’un modùle d’apprentissage automatique.
  3. Appliquer des heuristiques et des filtres, tels que la suppression des Tweets provenant des utilisateurs que vous avez bloqués, des contenus inappropriés et des Tweets que vous avez déjà vus.

Le service responsable de la construction et de la diffusion de la chronologie « Pour vous » s’appelle Home Mixer. Home Mixer est basĂ© sur Product Mixer, notre framework Scala personnalisĂ© qui facilite la crĂ©ation de flux de contenu. Ce service agit comme la colonne vertĂ©brale logicielle qui relie diffĂ©rentes sources de candidats, fonctions de notation, heuristiques et filtres.

Le schéma ci-dessous illustre les principaux composants utilisés pour construire une chronologie :

Explorons les principales parties de ce systĂšme, dans l’ordre approximatif dans lequel elles seraient appelĂ©es lors d’une seule demande de chronologie, en commençant par la rĂ©cupĂ©ration des candidats Ă  partir des sources de candidats.

Sources de candidats

X / Twitter dispose de plusieurs sources de candidats que nous utilisons pour rĂ©cupĂ©rer des Tweets rĂ©cents et pertinents pour un utilisateur. Pour chaque demande, nous essayons d’extraire les 1500 meilleurs Tweets d’un ensemble de plusieurs centaines de millions grĂące Ă  ces sources. Nous trouvons des candidats parmi les personnes que vous suivez (« In-Network ») et parmi les personnes que vous ne suivez pas (« Out-of-Network »).

Aujourd’hui, la chronologie « Pour vous » (« For you ») se compose en moyenne de 50% de Tweets « dans le rĂ©seau » et de 50% de Tweets « hors du rĂ©seau », bien que cela puisse varier d’un utilisateur Ă  l’autre.

In-Network Source (sources « dans le réseau »)

La source « dans le rĂ©seau » est la plus grande source de candidats et vise Ă  fournir les Tweets les plus pertinents et rĂ©cents des utilisateurs que vous suivez. Elle classe efficacement les Tweets de ceux que vous suivez en fonction de leur pertinence Ă  l’aide d’un modĂšle de rĂ©gression logistique. Les meilleurs Tweets sont ensuite envoyĂ©s Ă  l’étape suivante.

Le composant le plus important dans le classement des Tweets « dans le rĂ©seau » est Real Graph. Real Graph est un modĂšle qui prĂ©dit la probabilitĂ© d’engagement entre deux utilisateurs. Plus le score Real Graph entre vous et l’auteur du Tweet est Ă©levĂ©, plus nous inclurons leurs tweets.

La source « dans le rĂ©seau » a fait l’objet de travaux rĂ©cents chez X. Nous avons rĂ©cemment cessĂ© d’utiliser Fanout Service, un service de 12 ans qui Ă©tait auparavant utilisĂ© pour fournir des Tweets « dans le rĂ©seau » Ă  partir d’un cache de Tweets pour chaque utilisateur. Nous sommes Ă©galement en train de repenser le modĂšle de classement par rĂ©gression logistique qui a Ă©tĂ© mis Ă  jour et entraĂźnĂ© pour la derniĂšre fois il y a plusieurs annĂ©es !

Out-of-Network Sources (sources « hors du réseau »)

Trouver des Tweets pertinents en dehors du rĂ©seau d’un utilisateur est un problĂšme plus dĂ©licat : comment pouvons-nous savoir si un certain Tweet vous sera pertinent si vous ne suivez pas l’auteur ? X adopte deux approches pour rĂ©soudre ce problĂšme.

Graph social

Notre premiĂšre approche consiste Ă  estimer ce que vous trouveriez pertinent en analysant les engagements des personnes que vous suivez ou de celles ayant des intĂ©rĂȘts similaires.

Nous parcourons le graphe des engagements et des abonnements pour répondre aux questions suivantes :

Quels Tweets les personnes que je suis ont-elles récemment appréciés ?
Qui aime des Tweets similaires Ă  moi, et qu’ont-ils rĂ©cemment aimĂ© d’autre ?

Nous gĂ©nĂ©rons des Tweets candidats en fonction des rĂ©ponses Ă  ces questions et classons les Tweets rĂ©sultants Ă  l’aide d’un modĂšle de rĂ©gression logistique. Les parcours de graphes de ce type sont essentiels Ă  nos recommandations « hors du rĂ©seau ». Nous avons dĂ©veloppĂ© GraphJet, un moteur de traitement de graphes qui maintient un graphe d’interaction en temps rĂ©el entre les utilisateurs et les Tweets, pour exĂ©cuter ces parcours. Bien que ces heuristiques pour rechercher le rĂ©seau d’engagement et de suivi

Nous pouvons intĂ©grer des Tweets dans ces communautĂ©s en examinant la popularitĂ© actuelle d’un Tweet dans chaque communautĂ©. Plus les utilisateurs d’une communautĂ© aiment un Tweet, plus ce Tweet sera associĂ© Ă  cette communautĂ©.

Classement

L’objectif de la chronologie « Pour vous » est de vous proposer des Tweets pertinents. À ce stade du pipeline, nous avons environ 1500 candidats qui pourraient ĂȘtre pertinents. Le score prĂ©dit directement la pertinence de chaque Tweet candidat et constitue le principal signal de classement des Tweets sur votre chronologie. À cette Ă©tape, tous les candidats sont traitĂ©s de maniĂšre Ă©gale, sans tenir compte de la source du candidat d’origine.

Le classement est obtenu avec un rĂ©seau neuronal d’environ 48 millions de paramĂštres qui est continuellement entraĂźnĂ© sur les interactions de Tweets pour optimiser l’engagement positif (par exemple, les mentions J’aime, les Retweets et les RĂ©ponses). Ce mĂ©canisme de classement prend en compte des milliers de caractĂ©ristiques et gĂ©nĂšre dix Ă©tiquettes pour attribuer un score Ă  chaque Tweet, chaque Ă©tiquette reprĂ©sentant la probabilitĂ© d’un engagement. Nous classons les Tweets Ă  partir de ces scores.

Heuristiques, filtres et fonctionnalités du produit

AprĂšs l’étape de classement, nous appliquons des heuristiques et des filtres pour mettre en Ɠuvre diverses fonctionnalitĂ©s du produit. Ces fonctionnalitĂ©s fonctionnent ensemble pour crĂ©er un flux Ă©quilibrĂ© et diversifiĂ©.

Voici quelques exemples :

– Filtrage de visibilitĂ© : Filtrer les Tweets en fonction de leur contenu et de vos prĂ©fĂ©rences. Par exemple, supprimer les Tweets des comptes que vous bloquez ou mettez en sourdine.
– DiversitĂ© des auteurs : Éviter trop de Tweets consĂ©cutifs d’un seul auteur.
– Équilibre du contenu : Veiller Ă  ce que nous offrions un Ă©quilibre Ă©quitable entre les Tweets du rĂ©seau et hors rĂ©seau.
– Fatigue basĂ©e sur les commentaires : Diminuer le score de certains Tweets si l’utilisateur a fourni un retour nĂ©gatif Ă  leur sujet.
– Preuve sociale : Exclure les Tweets hors rĂ©seau sans connexion au deuxiĂšme degrĂ© avec le Tweet comme mesure de qualitĂ©. En d’autres termes, s’assurer que quelqu’un que vous suivez a interagi avec le Tweet ou suit l’auteur du Tweet.
– Conversations : Fournir plus de contexte Ă  une rĂ©ponse en la reliant au Tweet original.
– Tweets modifiĂ©s : DĂ©terminer si les Tweets actuellement sur un appareil sont obsolĂštes et envoyer des instructions pour les remplacer par les versions modifiĂ©es.

Mélange et diffusion

À ce stade, Home Mixer a un ensemble de Tweets prĂȘts Ă  ĂȘtre envoyĂ©s Ă  votre appareil. Dans la derniĂšre Ă©tape du processus, le systĂšme mĂ©lange les Tweets avec d’autres contenus non-Tweet tels que les publicitĂ©s, les recommandations de suivi et les invites d’intĂ©gration, qui sont renvoyĂ©s Ă  votre appareil pour ĂȘtre affichĂ©s.

Le pipeline ci-dessus fonctionne environ 5 milliards de fois par jour et se termine en moins de 1,5 seconde en moyenne. Une seule exĂ©cution du pipeline nĂ©cessite 220 secondes de temps CPU, soit prĂšs de 150 fois la latence que vous percevez sur l’application.

Analyse du code source de X / Twitter et bonnes pratiques

Le post de X / Twitter est en soi extrĂȘmement intĂ©ressant en tant qu’il donne une vue de l’intĂ©rieur de l’algo de X expliquĂ© par X.

Mais vu que le code source est maintenant disponible en accĂšs libre en ligne (ici et ici), nous pouvons Ă©galement l’étudier avec un Ɠil neutre.

Je ne suis pas dĂ©veloppeur (mĂȘme si j’aurais pu utiliser ChatGPT pour m’expliquer le code) mais plusieurs utilisateurs de X (notamment @aakashg0, @steventey ou encore nft_god entre autres) ont fait le job et voici ce qu’ils ont dĂ©couvert :

1. L’impact des J’aime / Likes, Retweets & RĂ©ponses / Replies

X dĂ©termine votre influence dans le rĂ©seau en analysant un ensemble de facteurs et vous assigne un score appelĂ© « Tweepcred ». Ce score impacte ensuite le score individuels de vos tweets (donc si Elon Musk tweete une banalitĂ©s, ce tweet ira plus loin que s’il vient de vous ou de moi).

En analysant le code source, voici ce que l’on dĂ©couvre sur les critĂšres d’engagement et leur pondĂ©ration dans les scores de classement :
1. Chaque like / j’aime donne un score de 30
2. Chaque retweet donne une score de 20
3. Chaque « reply / réponse » ajoute seulement 1 à votre score

Résultat : les likes sont (étonnamment) les plus impactants (et pas forcément les discussions et commentaires sous le tweet).

2. L’impact des contenus images et vidĂ©os

L’ajout d’une image ou d’une vidĂ©o Ă  votre tweet (outre que ces contenus peuvent rendre plus visible votre tweet en prenant plus de place dans la Timeline ou simplement enrichir votre tweet, une image ou une vidĂ©o pouvant capter l’attention au milieu de tweets sous forme de textes), permet « organiquement » d’obtenir un boost dans les classements.

Résultat : ajoutez des images et vidéos pour bénéficier de ce boost dans les ranking.

3. L’impact des hashtags

L’ajout de hashtags multiples (plus d’un) vous dĂ©fĂ©rence quasiment automatiquement.

N’utilisez pas (ou peu) de hashtags.

4. L’impact (nĂ©gatif) des liens externes

L’ajout d’un lien externe (vers une source tierce hors de X / Twitter) Ă  votre tweet pĂ©nalise votre publication. Les posts qui font « sortir » l’utilisateur de la plateforme sont une perte de revenus publicitaire pour X.

Résultat : restez sur la plateforme sans quoi le tweet sera marqué comme un « spam » et nettement minoré.

5. L’impact de votre ratio followers / following

Le nombre de vos followers est important mais le ratio entre ce nombre d’abonnĂ©s (followers) et les comptes que vous suivez (following) est Ă©galement critique. Donc ne suivez pas trop de comptes dans l’espoir d’ĂȘtre repĂ©rĂ© (ou en automatique), cela vous pĂ©nalise.

6. L’impact des « mute » et « unfollow »

Comme décrit dans le post officiel de X, les tweets « mis sous silence », « bloqués », « unfollowés », « mis en spam » ou en « report abuse » sont logiquement pénalisés.

7. L’impact du badge « X Blue »

Aucune surprise, si vous avez le badge « X Blue » (et que vous payez donc), vos tweets bĂ©nĂ©ficieront d’un boost « au sein de votre rĂ©seau » mais Ă©galement « hors de votre rĂ©seau ».

8. L’impact de la dĂ©sinformation (fake news & spambots)

Vos tweets s’ils sont flaggĂ©s comme fake sur des sujets monitorĂ©s par X seront descendus dans les classements et possiblement « shadowban ».

9. L’impact du social graph

La notion de « In-Network » et de « Out-of-Network » est nouvelle : chaque compte est clustĂ©risĂ© dans un groupe de profils similaires. Vos tweets sont d’abord diffusĂ©s dans ce groupe proche avant (Ă©ventuellement) d’ĂȘtre envoyĂ© plus largement auprĂšs d’une cible plus large.

10. L’impact des clusters « In-Network » et « Out-of-Network »

Vos tweets sont de maniĂšre « organique » pĂ©nalisĂ©s dĂšs qu’ils sont diffusĂ©s « hors de votre rĂ©seau ».

Cela signifie :
1. Que vos tweets sont d’abord diffusĂ©s au cluster oĂč vous avez Ă©tĂ© filtrĂ© (sans pĂ©nalitĂ©).
2. Qu’en fonction de l’engagement, votre tweet sera proposĂ© « hors de votre rĂ©seau » (mais avec une pĂ©nalitĂ©).
3. Donc que vos tweets qui n’obtiennent pas de likes et de retweets « dans votre rĂ©seau » n’ont aucune chance « hors du rĂ©seau »
4. Donc que si vous postez sur des thĂ©matiques qui n’intĂ©ressent pas votre cluster (exemple : vous parlez constamment de marketing et subitement vous parlez de cuisine), votre tweet ne passera pas cette premiĂšre barriĂšre.

Résultat : restez niché sur une thématique.

11. L’impact de l’orthographe et du vocabulaire

Si vous écrivez avec les pieds, vous serez pénalisé.

12. L’impact du timing (et de l’anciennetĂ© du tweet)

MĂȘme si votre tweet est gĂ©nial, l’algorithme de X / Twitter va lentement le faire disparaĂźtre Ă  mesure qu’il date afin de faire Ă©merger des tweets plus rĂ©cents. Apparemment en faisant baisser le score d’ñge de 50% toute les 6 heures. C’est donc Ă  sa publication que votre tweet doit performer pour avoir une chance de s’extraire de la pesanteur terrestre et voler de ses propres ailes.

Les 3 signaux qui impactent votre score de pertinence

L’accĂšs Ă  la Timeline et au fil d’actualitĂ© des utilisateurs est donc centrĂ© autour de 3 agrĂ©gations de donnĂ©es :
– Vos donnĂ©es d’engagement (likes, retweets, rĂ©ponses
)
– Vos donnĂ©es d’utilisateurs (spam, unfollow, mute
)
– Vos connexions (social graph, cluster, followers et donc communauté )

Nous connaissions par expĂ©rience une bonne partie de ces Ă©lĂ©ments mais il s’agit de la premiĂšre fois que nous obtenons une vue de l’intĂ©rieur basĂ©e sur non pas des hypothĂšses mais des donnĂ©es.

J’espĂšre que vous en profiterez pour piocher quelques bonnes idĂ©es pour amĂ©liorer votre stratĂ©gie de contenus.

Développer vos réseaux sociaux est un volet majeur du programme "Trafic & Clients".
Pour aller plus loin sur le sujet, téléchargez gratuitement mes guides et mes conseils pour améliorer votre impact sur les réseaux sociaux.
Quitter la version mobile