Depuis quelques mois, une question revient souvent dans nos échanges clients. Une question qui s’était faite beaucoup plus rare ces dernières années :
Combien de bots visitent mon site ?
Sauf qu’aujourd’hui, on ne parle plus seulement des bots d’indexation classiques.
On parle aussi de ChatGPT, Perplexity, Claude et d’autres agents IA qui viennent consulter des contenus, les analyser, et parfois les réutiliser pour nourrir leurs réponses.
Et c’est là que le sujet se complique.
Les outils analytics classiques ne peuvent répondre que partiellement à la question » Combien de bots visitent mon site ?
Ils remontent une partie du trafic, notamment lorsque l’accès ressemble à une visite web plus traditionnelle. Mais ils ne voient pas tout, loin de là.
Beaucoup d’agents IA ou de crawlers :
• n’exécutent pas le JavaScript analytics ;
• n’envoient pas toujours un referrer exploitable ;
• peuvent changer d’identifiant ;
• ou accèdent au contenu d’une manière qui échappe largement aux outils de mesure front classiques.
Autrement dit : vos statistiques habituelles donnent souvent une vision partielle du phénomène.
Alors comment commencer à mesurer cela sérieusement ?
On voit aujourd’hui deux approches complémentaires :
• des solutions spécialisées (ex : Tollbit), capables d’identifier et de suivre une partie de ces accès liés aux IA ;
• une approche plus infrastructure, via l’analyse des logs serveur, du CDN ou du reverse proxy, pour qualifier les requêtes et mieux distinguer humains, bots classiques et agents IA.
C’est d’ailleurs un sujet sur lequel nous commençons à déployer des solutions plus concrètes : agréger les logs, les interpréter, puis les exploiter soit directement, soit en les poussant dans des outils comme Matomo pour rendre ces signaux plus lisibles et partageables.
Avant de décider s’il faut bloquer, autoriser, monitorer ou demain monétiser ces accès, il y a donc un préalable assez simple : comprendre ce qui consulte réellement votre contenu.
Et vous, avez-vous déjà une idée du nombre de bots qui visitent votre site ? (près de 5 % sur certains de nos projets)