Étude web suisse

Printemps 2026: préparation à l'IA et état des lieux technique de 2'459'124 domaines .ch

Publié le 22 avril 2026 · Peter Hadorn

Pourquoi cette étude?

L'Étude web suisse examine dans quelle mesure les sites web .ch sont techniquement préparés à une utilisation du web dans laquelle les moteurs de recherche, les systèmes d'IA et les robots d'IA saisissent, structurent et retraitent les contenus par machine. L'étude n'évalue pas les entreprises et ne mesure pas si certains systèmes d'IA recommandent effectivement un site web. Elle recense des caractéristiques qui aident les machines à lire un site web: données structurées, titres, méta-informations, robots.txt et llms.txt.

Pour l'analyse, 2'459'124 domaines .ch issus du fichier de zone de SWITCH ont été scannés. Parmi eux, 1'742'537 domaines étaient actifs; 1'463'577 sites web ont livré HTTP 200 et ont été évalués comme sites web analysables. Tous les pourcentages de cette étude se rapportent aux 1'463'577 sites web analysables avec HTTP 200.

L'objectif est un état des lieux solide de l'infrastructure web suisse: quelles bases techniques existent? Où manquent les informations lisibles par machine? Et comment les sites web suisses gèrent-ils l'accès par les robots d'IA?

Principaux résultats

  1. Presque aucun site web ne gère quels systèmes d'IA peuvent lire ses contenus. Seuls 2,1% bloquent au moins un robot d'IA examiné (comme GPTBot ou ClaudeBot) via robots.txt. 97,9% ne contiennent pas de blocage explicite de ce type.
  2. Peu de sites web expliquent aux systèmes d'IA qui ils sont et ce qu'ils proposent. 15,2% ont un fichier llms.txt, un fichier prévu précisément à cet effet. Toutefois, 33,9% de ces fichiers sont des fichiers standard générés automatiquement par Wix. Après déduction de cette automatisation reconnue, il reste 10,1%.
  3. Peu de sites web fournissent aux systèmes de recherche des informations lisibles par machine sur les entreprises ou les offres. 25,2% utilisent des données structurées, mais seuls 2,7% contiennent des types pertinents pour l'activité, comme l'adresse de l'entreprise ou des offres de produits.
  4. Les descriptions de page de base manquent chez la majorité. 56,2% n'ont pas de méta-description, le court texte qui apparaît dans les résultats de recherche. 55,9% n'ont pas de titre principal (H1) et 19,1% n'ont pas HTTPS.
  5. Un site web sur cinq n'est pas préparé aux appareils mobiles. 22,5% des sites web .ch analysables n'ont pas de méta-balise viewport, un signal de base pour l'affichage sur smartphone.

Conclusion

Le web suisse est encore insuffisamment préparé à la recherche par IA. Beaucoup de sites web .ch sont certes accessibles, mais expliquent trop rarement dans le code qui se trouve derrière le site, ce qui est proposé et si les robots d'IA peuvent utiliser les contenus. Les plus grandes lacunes concernent des bases simples: descriptions de page compréhensibles, titres clairs, affichage mobile, données structurées et règles explicites pour les robots d'IA.

Note de contextualisation: Cette étude mesure des signaux techniques, pas la qualité de sites web individuels. Elle montre quelles caractéristiques étaient reconnaissables dans le HTML, dans les fichiers robots.txt et llms.txt. Elle ne mesure pas comment certains systèmes d'IA pondèrent ces signaux ni s'ils citent effectivement un site web.

État des données: 22 avril 2026. → Méthodologie & limites

2'459'124
Domaines .ch scannés
1'742'537
dont actifs (70,9%)
1'463'577
analysables · HTTP 200 (59,5%)
716'587
inactifs (29,1%)

Tous les pourcentages de cette étude se rapportent aux 1'463'577 sites web analysables. Les pourcentages sont arrondis à une décimale.

Presse

  • 2'459'124 domaines .ch scannés, 1'463'577 évalués avec HTTP 200
  • 97,9% des sites web ne contiennent pas de blocage explicite des robots d'IA examinés dans le fichier robots.txt
  • Seuls 10,1% ont un fichier llms.txt sans automatisation reconnue
  • Seuls 2,7% ont des données structurées pertinentes pour l'activité
Contact: Peter Hadorn, Scanner: GitHub Corrections: Citation: Hadorn, P. (2026). Étude web suisse (printemps 2026): Préparation à l'IA et état des lieux technique de 2'459'124 domaines .ch. KI-Barometer.ch.
https://ki-barometer.ch/fr/etude-web-suisse/

1. Neuf constats centraux


Préparation à l'IA

97,9%
Accès libre pour les robots d'IA

La question de savoir si les robots d'IA peuvent accéder au site n'est pas activement traitée par la plupart des sites web. Seuls 2,1% bloquent au moins un robot d'IA examiné par Disallow: / dans le fichier robots.txt.

10,1%
llms.txt sans automatisation reconnue

15,2% ont un fichier llms.txt. La plupart des fichiers existants proviennent d'une automatisation de plateforme et ne contiennent aucun contenu commercial individuel. Sans automatisation reconnue: 10,1%.

2,7%
Données structurées pertinentes pour l'activité

25,2% ont un balisage Schema. Beaucoup de ces balisages se composent de types génériques comme WebSite, WebPage ou BreadcrumbList. Types pertinents pour l'activité comme LocalBusiness ou Offer: 2,7%.

Bases SEO

56,2%
Pas de méta-description

Plus de la moitié des sites web analysables n'a pas de méta-description. Les exploitants de sites web perdent ainsi le contrôle sur leur présentation dans les résultats de recherche.

55,9%
Pas de titre H1

Plus de la moitié des sites web analysables n'a pas de H1. Une structure HTML de base manque, ce qui peut compliquer la classification automatique du contenu principal.

89,3%
Pas de balises hreflang

Les sites web multilingues peuvent utiliser hreflang pour signaler des versions linguistiques et régionales. 89,3% n'utilisent pas ce signal.

Infrastructure et technique

22,5%
Non optimisé pour mobile

22,5% des sites web analysables n'ont pas de balise viewport. Sans méta-balise viewport, un signal de base pour l'affichage responsive manque.

19,1%
Pas de HTTPS

19,1% des sites web analysables n'utilisent toujours pas HTTPS. Les navigateurs peuvent signaler les pages HTTP comme non sûres.

25,6%
Domination de WordPress

Un site web suisse sur quatre fonctionne avec WordPress. Wix suit avec 5,7%, TYPO3 avec 2,4%. Les CMS détectés suivants sont nettement plus bas.

Base: 1'463'577 sites web .ch analysables

Accès libre pour les robots d'IA
97,9% 1'432'949
Pas de méta-description
56,2% 822'447
Pas de titre H1
55,9% 818'620
Données structurées pertinentes pour l'activité
2,7% 39'673
WordPress
25,6% 374'841
Non optimisé pour mobile
22,5% 329'372
Pas de HTTPS
19,1% 279'309
Pas de balises hreflang
89,3% 1'306'243
llms.txt sans autom. reconnue
10,1% 147'168

2. Préparation à l'IA en détail


Dans quelle mesure les sites web suisses sont-ils préparés aux systèmes de recherche par IA comme ChatGPT, Gemini, Claude, Copilot, Perplexity et Google AI Overviews? Nous avons mesuré six métriques.

robots.txt
72,0%
Sitemap
54,1%
H1 correct
34,3%
Données structurées
25,2%
llms.txt (sans autom. reconnue)
10,1%
Robot d'IA bloqué
2,1%
> 70% 30-70% < 30%

Que signifient ces chiffres?

Données structurées (25,2%): Le balisage Schema.org donne aux machines des indications structurées sur le contenu, l'organisation et les offres d'un site web. Sans données structurées, les systèmes de recherche et d'IA doivent déduire ces informations à partir d'un contenu non structuré. 369'375 sites web ont ce balisage. 74,8% ne l'ont pas.

robots.txt (72,0%): Le fichier robots.txt gère quels robots peuvent visiter un site web. Près de trois quarts en ont un, mais la plupart proviennent d'installations CMS et ne contiennent aucune configuration spécifique reconnaissable pour les robots d'IA. Seuls 2,1% bloquent au moins un robot d'IA examiné par Disallow: /.

Structure H1: 34,3% ont exactement un titre H1 (correct). 55,9% n'ont pas de H1 (818'620 sites web sans titre principal). 9,7% ont plusieurs H1 (142'252 sites web), ce qui dilue la structure. Pour les moteurs de recherche et les systèmes d'IA, cela complique l'identification du contenu principal.

Blocage des robots d'IA (2,1%): Seuls 30'628 sites web bloquent au moins un robot d'IA examiné comme GPTBot, ClaudeBot ou Google-Extended par Disallow: /. 28'285 autres bloquent tous les bots de manière générale. Cela signifie que 97,9% des sites web suisses n'ont inscrit aucun blocage explicite des robots d'IA examinés dans leur fichier robots.txt.

Conclusion: La gestion des robots d'IA n'est pas encore un sujet actif pour la plupart des sites web suisses. La prochaine enquête montrera si cela change avec l'usage croissant de la recherche par IA.

3. Le problème llms.txt: ambition et réalité


Le fichier llms.txt a été proposé comme standard permettant aux sites web de donner aux systèmes d'IA des indications compactes sur l'identité, l'offre et les contenus pertinents.

222'625
Fichiers llms.txt trouvés
147'168
Sans automatisation reconnue
75'457
Générés automatiquement
Sans automatisation reconnue
66%
Boilerplate Wix
33,9%

Ce que Wix génère

Wix place automatiquement un fichier llms.txt identique sur tous les sites web hébergés. 91,2% de tous les sites web Wix suisses (75'457 sur 82'746) ont ce fichier. Il contient:

  • Une référence à /_api/mcp (interface interne de Wix)
  • La mention "Powered by Wix"
  • Aucune information spécifique à l'entreprise
  • Aucun contenu rédigé par un humain

Le fichier est identique sur différents types de sites web.

Résultat: Sans le boilerplate Wix, le taux suisse d'adoption de llms.txt passe de 15,2% à 10,1%. Un fichier llms.txt sur trois en Suisse est généré par une plateforme et ne fournit aux systèmes d'IA aucune indication spécifique à l'entreprise.

Les chiffres d'adoption devraient présenter séparément le boilerplate Wix, car ces fichiers ne contiennent aucun contenu commercial individuel.

Ce qui doit figurer dans un bon llms.txt

Un bon llms.txt décrit en quelques phrases ce que fait l'entreprise, quels services elle propose et pour quelle région elle est pertinente. Un tel fichier peut donner aux systèmes d'IA des indications supplémentaires pour classer un site web. Les 147'168 fichiers non reconnus comme automatiques peuvent contenir de telles indications spécifiques à l'entreprise. 10,1% reste une valeur basse.

4. Données structurées: qu'est-ce qui est balisé?


Les données structurées rendent un site web lisible par machine. Nous examinons trois formats: JSON-LD (blocs intégrés application/ld+json, aujourd'hui le standard), Microdata (attributs itemtype dans le HTML) et RDFa (vocab). Les trois utilisent le vocabulaire Schema.org pour décrire les contenus, de l'adresse d'entreprise à l'offre de produits.

25,2% des sites web analysables utilisent au moins un de ces formats. Quels types sont effectivement balisés?

Qualité: générique vs pertinent pour l'activité

Parmi les 369'375 sites web avec données structurées, 363'372 ont pu être catégorisés sur la base de leurs types Schema. Ces types ont été répartis en trois groupes: génériques, contextuels et pertinents pour l'activité.

58,4%
Uniquement des types génériques
30,7%
Types contextuels
10,9%
Pertinent pour l'activité
Générique (automatisation CMS)
212'092
Contextuel (Article, Person, ...)
111'607
Pertinent pour l'activité (LocalBusiness, Offer, FAQ)
39'673

Générique: WebSite, WebPage, SearchAction, BreadcrumbList, etc. - ajoutés automatiquement par des plugins CMS. Contextuel: PostalAddress, Article, Person - utiles, mais non spécifiques à l'activité. Pertinent pour l'activité: LocalBusiness, Offer, FAQ, Product, Review, Event - types qui fournissent des indications concrètes sur les entreprises, offres, produits, avis ou événements.

Tous les types Schema en détail

WebSite
250'986
WebPage
235'962
SearchAction
189'313
Organization
186'343
ImageObject
175'753
ListItem
170'089
Fil d'ArianeList
169'579
EntryPoint
136'427
ReadAction
129'382
PropertyValueSpecification
110'357
PostalAddress
49'245
Article
43'813

Les principaux types: WebSite (250'986), WebPage (235'962), SearchAction (189'313) sont ajoutés automatiquement par des plugins WordPress comme Yoast et RankMath. Ils ne fournissent que des informations spécifiques à l'entreprise limitées.

Les types Schema pertinents pour l'activité sont rares: LocalBusiness seulement 18'284 occurrences, Offer seulement 10'567 occurrences.

Conclusion: Comme pour llms.txt, le nombre total surestime à lui seul la valeur commerciale du balisage. 25,2% ont des données structurées, mais seulement 10,9% d'entre eux (2,7% de tous les sites web analysables) contiennent un balisage avec des informations concrètes sur l'entreprise, l'offre ou le site.

5. Répartition des CMS en Suisse


Quels systèmes de gestion de contenu les sites web suisses utilisent-ils? Aucun CMS n'a été reconnu chez la majorité.

Aucun CMS reconnu
60,3%
WordPress (total)
25,6%
Wix
5,7%
TYPO3
2,4%
Joomla
1,6%
Squarespace
1,1%
Webflow
0,8%
Contao
0,7%
Drupal
0,6%
Shopify
0,5%
Weebly
0,4%

Part sur 1'463'577 sites web analysés. Reconnaissance CMS via méta-balise generator et motifs HTML.

Sites web sans CMS reconnu

60,3% (883'059 sites web) fonctionnent sans CMS reconnaissable. Cela peut inclure des pages HTML statiques, des constructions sur mesure, des domaines parqués ou des systèmes non reconnus.

WordPress domine les CMS reconnus

Sur les 580'518 sites web avec CMS reconnaissable, 64,6% utilisent WordPress, deux sur trois. En chiffres absolus: 374'841 sites web.

WordPress Core
224'745
+ Elementor
116'823
+ Divi
33'273

116'823 sites web WordPress utilisent Elementor comme page builder (31,2% de tous les sites WP), 33'273 utilisent Divi (8,9%). Ensemble, plus de 40% des sites WordPress suisses misent sur un page builder visuel plutôt que sur l'édition standard.

Spécialités DACH

TYPO3 avec 35'295 sites web (2,4%) et Contao avec 7'690 (0,5%) sont des CMS de l'espace germanophone, peu répandus à l'international. En Suisse, ils occupent les rangs 3 et 9. Les CMS germanophones sont donc plus fortement représentés en Suisse que ne le laisserait attendre leur part de marché internationale.

6. E-commerce: WooCommerce domine


WooCommerce
129'427
Shopify
8'309
PrestaShop
3'794
Magento
2'283

WooCommerce a été reconnu environ 16 fois plus souvent que Shopify. 129'427 boutiques WooCommerce font face à 8'309 boutiques Shopify. Le rapport diffère nettement des États-Unis ou du Royaume-Uni, où Shopify est plus répandu.

Pourquoi? WooCommerce est un plugin WordPress - et WordPress est le CMS standard suisse. L'étude ne mesure pas la cause; des installations WordPress existantes, les préférences des agences et les exigences en matière d'hébergement ou de contrôle des données sont plausibles.

PrestaShop suit avec 3'794 boutiques reconnues.

7. Bases SEO


Les éléments SEO de base comme Title, méta-description, Canonical et Hreflang sont depuis longtemps des standards web établis. Pourtant, ils manquent sur la majorité des sites web analysables.

Balise Title
82,9%
Méta-description
43,8%
URL canonique
38,6%
Open Graph
35,0%
Hreflang
10,7%

Méta-descriptions manquantes

56,2%, plus de la moitié, n'ont pas de méta-description. La méta-description apparaît directement dans le résultat Google. Sans méta-description, les systèmes de recherche choisissent eux-mêmes le texte descriptif affiché; celui-ci peut être moins précis qu'une description formulée par l'exploitant du site web. Seuls 22,7% se situent dans la plage de longueur optimale.

Aucune
822'447
Trop courte (<70)
163'222
Optimale (70-160)
332'535
Trop longue (>160)
145'980

Structure H1

34,3%
Exactement 1 H1 (correct)
55,9%
Pas de H1
9,7%
Plusieurs H1

818'620 sites web n'ont pas un seul titre H1. 142'252 autres en ont plusieurs, ce qui dilue la hiérarchie. Seul un site sur trois a exactement un H1, la structure recommandée depuis les débuts du web.

Balise Title: la longueur décide

Pas de Title
250'535
Trop court (<30)
580'529
Optimal (30-60)
445'015
Trop long (>60)
187'498

Seuls 445'015 sites web (30,4%) ont une balise Title dans la longueur optimale de 30-60 caractères. 580'529 sont trop courts, souvent seulement le nom de l'entreprise sans contexte. Google peut raccourcir les Titles de plus de 60 caractères; 187'498 sites web sont concernés.

Hreflang: plurilinguisme dans le code

Les sites web multilingues peuvent utiliser hreflang pour signaler des versions linguistiques et régionales. Seuls 10,7% des sites web analysables utilisent des balises hreflang.

89,3% des sites web analysables n'utilisent pas ce signal.

9. Langues: qui parle quoi?


Quelle langue les sites web suisses déclarent-ils dans l'attribut HTML lang?

de
34,4%
en
9,4%
de-CH
8,6%
fr-FR
5,9%
fr
5,9%
de-DE
3,9%
en-US
2,9%
de-de
1,7%
it-IT
0,8%
de-ch
0,7%
it
0,6%
en-GB
0,6%
fr-CH
0,4%
fr-fr
0,3%
de-AT
0,2%

Part des sites web avec attribut lang. Beaucoup de sites web ne définissent pas d'attribut lang et ne sont donc pas inclus ici.

"de" au lieu de "de-CH"

La déclaration linguistique la plus fréquente est de (allemand générique) avec 34,4%, quatre fois plus fréquente que de-CH (8,6%). Beaucoup de sites web avec déclaration linguistique allemande se présentent linguistiquement comme "allemands", et non comme "suisses". Il manque ainsi un signal explicite pour les variantes linguistiques régionales.

L'anglais devant le suisse allemand

L'anglais (en: 9.4%) est la deuxième langue la plus fréquente, encore devant de-CH. Cela montre l'orientation internationale de nombreuses entreprises suisses, mais aussi ceci: celui qui publie uniquement en anglais ne donne pas de signal explicite pour les variantes linguistiques locales.

Français (fr + fr-FR ensemble: 11,8%): les déclarations linguistiques françaises apparaissent moins souvent que ne le laisserait supposer la part de population de la Romandie; sans attribution régionale, on ne peut toutefois pas en déduire une sous-représentation directe.

10. Technologie serveur


Quels serveurs web exploitent les sites web suisses? L'en-tête HTTP Server le révèle.

Apache
30,5%
nginx
30,1%
Cloudflare
5,8%
Pepyaka (Wix)
5,6%
OpenResty
4,0%
LiteSpeed
2,3%

11,9% des sites web n'indiquent aucun en-tête Server (cache derrière un CDN, un proxy ou une autre infrastructure).

Apache et nginx dominent le marché suisse des serveurs web: Apache avec 30,5%, nginx avec 30,1%. Ensemble, ils se trouvent derrière 60,6% de tous les sites web analysables.

Cloudflare est avec 5,8% l'indication CDN/reverse proxy la plus fréquente dans l'en-tête Server. Pepyaka (5,6%) est le serveur propre à Wix. Le chiffre est proche de la part CMS de Wix.

LiteSpeed apparaît chez 2,3% des sites web analysables. Microsoft IIS apparaît chez 1,0%.

11. Infrastructure


80,9%
HTTPS
77,5%
Compatible mobile
652 ms
Temps de réponse moyen

Utilisation de HTTPS

80,9% des sites web utilisent HTTPS, mais 19,1% restent non chiffrés en 2026. 279'309 sites web n'utilisent pas HTTPS. Les navigateurs peuvent signaler les pages HTTP comme non sûres.

Bases mobiles: balise méta viewport

22,5% des sites web n'ont pas de méta-balise viewport, un signal de base pour l'affichage responsive. 329'372 sites web peuvent être affichés de manière incorrecte sur les appareils mobiles.

Vitesse: moyenne de 652 ms

Le temps de réponse moyen est de 652 millisecondes (Time to First Byte). Il s'agit de la valeur pure du serveur, sans rendu, images ni JavaScript. Un TTFB inférieur à 200 ms est considéré comme rapide. 652 ms indique un mélange de serveurs répondant rapidement et lentement.

12. Conclusion


L'Étude web suisse montre que le web suisse est encore insuffisamment préparé à la recherche par IA. Beaucoup de sites web .ch sont en ligne et accessibles, mais n'indiquent pas clairement dans le HTML qui exploite le site, ce qui est proposé et comment les robots doivent traiter les contenus.

Cela apparaît particulièrement clairement dans les bases. 56,2% des sites web analysables n'ont pas de méta-description, 55,9% pas de titre H1 et 22,5% pas de méta-balise viewport. Seuls 25,2% utilisent des données structurées; les types Schema pertinents pour l'activité comme LocalBusiness ou Offer n'apparaissent même que sur 2,7% de tous les sites web analysables.

La gestion des robots d'IA est, elle aussi, peu établie. 97,9% des sites web analysables ne contiennent pas de blocage robots.txt explicite pour les robots d'IA examinés. Un fichier llms.txt sans automatisation reconnue reste également rare avec 10,1%. Cela ne signifie pas que ces sites web sont automatiquement mauvais ou ignorés par les systèmes d'IA. Mais cela montre que beaucoup de sites web suisses structurent encore peu activement leur visibilité et leur utilisation dans le web de l'IA.

L'étude n'évalue pas des entreprises individuelles et ne mesure pas comment les systèmes d'IA pondèrent ces caractéristiques. Elle montre toutefois une lacune dans le web suisse: beaucoup de sites web renoncent à des indications simples que les moteurs de recherche et les robots d'IA peuvent lire de manière fiable.

13. Questions fréquentes


Que mesure l'Étude web suisse?

L'étude mesure des caractéristiques techniques dans le HTML, dans les fichiers robots.txt et llms.txt des sites web .ch. Cela comprend les données structurées, les éléments SEO de base, la reconnaissance CMS, les règles pour robots d'IA et l'infrastructure.

Que ne mesure pas l'étude?

L'étude ne mesure pas comment certains systèmes d'IA pondèrent ces signaux, s'ils citent effectivement un site web ni quelle est la qualité de son contenu.

Pourquoi le dénominateur est-il 1'463'577 et non 2'459'124?

Sur les 2'459'124 domaines scannés, seuls 1'463'577 ont fourni une réponse exploitable (HTTP 200 avec HTML). Le reste était inactif, défectueux ou non accessible. Tous les pourcentages se rapportent à ces 1'463'577 sites web analysables.

Qu'est-ce qui compte comme llms.txt non reconnu automatiquement?

Le scanner reconnaît les fichiers llms.txt générés par Wix au moyen de deux signatures. Tous les autres fichiers llms.txt sont considérés comme non reconnus automatiquement. D'autres formes de génération automatique (p. ex. par des plugins WordPress) n'ont pas été relevées séparément.

Une méta-balise viewport manquante signifie-t-elle qu'un site web ne fonctionne pas sur mobile?

Pas nécessairement. La méta-balise viewport est un signal de base pour l'affichage responsive, mais un site web peut aussi être utilisable sur des appareils mobiles sans cette balise. L'étude mesure la présence de la balise, pas l'affichage mobile effectif.

Qu'est-ce qui compte comme blocage de robot d'IA?

Seul un blocage complet par Disallow: / pour l'un des dix robots d'IA examinés dans le fichier robots.txt est compté. Les blocages partiels ou les blocages par d'autres mécanismes ne sont pas relevés.

14. Méthodologie


Source des donnéesFichier de zone .ch de SWITCH
Domaines scannés2'459'124
Domaines actifs1'742'537
Analyses (HTTP 200 avec HTML exploitable)1'463'577 (HTTP 200)
Dénominateur des pourcentages1'463'577 sites web analysables
Méthode de scanaiohttp + aiodns, pas de rendu JavaScript
Points de données par site web40

Source des données: Tous les domaines .ch du fichier de zone de SWITCH (DNS Zone Transfer, AXFR avec clé TSIG, consulté le 12 avril 2026). SWITCH gère tous les domaines .ch de Suisse.

Scanner: Scanner Python asynchrone (aiohttp + aiodns) avec 40 points de données par domaine. Scanne la page d'accueil, robots.txt, llms.txt et les pages mentions légales/protection des données. Pas de rendu JavaScript. Analyse HTML pure. Requêtes concurrentes: 50, timeout: 8 secondes.

Reconnaissance des robots d'IA: 10 robots d'IA spécifiques sont recherchés dans le fichier robots.txt: GPTBot, ClaudeBot, CCBot, Google-Extended, Anthropic, ByteSpider, ChatGPT-User, AmazonBot, Cohere-AI, Meta-ExternalAgent. Seul Disallow: / compte comme blocage.

Classification llms.txt: La génération automatique par Wix est reconnue au moyen de deux signatures: "powered by Wix" et "/_api/mcp" dans le contenu du fichier. Tous les autres fichiers llms.txt sont considérés comme non reconnus automatiquement. Ces fichiers peuvent contenir d'autres formes de génération automatique non relevées.

Reconnaissance CMS: Via <meta name="generator"> et motifs HTML (wp-content, data-drupal, wix.com, etc.). 14+ plateformes reconnues, y compris des variantes de page builders (Elementor, Divi).

Périmètre: 2'459'124 domaines scannés. 1'463'577 analysés avec HTTP 200 et HTML exploitable. Tous les pourcentages se rapportent aux 1'463'577 sites web analysables avec HTTP 200 comme dénominateur.

Limites de l'analyse

  • Le scanner analyse le HTML sans rendu JavaScript. Les sites web qui ne chargent leurs contenus que via JavaScript sont relevés de manière incomplète.
  • La reconnaissance CMS repose sur les méta-balises generator et les motifs HTML. Les CMS sans ces caractéristiques ne sont pas reconnus.
  • Les fichiers llms.txt générés par Wix sont reconnus par les signatures "powered by Wix" et "/_api/mcp". D'autres fichiers llms.txt générés automatiquement ne sont pas classés comme tels.
  • Le blocage d'un robot d'IA ne compte que si un robot d'IA cité est bloqué dans le fichier robots.txt par Disallow: /. Les blocages partiels ne sont pas relevés.
  • L'étude mesure la présence de caractéristiques techniques. Elle ne mesure pas comment certains systèmes d'IA pondèrent ou utilisent ces caractéristiques.
  • Les bannières de cookies chargées seulement après l'exécution de JavaScript n'ont pas été relevées.
  • L'absence d'un CMS reconnu ne signifie pas nécessairement qu'aucun CMS n'est utilisé.

Open source: Le code complet du scanner est disponible publiquement sur GitHub. Le code permet de contrôler la méthode et de reproduire le scan.

Citation:

Hadorn, P. (2026). Étude web suisse (printemps 2026): Préparation à l'IA et état des lieux technique de 2'459'124 domaines .ch. KI-Barometer.ch.
https://ki-barometer.ch/fr/etude-web-suisse/

Données & reproductibilité

Fichier de zoneSWITCH (registre .ch), consulté le 12 avril 2026 via AXFR
Code du scannergithub.com/peterhadorn/swiss-web-report (Open Source)
Période de scandu 15 au 20 avril 2026
Domaines scannés2'459'124
Analysable1'463'577 (HTTP 200)
DénominateurTous les pourcentages se rapportent à 1'463'577 sites web analysables
Données publiquesRésultats agrégés sur cette page
Non publicdonnées brutes au niveau des domaines (Protection des données)
Questions méthodologiques

Corrections et contact

Indications sur des erreurs méthodologiques, informations contextuelles manquantes ou propositions de correction: . Les corrections soumises sont examinées et, si elles sont pertinentes, intégrées dans l'étude.