Studio web svizzero

Primavera 2026: preparazione all'IA e inventario tecnico di 2'459'124 domini .ch

Pubblicato il 22 aprile 2026 · Peter Hadorn

Perché questo studio?

Lo Studio web svizzero esamina quanto i siti web .ch siano tecnicamente preparati a un uso del web in cui motori di ricerca, sistemi di IA e crawler IA acquisiscono, strutturano e rielaborano contenuti in modo automatico. Lo studio non valuta aziende e non misura se singoli sistemi di IA raccomandino effettivamente un sito web. Rileva caratteristiche che aiutano le macchine a leggere un sito web: dati strutturati, titoli, meta-informazioni, robots.txt e llms.txt.

Per l'analisi sono stati scansionati 2'459'124 domini .ch dal file di zona SWITCH. Di questi, 1'742'537 domini erano attivi; 1'463'577 siti web hanno restituito HTTP 200 e sono stati valutati come siti web analizzabili. Tutte le percentuali di questo studio si riferiscono ai 1'463'577 siti web analizzabili con HTTP 200.

L'obiettivo è un inventario solido dell'infrastruttura web svizzera: quali basi tecniche sono presenti? Dove mancano informazioni leggibili dalle macchine? E come regolano i siti web svizzeri l'accesso da parte dei crawler IA?

Risultati principali

  1. Quasi nessun sito web regola quali sistemi di IA possano leggere i suoi contenuti. Solo il 2,1% blocca almeno un crawler IA esaminato (come GPTBot o ClaudeBot) tramite robots.txt. Il 97,9% non contiene un blocco esplicito di questo tipo.
  2. Pochi siti web spiegano ai sistemi di IA chi sono e cosa offrono. Il 15,2% ha una llms.txt, un file pensato esattamente per questo scopo. Tuttavia, il 33,9% di questi file è costituito da file standard generati automaticamente da Wix. Dedotta questa automazione riconosciuta, resta il 10,1%.
  3. Pochi siti web forniscono ai sistemi di ricerca informazioni leggibili dalle macchine su aziende o offerte. Il 25,2% utilizza dati strutturati, ma solo il 2,7% contiene tipi rilevanti per il business come indirizzo aziendale o offerte di prodotti.
  4. Le descrizioni di pagina di base mancano nella maggioranza. Il 56,2% non ha una meta-description, il breve testo che appare nei risultati di ricerca. Il 55,9% non ha un titolo principale (H1) e il 19,1% non ha HTTPS.
  5. Un sito web su cinque non è preparato per i dispositivi mobili. Il 22,5% dei siti web .ch analizzabili non ha un meta tag viewport, un segnale di base per la visualizzazione su smartphone.

Conclusione

Il web svizzero è ancora insufficientemente preparato alla ricerca con IA. Molti siti web .ch sono raggiungibili, ma nel codice spiegano troppo raramente chi sta dietro al sito, cosa viene offerto e se i crawler IA possono utilizzare i contenuti. Le lacune maggiori riguardano basi semplici: descrizioni di pagina comprensibili, titoli chiari, visualizzazione mobile, dati strutturati e regole esplicite per i crawler IA.

Nota di contestualizzazione: Questo studio misura segnali tecnici, non la qualità di singoli siti web. Mostra quali caratteristiche erano riconoscibili nell'HTML, nel robots.txt e nella llms.txt. Non misura come singoli sistemi di IA ponderino questi segnali o se citino effettivamente un sito web.

Stato dei dati: 22 aprile 2026. → Metodologia & limiti

2'459'124
Domini .ch scansionati
1'742'537
di cui attivi (70,9%)
1'463'577
analizzabili · HTTP 200 (59,5%)
716'587
inattivi (29,1%)

Tutte le percentuali di questo studio si riferiscono ai 1'463'577 siti web analizzabili. Le percentuali sono arrotondate a una cifra decimale.

Stampa

  • 2'459'124 domini .ch scansionati, 1'463'577 valutati con HTTP 200
  • Il 97,9% dei siti web non contiene nel robots.txt alcun blocco esplicito dei crawler IA esaminati
  • Solo il 10,1% ha una llms.txt senza automazione riconosciuta
  • Solo il 2,7% ha dati strutturati rilevanti per il business
Contatto: Peter Hadorn, Scanner: GitHub Correzioni: Citazione: Hadorn, P. (2026). Studio web svizzero (primavera 2026): Preparazione all'IA e inventario tecnico di 2'459'124 domini .ch. KI-Barometer.ch.
https://ki-barometer.ch/it/studio-web-svizzero/

1. Nove risultati chiave


Preparazione all'IA

97,9%
Accesso libero per i crawler IA

La questione se i crawler IA possano accedere non viene affrontata attivamente dalla maggior parte dei siti web. Solo il 2,1% blocca almeno un crawler IA esaminato tramite Disallow: / nel robots.txt.

10,1%
llms.txt senza automazione riconosciuta

Il 15,2% ha una llms.txt. La maggior parte dei file esistenti proviene da automazione di piattaforma e non contiene contenuto aziendale individuale. Senza automazione riconosciuta: 10,1%.

2,7%
Dati strutturati rilevanti per il business

Il 25,2% ha markup Schema. Molti di questi markup consistono in tipi generici come WebSite, WebPage o BreadcrumbList. Tipi rilevanti per il business come LocalBusiness o Offer: 2,7%.

Basi SEO

56,2%
Nessuna meta description

Più della metà dei siti web analizzabili non ha una meta description. I gestori dei siti perdono così il controllo sulla loro presentazione nei risultati di ricerca.

55,9%
Nessun titolo H1

Più della metà dei siti web analizzabili non ha un H1. Manca una struttura HTML di base, il che può rendere più difficile la classificazione automatica del contenuto principale.

89,3%
Nessun tag hreflang

I siti web multilingue possono utilizzare hreflang per indicare versioni linguistiche e regionali. L'89,3% non utilizza questo segnale.

Infrastruttura e tecnica

22,5%
Non ottimizzato per mobile

Il 22,5% dei siti web analizzabili non ha un tag viewport. Senza meta tag viewport manca un segnale di base per la visualizzazione responsive.

19,1%
Nessun HTTPS

Il 19,1% dei siti web analizzabili non utilizza ancora HTTPS. I browser possono contrassegnare le pagine HTTP come non sicure.

25,6%
Dominio di WordPress

Un sito web svizzero su quattro gira su WordPress. Wix segue con il 5,7%, TYPO3 con il 2,4%. I CMS riconosciuti successivi sono nettamente più in basso.

Base: 1'463'577 siti web .ch analizzabili

Accesso libero per i crawler IA
97,9% 1'432'949
Nessuna meta description
56,2% 822'447
Nessun titolo H1
55,9% 818'620
Dati strutturati rilevanti per il business
2,7% 39'673
WordPress
25,6% 374'841
Non ottimizzato per mobile
22,5% 329'372
Nessun HTTPS
19,1% 279'309
Nessun tag hreflang
89,3% 1'306'243
llms.txt senza autom. riconosciuta
10,1% 147'168

2. Preparazione all'IA in dettaglio


Quanto sono preparati i siti web svizzeri ai sistemi di ricerca IA come ChatGPT, Gemini, Claude, Copilot, Perplexity e Google AI Overviews? Abbiamo misurato sei metriche.

robots.txt
72,0%
Sitemap
54,1%
H1 corretto
34,3%
Dati strutturati
25,2%
llms.txt (senza autom. riconosciuta)
10,1%
Crawler IA bloccato
2,1%
> 70% 30-70% < 30%

Che cosa significano questi numeri?

Dati strutturati (25,2%): Il markup Schema.org fornisce alle macchine indicazioni strutturate su contenuto, organizzazione e offerte di un sito web. Senza dati strutturati, i sistemi di ricerca e IA devono derivare tali informazioni da contenuto non strutturato. 369'375 siti web hanno questo markup. Il 74,8% no.

robots.txt (72,0%): Il file robots.txt regola quali crawler possano visitare un sito web. Quasi tre quarti ne hanno uno, ma la maggior parte proviene da installazioni CMS e non contiene una configurazione specifica riconoscibile per crawler IA. Solo il 2,1% blocca almeno un crawler IA esaminato tramite Disallow: /.

Struttura H1: Il 34,3% ha esattamente un titolo H1 (corretto). Il 55,9% non ha H1 (818'620 siti web senza titolo principale). Il 9,7% ha più H1 (142'252 siti web), il che diluisce la struttura. Per motori di ricerca e sistemi di IA questo rende più difficile il riconoscimento del contenuto principale.

Blocco dei crawler IA (2,1%): Solo 30'628 siti web bloccano almeno un crawler IA esaminato come GPTBot, ClaudeBot o Google-Extended tramite Disallow: /. Altri 28'285 bloccano tutti i bot in modo generico. Questo significa che il 97,9% dei siti web svizzeri non ha inserito nel robots.txt alcun blocco esplicito dei crawler IA esaminati.

Conclusione: La gestione dei crawler IA finora non è un tema attivo per la maggior parte dei siti web svizzeri. La prossima rilevazione mostrerà se questo cambierà con la crescente ricerca basata sull'IA.

3. Il problema llms.txt: ambizione e realtà


Il file llms.txt è stato proposto come standard con cui i siti web possono fornire ai sistemi di IA indicazioni compatte su identità, offerta e contenuti rilevanti.

222'625
File llms.txt trovati
147'168
Senza autom. riconosciuta
75'457
Generati automaticamente
Senza automazione riconosciuta
66%
Boilerplate Wix
33,9%

Cosa genera Wix

Wix colloca automaticamente su tutti i siti web ospitati un file llms.txt identico. Il 91,2% di tutti i siti web Wix svizzeri (75'457 su 82'746) ha questo file. Contiene:

  • Un riferimento a /_api/mcp (interfaccia interna di Wix)
  • La nota "Powered by Wix"
  • Nessuna informazione specifica dell'azienda
  • Nessun contenuto scritto da una persona

Il file è identico attraverso diversi tipi di sito web.

Risultato: Senza il boilerplate Wix, il tasso svizzero di adozione di llms.txt scende dal 15,2% al 10,1%. Ogni terzo file llms.txt in Svizzera è generato da una piattaforma e non fornisce ai sistemi di IA indicazioni specifiche dell'azienda.

I dati di adozione dovrebbero indicare separatamente il boilerplate Wix, poiché questi file non contengono contenuto aziendale individuale.

Cosa appartiene a una buona llms.txt

Una buona llms.txt descrive in poche frasi cosa fa l'azienda, quali servizi offre e per quale regione è rilevante. Un file di questo tipo può dare ai sistemi di IA ulteriori indicazioni per classificare un sito web. I 147'168 file non riconosciuti come automatici possono contenere tali indicazioni specifiche dell'azienda. Il 10,1% resta un valore basso.

4. Dati strutturati: cosa viene marcato?


I dati strutturati rendono un sito web leggibile dalle macchine. Esaminiamo tre formati: JSON-LD (blocchi incorporati application/ld+json, oggi lo standard), Microdata (attributi itemtype nell'HTML) e RDFa (vocab). Tutti e tre usano il vocabolario Schema.org per descrivere contenuti, dall'indirizzo aziendale all'offerta di prodotto.

Il 25,2% dei siti web analizzabili utilizza almeno uno di questi formati. Quali tipi vengono effettivamente marcati?

Qualità: generico vs rilevante per il business

Dei 369'375 siti web con dati strutturati, 363'372 hanno potuto essere categorizzati in base ai loro tipi Schema. Questi tipi sono stati suddivisi in tre gruppi: generico, contestuale e rilevante per il business.

58,4%
Solo tipi generici
30,7%
Tipi contestuali
10,9%
Rilevante per il business
Generico (automazione CMS)
212'092
Contestuale (Article, Person, ...)
111'607
Rilevante per il business (LocalBusiness, Offer, FAQ)
39'673

Generico: WebSite, WebPage, SearchAction, BreadcrumbList e altri - inseriti automaticamente da plugin CMS. Contestuale: PostalAddress, Article, Person - utile, ma non specifico per il business. Rilevante per il business: LocalBusiness, Offer, FAQ, Product, Review, Event - tipi che forniscono indicazioni concrete su aziende, offerte, prodotti, recensioni o eventi.

Tutti i tipi Schema in dettaglio

WebSite
250'986
WebPage
235'962
SearchAction
189'313
Organization
186'343
ImageObject
175'753
ListItem
170'089
BreadcrumbList
169'579
EntryPoint
136'427
ReadAction
129'382
PropertyValueSpecification
110'357
PostalAddress
49'245
Article
43'813

I tipi principali: WebSite (250'986), WebPage (235'962), SearchAction (189'313) vengono inseriti automaticamente da plugin WordPress come Yoast e RankMath. Forniscono solo informazioni specifiche dell'azienda limitate.

I tipi Schema rilevanti per il business sono rari: LocalBusiness solo 18'284 occorrenze, Offer solo 10'567 occorrenze.

Conclusione: Come per llms.txt, il numero totale da solo sovrastima il valore aziendale del markup. Il 25,2% ha dati strutturati, ma solo il 10,9% di questi (2,7% di tutti i siti web analizzabili) contiene markup con informazioni concrete su azienda, offerta o sede.

5. Distribuzione dei CMS in Svizzera


Quali sistemi di gestione dei contenuti utilizzano i siti web svizzeri? Nella maggioranza non è stato riconosciuto alcun CMS.

Nessun CMS riconosciuto
60,3%
WordPress (totale)
25,6%
Wix
5,7%
TYPO3
2,4%
Joomla
1,6%
Squarespace
1,1%
Webflow
0,8%
Contao
0,7%
Drupal
0,6%
Shopify
0,5%
Weebly
0,4%

Quota su 1'463'577 siti web analizzati. Riconoscimento CMS tramite meta tag generator e pattern HTML.

Siti web senza CMS riconosciuto

60,3% (883'059 siti web) funzionano senza CMS riconoscibile. Possono includere pagine HTML statiche, custom build, domini parcheggiati o sistemi non riconosciuti.

WordPress domina i CMS riconosciuti

Dei 580'518 siti web con CMS riconoscibile, 64,6% usano WordPress, due su tre. In numeri assoluti: 374'841 siti web.

WordPress Core
224'745
+ Elementor
116'823
+ Divi
33'273

116'823 siti web WordPress utilizzano Elementor come page builder (31,2% di tutti i siti WP), 33'273 usano Divi (8,9%). Insieme, oltre il 40% dei siti WordPress svizzeri punta su un page builder visivo invece che sull'editing standard.

Specificità DACH

TYPO3 con 35'295 siti web (2,4%) e Contao con 7'690 (0,5%) sono CMS dell'area germanofona, poco diffusi a livello internazionale. In Svizzera occupano il 3° e il 9° posto. I CMS germanofoni sono quindi più presenti in Svizzera di quanto lascerebbe supporre la loro quota di mercato internazionale.

6. E-commerce: WooCommerce domina


WooCommerce
129'427
Shopify
8'309
PrestaShop
3'794
Magento
2'283

WooCommerce è stato riconosciuto circa 16 volte più spesso di Shopify. 129'427 negozi WooCommerce si contrappongono a 8'309 negozi Shopify. Il rapporto differisce nettamente dagli Stati Uniti o dal Regno Unito, dove Shopify è più diffuso.

Perché? WooCommerce è un plugin WordPress - e WordPress è il CMS standard svizzero. Lo studio non misura la causa; sono plausibili installazioni WordPress esistenti, preferenze delle agenzie e requisiti di hosting o controllo dei dati.

PrestaShop segue con 3'794 negozi riconosciuti.

7. Basi SEO


Elementi SEO di base come Title, Meta-Description, Canonical e Hreflang sono da tempo standard web consolidati. Ciononostante mancano sulla maggioranza dei siti web analizzabili.

Tag Title
82,9%
Meta-description
43,8%
URL canonico
38,6%
Open Graph
35,0%
Hreflang
10,7%

Meta-description mancanti

Il 56,2%, più della metà, non ha una meta-description. La meta-description appare direttamente nel risultato di ricerca Google. Senza meta-description, i sistemi di ricerca scelgono autonomamente il testo descrittivo mostrato; questo può essere meno preciso di una descrizione formulata dal gestore del sito web. Solo il 22,7% si trova nell'intervallo di lunghezza ottimale.

Nessuna
822'447
Troppo breve (<70)
163'222
Ottimale (70-160)
332'535
Troppo lunga (>160)
145'980

Struttura H1

34,3%
Esattamente 1 H1 (corretto)
55,9%
Nessun H1
9,7%
Più H1

818'620 siti web non hanno un solo titolo H1. Altri 142'252 ne hanno più di uno, il che diluisce la gerarchia. Solo un sito su tre ha esattamente un H1, la struttura raccomandata fin dagli inizi del web.

Tag Title: la lunghezza decide

Nessun Title
250'535
Troppo breve (<30)
580'529
Ottimale (30-60)
445'015
Troppo lungo (>60)
187'498

Solo 445'015 siti web (30,4%) hanno un tag Title nella lunghezza ottimale di 30-60 caratteri. 580'529 sono troppo corti, spesso solo il nome dell'azienda senza contesto. Google può accorciare Title superiori a 60 caratteri; 187'498 siti web ne sono interessati.

Hreflang: multilinguismo nel codice

I siti web multilingue possono utilizzare hreflang per indicare versioni linguistiche e regionali. Solo il 10,7% dei siti web analizzabili utilizza tag hreflang.

L'89,3% dei siti web analizzabili non utilizza questo segnale.

9. Lingue: chi parla cosa?


Quale lingua dichiarano i siti web svizzeri nell'attributo HTML lang?

de
34,4%
en
9,4%
de-CH
8,6%
fr-FR
5,9%
fr
5,9%
de-DE
3,9%
en-US
2,9%
de-de
1,7%
it-IT
0,8%
de-ch
0,7%
it
0,6%
en-GB
0,6%
fr-CH
0,4%
fr-fr
0,3%
de-AT
0,2%

Quota dei siti web con attributo lang. Molti siti web non impostano alcun attributo lang e non sono quindi inclusi qui.

"de" invece di "de-CH"

La dichiarazione linguistica più frequente è de (tedesco generico) con il 34,4%, quattro volte più frequente di de-CH (8,6%). Molti siti web con dichiarazione linguistica tedesca si presentano linguisticamente come "tedeschi", non come "svizzeri". Manca così un segnale esplicito per varianti linguistiche regionali.

L'inglese davanti allo svizzero tedesco

L'inglese (en: 9.4%) è la seconda lingua più frequente, ancora prima di de-CH. Questo mostra l'orientamento internazionale di molte aziende svizzere, ma anche: chi pubblica solo in inglese non imposta alcun segnale esplicito per varianti linguistiche locali.

Francese (fr + fr-FR insieme: 11,8%): le dichiarazioni linguistiche francesi appaiono meno spesso di quanto lascerebbe supporre la quota di popolazione della Romandia; senza attribuzione regionale non se ne può tuttavia dedurre una sottorappresentazione diretta.

10. Tecnologia server


Quali server web gestiscono i siti web svizzeri? L'intestazione HTTP Server lo rivela.

Apache
30,5%
nginx
30,1%
Cloudflare
5,8%
Pepyaka (Wix)
5,6%
OpenResty
4,0%
LiteSpeed
2,3%

L'11,9% dei siti web non indica alcuna intestazione Server (nascosto dietro CDN, proxy o altra infrastruttura).

Apache e nginx dominano il mercato svizzero dei server web: Apache con il 30,5%, nginx con il 30,1%. Insieme sono dietro al 60,6% di tutti i siti web analizzabili.

Cloudflare con il 5,8% è l'indicazione CDN/reverse proxy più frequente nell'intestazione Server. Pepyaka (5,6%) è il server proprietario di Wix. Il numero è vicino alla quota CMS di Wix.

LiteSpeed appare nel 2,3% dei siti web analizzabili. Microsoft IIS appare nell'1,0%.

11. Infrastruttura


80,9%
HTTPS
77,5%
Compatibile con mobile
652 ms
Tempo medio di risposta

Utilizzo di HTTPS

L'80,9% dei siti web utilizza HTTPS, ma il 19,1% nel 2026 è ancora non cifrato. 279'309 siti web non utilizzano HTTPS. I browser possono contrassegnare le pagine HTTP come non sicure.

Basi mobile: meta tag viewport

Il 22,5% dei siti web non ha un meta tag viewport, un segnale di base per la visualizzazione responsive. 329'372 siti web possono essere visualizzati in modo errato sui dispositivi mobili.

Velocità: media di 652 ms

Il tempo medio di risposta è di 652 millisecondi (Time to First Byte). Questo è il valore puro del server, senza rendering, immagini o JavaScript. Un TTFB inferiore a 200 ms è considerato veloce. 652 ms indica una miscela di server che rispondono rapidamente e lentamente.

12. Conclusione


Lo Studio web svizzero mostra che il web svizzero è ancora insufficientemente preparato alla ricerca con IA. Molti siti web .ch sono online e raggiungibili, ma nell'HTML lasciano aperto chi sta dietro al sito, cosa viene offerto e come i crawler dovrebbero gestire i contenuti.

Questo diventa particolarmente evidente nelle basi. Il 56,2% dei siti web analizzabili non ha meta-description, il 55,9% non ha titolo H1 e il 22,5% non ha meta tag viewport. Solo il 25,2% utilizza dati strutturati; tipi Schema rilevanti per il business come LocalBusiness o Offer arrivano addirittura solo al 2,7% di tutti i siti web analizzabili.

Anche la gestione dei crawler IA è poco consolidata. Il 97,9% dei siti web analizzabili non contiene un blocco robots.txt esplicito per i crawler IA esaminati. Anche una llms.txt senza automazione riconosciuta resta rara con il 10,1%. Questo non significa che questi siti web siano automaticamente scadenti o ignorati dai sistemi di IA. Mostra però che molti siti web svizzeri strutturano finora poco attivamente la loro visibilità e il loro utilizzo nel web dell'IA.

Lo studio non valuta singole aziende e non misura come i sistemi di IA ponderino queste caratteristiche. Mostra però una lacuna nel web svizzero: molti siti web rinunciano a indicazioni semplici che motori di ricerca e crawler IA possono leggere in modo affidabile.

13. Domande frequenti


Che cosa misura lo Studio web svizzero?

Lo studio misura caratteristiche tecniche nell'HTML, nel robots.txt e nella llms.txt dei siti web .ch. Ne fanno parte dati strutturati, elementi SEO di base, riconoscimento CMS, regole per crawler IA e infrastruttura.

Che cosa non misura lo studio?

Lo studio non misura come singoli sistemi di IA ponderino questi segnali, se citino effettivamente un sito web o quanto sia buono il contenuto di un sito web.

Perché il denominatore è 1'463'577 e non 2'459'124?

Dei 2'459'124 domini scansionati, solo 1'463'577 hanno fornito una risposta valutabile (HTTP 200 con HTML). Il resto era inattivo, difettoso o non raggiungibile. Tutte le percentuali si riferiscono a questi 1'463'577 siti web analizzabili.

Che cosa conta come llms.txt non riconosciuta automaticamente?

Lo scanner riconosce llms.txt generate da Wix sulla base di due firme. Tutti gli altri file llms.txt sono considerati non riconosciuti automaticamente. Altre forme di generazione automatica (per es. tramite plugin WordPress) non sono state rilevate separatamente.

Un meta tag viewport mancante significa che un sito web non funziona su mobile?

Non necessariamente. Il meta tag viewport è un segnale di base per la visualizzazione responsive, ma un sito web può essere utilizzabile su dispositivi mobili anche senza questo tag. Lo studio misura la presenza del tag, non la visualizzazione mobile effettiva.

Che cosa conta come blocco di crawler IA?

Conta solo un blocco completo tramite Disallow: / per uno dei dieci crawler IA esaminati nel robots.txt. Blocchi parziali o blocchi tramite altri meccanismi non vengono rilevati.

14. Metodologia


Fonte datiFile di zona .ch di SWITCH
Domini scansionati2'459'124
Domini attivi1'742'537
Analizzati (HTTP 200 con HTML valutabile)1'463'577 (HTTP 200)
Denominatore per le percentuali1'463'577 siti web analizzabili
Metodo di scansioneaiohttp + aiodns, nessun rendering JavaScript
Punti dati per sito web40

Fonte dati: Tutti i domini .ch dal file di zona SWITCH (DNS Zone Transfer, AXFR con chiave TSIG, richiamato il 12 aprile 2026). SWITCH gestisce tutti i domini .ch della Svizzera.

Scanner: Scanner Python asincrono (aiohttp + aiodns) con 40 punti dati per dominio. Scansiona homepage, robots.txt, llms.txt e pagine note legali/protezione dei dati. Nessun rendering JavaScript. Analisi HTML pura. Richieste concorrenti: 50, timeout: 8 secondi.

Riconoscimento dei crawler IA: 10 crawler IA specifici vengono cercati nel robots.txt: GPTBot, ClaudeBot, CCBot, Google-Extended, Anthropic, ByteSpider, ChatGPT-User, AmazonBot, Cohere-AI, Meta-ExternalAgent. Solo Disallow: / conta come blocco.

Classificazione llms.txt: La generazione automatica Wix viene riconosciuta sulla base di due firme: "powered by Wix" e "/_api/mcp" nel contenuto del file. Tutti gli altri file llms.txt sono considerati non riconosciuti automaticamente. Questi file possono contenere ulteriori forme di generazione automatica non rilevate.

Riconoscimento CMS: Via <meta name="generator"> e pattern HTML (wp-content, data-drupal, wix.com, ecc.). Riconosciute 14+ piattaforme, incluse varianti page builder (Elementor, Divi).

Ambito: 2'459'124 domini scansionati. 1'463'577 analizzati con HTTP 200 e HTML valutabile. Tutte le percentuali si riferiscono ai 1'463'577 siti web analizzabili con HTTP 200 come denominatore.

Limiti dell'analisi

  • Lo scanner analizza HTML senza rendering JavaScript. I siti web che caricano contenuti solo tramite JavaScript vengono rilevati in modo incompleto.
  • Il riconoscimento CMS si basa su meta tag generator e pattern HTML. I CMS senza queste caratteristiche non vengono riconosciuti.
  • I file llms.txt generati da Wix vengono riconosciuti tramite le firme "powered by Wix" e "/_api/mcp". Altri file llms.txt generati automaticamente non vengono classificati come tali.
  • Il blocco dei crawler IA conta solo se un crawler IA menzionato viene bloccato nel robots.txt con Disallow: /. I blocchi parziali non vengono rilevati.
  • Lo studio misura la presenza di caratteristiche tecniche. Non misura come singoli sistemi di IA ponderino o utilizzino queste caratteristiche.
  • I banner cookie caricati solo dopo l'esecuzione di JavaScript non sono stati rilevati.
  • L'assenza di un CMS riconosciuto non significa necessariamente che non venga utilizzato alcun CMS.

Open source: Il codice completo dello scanner è disponibile pubblicamente su GitHub. Il codice consente una verifica metodologica e la ripetizione della scansione.

Citazione:

Hadorn, P. (2026). Studio web svizzero (primavera 2026): Preparazione all'IA e inventario tecnico di 2'459'124 domini .ch. KI-Barometer.ch.
https://ki-barometer.ch/it/studio-web-svizzero/

Dati e riproducibilità

File di zonaSWITCH (registro .ch), richiamato il 12 aprile 2026 via AXFR
Codice dello scannergithub.com/peterhadorn/swiss-web-report (Open Source)
Periodo di scansionedal 15 al 20 aprile 2026
Domini scansionati2'459'124
Analizzabile1'463'577 (HTTP 200)
DenominatoreTutte le percentuali si riferiscono a 1'463'577 siti web analizzabili
Dati pubbliciRisultati aggregati su questa pagina
Non pubblicodati grezzi a livello di dominio (Protezione dei dati)
Domande metodologiche

Correzioni & contatto

Indicazioni su errori metodologici, informazioni contestuali mancanti o proposte di correzione: . Le correzioni inviate vengono verificate e, se rilevanti, integrate nello studio.