Indice
Introduzione
L’ondata di agenti AI capaci di interagire con applicazioni web apre possibilità enormi, ma mette a rischio uno dei principi fondanti di Internet: il controllo degli sviluppatori sui propri prodotti. Senza regole condivise, gli LLM analizzano il DOM in modo fragile, costoso e imprevedibile, automatizzando interazioni senza che chi ha scritto la pagina possa dire la sua.
Per evitare un web governato da automazioni opache, Microsoft e Google hanno proposto WebMCP (Web Machine Context Protocol), estensione del Model Context Protocol pensata per il browser. L’obiettivo è semplice ma ambizioso: riportare trasparenza, prevedibilità e governance nelle mani di chi sviluppa.
Il problema del DOM
Gli agenti AI oggi devono “indovinare” come muoversi dentro una pagina. Analizzano il DOM, interpretano etichette, pulsanti e form, tentando di dedurre azioni e parametri. Questo approccio è fragile: basta una modifica grafica per far crollare l’interazione. È anche inefficiente, perché richiede al modello di elaborare grandi quantità di markup e testo.
Per le imprese questo significa agenti lenti, costosi da eseguire e difficili da portare in produzione con affidabilità.
Cos’è WebMCP
WebMCP introduce un contratto esplicito, dichiarato direttamente nella pagina con JavaScript, che descrive quali azioni un agente può eseguire e come. In pratica, ogni funzione esposta diventa un tool dotato di:
- descrizione in linguaggio naturale: spiega all’agente a cosa serve il tool;
- schema dei parametri: definisce input e output attesi;
- contesto di esecuzione: specifica quando e come può essere invocato.
Il risultato è che una pagina web diventa a tutti gli effetti un “MCP server” lato client, senza dover costruire un backend dedicato.
Un approccio human-in-the-loop
WebMCP non punta solo a semplificare il lavoro degli agenti, ma a favorire la collaborazione uomo-AI. In scenari come l’assistenza clienti, il supporto alle decisioni o la gestione documentale, un utente umano e un agente possono condividere la stessa interfaccia e lavorare sullo stesso contesto.
Questo apre la strada a un nuovo tipo di workflow: non più agenti che operano in silos, ma sistemi in cui le azioni dell’AI restano visibili, prevedibili e controllabili.
Benefici per sviluppatori e imprese
L’introduzione di WebMCP porta vantaggi tangibili su più livelli:
- Efficienza: l’agente non deve più processare l’intero DOM ma può leggere direttamente i tools disponibili.
- Prevedibilità: le azioni sono definite dagli sviluppatori, riducendo l’incertezza.
- Sicurezza: l’AI resta confinata a un set di operazioni deliberate, abbattendo il rischio di comportamenti imprevisti.
- Time-to-market: non serve costruire API parallele; i tools vivono già nel front-end.
- Accessibilità: la stessa logica che aiuta gli agenti AI può supportare tecnologie assistive, rendendo le interfacce più inclusive.
Per un CTO o un Tech CEO, significa avere finalmente un approccio standard per introdurre agenti AI nei processi digitali senza sacrificare governance e sicurezza.
Le implicazioni strategiche
Patrick Brosset (Mozilla) ha sottolineato un rischio concreto: senza uno standard di questo tipo, gli sviluppatori rischiano di essere esclusi dal ciclo, con agenti che automatizzano interazioni a loro insaputa. WebMCP invece ribalta la prospettiva: gli sviluppatori tornano protagonisti, definendo esattamente ciò che gli agenti possono e non possono fare.
In prospettiva, questo può cambiare il modo in cui pensiamo al web: non più solo un luogo per utenti umani, ma un ambiente progettato per ospitare anche agenti intelligenti – senza rinunciare a trasparenza e responsabilità.
Conclusione
WebMCP è ancora in fase di proposta, ma il fatto che nasca da un’iniziativa congiunta di Microsoft e Google lo rende qualcosa di più di un semplice esperimento accademico. È un segnale forte: il futuro del web non sarà un far west di automazioni incontrollate, ma un ecosistema dove agenti e sviluppatori coesistono sotto regole chiare.
Per chi guida la tecnologia in azienda, la lezione è chiara: l’AI non può essere adottata senza governance. WebMCP mostra una strada concreta per bilanciare autonomia degli agenti e controllo umano.