Vai al contenuto

Agenti specializzati

Jarvis non è un modello monolitico: è un team di agenti specializzati orchestrati da LangGraph.

Tipi di agenti

Desktop Agent

Vive su laptop/desktop. Espone:

  • filesystem e shell
  • automazioni IDE
  • monitoring di processi
  • esecuzione codice in sandbox

Mobile Agent

App nativa iOS/Android.

  • notifiche contestuali
  • GPS / geofencing
  • fotocamera per analisi visiva
  • pipeline vocale

Watch Agent

Wear OS / WatchKit / InfiniTime / Bangle.js.

  • HR, HRV, sleep tracking
  • wake-word on-device
  • notifiche rapide e gesture

Browser Agent

Estensione browser + automazione web headless (Playwright).

  • riempimento form
  • estrazione dati
  • screenshot e analisi visiva
  • esecuzione di flussi multi-step

Voice Agent

Pipeline vocale unificata.

  • Wake-word: Porcupine, openWakeWord
  • STT: faster-whisper, Vosk
  • TTS: Piper, Coqui TTS
  • Intent recognition: Pydantic AI

Glasses Agent

Brilliant Frame, MentraOS, XREAL.

  • overlay informativi
  • riconoscimento ambientale
  • comandi vocali silenziosi (sub-vocal)

VR Agent

Quest, Valve Index, Pico, Varjo via OpenXR + Monado.

  • ambienti immersivi
  • avatar conversazionale 3D
  • controllo gestuale e gaze tracking

Holo Agent

Looking Glass, Voxon.

  • presenza ambientale
  • visualizzazioni 3D di dati
  • compagno olografico

Medical Agent

Federazione di wearable medicali.

  • ingestion via Oura, Whoop, Polar, Garmin, Withings, Dexcom
  • aggregazione via Open Wearables
  • normalizzazione FHIR R4/R5
  • alerting basato su soglie biometriche

Scraping Agent

Web scraping intelligente.

  • crawling con Crawl4AI
  • knowledge base con Firecrawl
  • estrazione strutturata con ScrapeGraphAI
  • citazione delle fonti

Comunicazione cross-agent

Gli agenti si parlano usando due protocolli emergenti aperti:

  • MCP (Model Context Protocol — Anthropic)
  • A2A (Agent-to-Agent — Google, aperto da aprile 2025)

LangGraph v1.0 supporta entrambi nativamente.

Stack di orchestrazione

flowchart LR
    USER[Utente] --> ROUTER[Router]
    ROUTER --> LG[LangGraph]
    LG --> A1[Web search agent]
    LG --> A2[Medical agent]
    LG --> A3[Voice agent]
    LG --> A4[Browser agent]
    A1 --> MEM[mem0]
    A2 --> MEM
    A3 --> MEM
    A4 --> MEM
    MEM --> QDRANT[(Qdrant)]