Modificare foto e immagini con IA in 5 secondi da Gemini AI Studio (gratis)

Aggiornato il:

La modifica dei foto e immagini tramite Intelligenza artificiale è gratuita, funziona benissimo e disponibile ora da Google AI Studio

immagine modificata con IA

Non starò qui a ripetere la solita solfa di come negli ultimi anni l’intelligenza artificiale ha fatto passi da gigante, ma in questa occasione non posso trattenere l'entusiasmo e lo stupore (in termini tecnologici) per uno strumento incredibilmente potente. Con la versione Gemini 2.0 Flash, il modello IA sviluppato da Google, è possibile modificare ogni foto o immagine in 5 secondi in modo anche radicale. Non è solo teoria, tutti possono fare prove e modificare ogni foto nei modi più fantasiosi e vari.

Gemini 2.0 Flash è una versione avanzata di un’intelligenza artificiale creata da Google. Avevamo già scritto su come accedere a Gemini 2.0 senza limitazioni per creare prompt e analisi. Adesso possiamo usarlo, gratuitamente, anche per modificare le foto.

LEGGI ANCHE: 20 Generatori da testo a immagine tramite IA, gratuiti

Hai presente quando guardi una foto e pensi: "Dovevo cambiare posizione", oppure "Come sarebbe stata questa immagine con un altro sfondo?". Bene, con l'arrivo di Gemini 2.0 Flash Image Generation, l'intelligenza artificiale entra nel mondo dell'editing fotografico in un modo incredibilmente semplice e potente.

Cos’è Gemini 2.0 Flash?

Gemini è un sistema multimodale, cioè capace di lavorare con testi, immagini e persino audio. La sua particolarità sta nel fatto che può non solo generare immagini da zero basandosi su una descrizione, ma anche modificare foto esistenti in modo semplice e intuitivo. Immagina di poter dire al computer: “Aggiungi un gatto su questa sedia” o “Cambia il colore di questa macchina” e vederlo fare in pochi secondi, senza bisogno di complicati software di grafica. Ecco, questo si può fare adesso con Gemini 2.0 Flash.

A partire da marzo 2025, questa versione sperimentale è disponibile per tutti tramite Google AI Studio, una piattaforma gratuita dove chiunque può provarla. In AI Studio, sul lato destro, selezionare Gemini 2.0 Flash (Image generation) Experimental.

Come Funziona la Modifica delle Immagini?

La vera magia di Gemini 2.0 Flash sta nella sua capacità di modificare le foto attraverso semplici comandi in linguaggio naturale. Basta caricare un'immagine, descrivere quello che si vuole fare con parole semplici, senza lunghi prompt, e l’IA lo realizza. Per fare un po' di esempi

  1. Aggiungere o rimuovere elementi: Vuoi mettere un cappello sulla testa di qualcuno in una foto? O togliere un oggetto che rovina lo sfondo? Basta dirlo: “Aggiungi un cappello rosso” o “Rimuovi quella sedia”. L’IA capisce e modifica l’immagine mantenendo il resto intatto.
  2. Cambiare colori o dettagli: Se hai una foto di un’auto blu e vuoi vederla rossa, puoi scrivere: “Rendila rossa”. Gemini non si limita a colorare a caso, ma cerca di rendere il risultato realistico, rispettando luci e ombre.
  3. Cambiare posizione ed espressione di una persona dello stesso soggetto: Prendiamo una nostra foto e chiediamo di allargare le braccia, di sorridere, di fare una faccia divertente.
  4. Cambiare abbigliamento e vestiti ad una persona: In una foto, possiamo cambiare look, vestiti, aggiungere giacche, cappelli, occhiali e quel che si vuole.
  5. Inserire testo nelle immagini: A differenza di altri strumenti, Gemini 2.0 Flash è bravo a mettere scritte nelle foto in modo chiaro e preciso. Puoi dire: “Aggiungi la parola ‘Benvenuto’ in alto” e lui lo farà senza errori o caratteri confusi.
  6. Riflessioni artistiche: Vuoi trasformare una foto in uno stile diverso? Prova a dire: “Rendila un dipinto a olio” o “Falla in stile fumetto”. L’IA può replicare stili artistici con una precisione sorprendente.
  7. Combinare due foto: Prendiamo una nostra foto, carichiamone una di un libro o di uno smartphone e poi chiediamo di combinarle; il risuiltato sarà la nostra foto con in mano quell'oggetto.

Il tutto avviene in modo conversazionale: puoi continuare a dare istruzioni passo dopo passo, come se stessi parlando con un amico. Ad esempio, prima chiedi di aggiungere un gatto, poi di farlo nero, e infine di mettergli un collare. Gemini segue il filo della conversazione senza perdere il contesto.

Inoltre, essendo gratuito (almeno nella sua versione sperimentale su Google AI Studio), è un’alternativa economica ai programmi a pagamento.

Di seguito allego l'interessante thread su X da con tanti esempi di modifiche a immagini.

Cosa lo Rende Diverso dagli Altri Strumenti?

Molti programmi di intelligenza artificiale per immagini, come DALL·E o Midjourney, sono fantastici per creare immagini da zero, ma non per modificarle. Praticamente è quasi impossibile modificare una foto mantenendo la consistenza, ossia la stessa persona, lo stesso volto, gli stessi capelli, gli stessi vestiti ecc. Avevamo già parlato di questo e la soluzione era quella di modificare foto tramite Face Swap, ossia inserendo il volto di una persona sul corpo di un'altra.

I Gemini 2.0 Flash, invece, permette di lavorare su un’immagine esistente, che sia una tua foto o qualcosa che hai generato con l’IA stessa e modificarla velocemente nel modo che si desidera. Questa flessibilità è un grande passo avanti.

Inoltre, a differenza di altri modelli che combinano un generatore di testo con uno separato per le immagini, Gemini è nativamente multimodale. In parole semplici, è un unico “cervello” che capisce sia le parole che le immagini, senza bisogno di passare da un sistema all’altro. Questo lo rende più veloce e preciso nel capire cosa vuoi.

Come Usarlo in Pratica

Proviamo a immaginare un esempio concreto. Hai una foto di un picnic con gli amici, ma si vuol aggiungere qualcosa che manca oppure si vuole eliminare una persona o un elemento di disturbo oppure si vuol cambiare scenario, luogo, sfondo. Ecco come potresti usare Gemini 2.0 Flash:

  • Vai su Google AI Studio (serve solo un account Google).
  • Carichi la foto del picnic.
  • Scrivi: “Aggiungi un palloncino blu che vola nel cielo”.
  • In pochi secondi, l’IA inserisce il palloncino in modo naturale, come se fosse sempre stato lì.
  • Non ti piace il risultato? Puoi dire: “Spostalo a sinistra” o “Fallo più grande”.
  • Dalle mie prove, se si vogliono fare molte aggiunte o modifiche, conviene eseguirle una alla volta.

Puoi anche creare una storia visiva. Scrivi: “Racconta una storia di un uccellino che impara a volare e aggiungi un’immagine per ogni scena”. Gemini genererà sia il testo che le immagini, mantenendo lo stesso stile e il soggetto coerente dall’inizio alla fine.

Limiti e Piccole Imperfezioni

Nessuno strumento è perfetto, e Gemini 2.0 Flash ha ancora molti margini di miglioramento. Essendo ancora in fase sperimentale, ha qualche difetto:

  • Qualità dopo tante modifiche: Se fai troppi cambiamenti su una stessa immagine, la qualità potrebbe calare un po’.
  • Richieste complesse: A volte fatica con istruzioni molto dettagliate o con più immagini insieme.
  • Filigrane e copyright:Si può usare Gemini per rimuovere filigrane e watermarks da foto protette (come quelle di Shutterstock), ma questo solleva problemi etici e legali. Google potrebbe aggiungere presto dei limiti per evitare abusi.
  • Filtro severo: Un altro difetto che ho trovato è la severità con cui Gemini classifica le immagini e le foto rifiutando di elaborarle perchè non appropriate anche se veramente innocenti. Questo problema si può superare a tentativi, cambiando descrizione e cercando di evitare parole che possano essere fraintese.

Questi aspetti sono comunque in fase di miglioramento, e Google sta raccogliendo feedback per perfezionare il sistema.

Un Occhio al Futuro

È probabile che questa tecnologia venga integrata in diverse piattaforme e applicazioni di Google, come ad esempio:

  • Google Foto: L'app di gestione delle foto potrebbe arricchirsi di nuove funzionalità di editing basate sull'IA.
  • Strumenti di ricerca: In futuro, potremmo essere in grado di modificare le immagini direttamente dai risultati di ricerca.
  • Nuove applicazioni e servizi: Google potrebbe lanciare nuove app o servizi dedicati alla generazione e modifica di immagini con Gemini 2.0.

Per ora, è un’ottima occasione per provare qualcosa di nuovo e vedere cosa può fare la tecnologia moderna per rendere la nostra creatività più semplice, divertente ed anche produttiva (pensiamo ai social).

Gemini 2.0 Flash Image Generation è un grande balzo in avanti nel campo dell'intelligenza artificiale applicata alla fotografia. La sua semplicità d'uso, unita alla potenza delle sue capacità, apre nuove frontiere per la creatività digitale, rendendo l'editing e la generazione di immagini accessibili a un pubblico sempre più vasto.