La prossima generazione di generatori di testo in immagine supportati dall’intelligenza artificiale è arrivata, con MediaTek in prima linea. Al Mobile World Congress (MWC 2024) in corso a Barcellona, ​​​​in Spagna, l’azienda di semiconduttori con sede a Taiwan ha presentato un imager AI integrato nel dispositivo in grado di generare immagini alla stessa velocità con cui si digita. La tecnologia è stata presentata in un prototipo di smartphone dotato del SoC Dimensity 9300 di MediaTek basato su 4 nm. L’azienda spera che i suoi chipset di futura generazione consentano capacità di intelligenza artificiale simili, rendendo la tecnologia disponibile alle masse.

Come funziona l’imager AI sul dispositivo MediaTek?

Se hai familiarità con i generatori di testo e immagini più diffusi, il funzionamento è più o meno lo stesso. Strumenti, tra cui Microsoft Copilot (in precedenza Bing AI), Mindjourney, Dall-E e Adobe Firefly, consentono agli utenti di creare immagini elaborate basate su un semplice input di testo. Le immagini sono valide tanto quanto le loro istruzioni e il processo di generazione richiede solitamente un minuto o due. Inoltre, non c’è modo di sapere come l’imager AI legge gli input fino all’arrivo dell’output finale.

D’altra parte, MediaTek ha dimostrato un processo di generazione di immagini in tempo reale. Significa che puoi osservare l’output dello strumento mentre digiti. Ad esempio, quando digiti “Spider-Man” lo strumento genera immediatamente le immagini corrispondenti, fornendoti un’anteprima dell’indirizzo. Inoltre, il risultato finale viene generato immediatamente al termine della scrittura.

In altre parole, puoi vedere immediatamente se lo strumento comprende il messaggio, che si tratti di una persona, di un luogo o di un oggetto.

Come riesce MediaTek a raggiungere questo obiettivo?

Come accennato, MediaTek ha presentato la tecnologia in un prototipo di dispositivo alimentato dal SoC Dimensity 9300. Questo particolare chipset utilizza una nuova architettura APU (Accelerated Processing Unit) per incorporare un motore AI generativo migliorato per un’elaborazione più rapida e affidabile.

biblioteca multimediale

MediaTek sta inoltre sfruttando il generatore open source di testo in immagini Stable Diffusion XL Turbo per consentire agli utenti di creare immagini in un ampio catalogo. L’azienda afferma che questa è la prima implementazione di Stable Diffusion XL Turbo su un dispositivo mobile.

Che aspetto ha il futuro?

Durante il nostro test, lo smartphone MediaTek Dimensity 9300 basato su SoC ha generato immagini con semplici input di testo in pochi secondi. I risultati furono ugualmente impressionanti.

Ho anche testato lo strumento con input di testo specifici per l’India e i risultati sono stati eccezionali. Naturalmente, alcuni risultati non erano accurati al 100%, ma tieni presente che si trattava di un dispositivo prototipo. Ciò significa che il futuro sembra più luminoso e promettente, almeno per gli imager dinamici.

C’è ancora un po’ di tempo prima che gli OEM di smartphone traggano pieno vantaggio dall’APU migliorata del SoC Dimensity 9300 per sbloccare le funzionalità AI native. Il Vivo X100 è l’unico smartphone in India a disporre di questo chipset Dimensity. Tuttavia, lo smartphone non offre ancora un generatore nativo di testo in immagine.


Fonte www.91mobiles.com