Apple fa progressi nell'intelligenza artificiale multimodale
I ricercatori Apple hanno sviluppato nuovi metodi per addestrare modelli linguistici su larga scala (LLM) utilizzando sia testo che immagini. Questa scoperta potrebbe rappresentare un significativo passo avanti nel campo dell'intelligenza artificiale e aprire nuove possibilità per i futuri prodotti Apple.
Per coloro che non lo sapessero, l'AI multimodale si occupa della combinazione di diverse modalità di input e output, come immagini, testo, suono e video, per migliorare la comprensione e le capacità di ragionamento dei sistemi di intelligenza artificiale. Il documento di ricerca "MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training" dimostra come un'attenta combinazione di dati di addestramento e architetture di modelli possa portare a prestazioni superiori in…