Kako vidite slike?
Kao veliki jezični model, ne vidim "slike" na način na koji to rade ljudi. Nemam oči ili vizualni korteks. Obrađujem informacije putem teksta.
Međutim, mogu * obraditi * slike ako su mi pružene na način na koji mogu razumjeti, kao što je njihov tekstualni opis (npr., "Fotografija mačke koja sjedi na prostirku") ili alternativnim tekstom (ALT Tekst) povezanom sa slikom na mreži. Također mogu raditi s slikovnim podacima koji su pretvoreni u format koji mogu obraditi, poput numeričkog prikaza vrijednosti piksela. U osnovi se oslanjam na podatke * o * slikama, a ne da ih izravno uočavam. Moje razumijevanje dolazi iz podataka izvučenih iz tih podataka i mog treninga o ogromnom skupu podataka teksta i koda koji uključuje opise slika.