ΑΝΑΖΗΤΗΣΗ
SHARE IT
Η Google ανακοίνωσε επίσημα το Gemini 2.5 Flash Image, το πιο προηγμένο μοντέλο δημιουργίας και επεξεργασίας εικόνας που έχει παρουσιάσει μέχρι σήμερα. Το νέο σύστημα, το οποίο δοκιμάστηκε εσωτερικά με την κωδική ονομασία “nano-banana”, φιλοδοξεί να αλλάξει τους κανόνες του παιχνιδιού στον χώρο της τεχνητής νοημοσύνης, συνδυάζοντας ρεαλισμό με δημιουργική ευελιξία.
Σε αντίθεση με προηγούμενα μοντέλα, που συχνά εντυπωσίαζαν αισθητικά αλλά υστερούσαν σε ακριβή κατανόηση του πραγματικού κόσμου, το Gemini 2.5 Flash Image υπόσχεται να προσφέρει και τα δύο. Όπως αναφέρει το LMArena, το σύστημα έχει ήδη κατακτήσει την κορυφή της παγκόσμιας κατάταξης στα μοντέλα επεξεργασίας εικόνας, ξεπερνώντας ανταγωνιστές όπως το GPT Image 1 της OpenAI και το Flux.1 Kontext.
Η Google αποδίδει την υπεροχή του μοντέλου στη βαθύτερη γνώση του κόσμου που διαθέτει η οικογένεια Gemini, στοιχείο που επιτρέπει τη δημιουργία εικόνων με περισσότερη συνέπεια και ακρίβεια. Εκεί όπου άλλα συστήματα ενδεχομένως να παρουσίαζαν ανακρίβειες ή ασυνέχειες, το Gemini 2.5 Flash Image καταφέρνει να ισορροπεί τη δημιουργικότητα με τη σαφήνεια.
Η ιδιαιτερότητα της νέας ανακοίνωσης βρίσκεται στο ότι η Google δεν στοχεύει μόνο στους επαγγελματίες αλλά και στο ευρύ κοινό.
Οι προγραμματιστές μπορούν να αποκτήσουν πρόσβαση στο μοντέλο μέσω του Gemini API, του Google AI Studio και του Vertex AI, που απευθύνεται σε επιχειρήσεις μεγάλης κλίμακας. Η τιμή έχει οριστεί στα 30 δολάρια ανά 1 εκατομμύριο output tokens, ποσό που μεταφράζεται σε περίπου 0,039 δολάρια ανά εικόνα. Με αυτή την τιμολόγηση, η Google επιχειρεί να καταστήσει τις προηγμένες δυνατότητες δημιουργικής τεχνητής νοημοσύνης πιο προσιτές.
Για τους απλούς χρήστες, το μοντέλο ενσωματώνεται στις web και mobile εφαρμογές του Gemini. Έτσι, χωρίς καμία τεχνική γνώση, οποιοσδήποτε μπορεί να πειραματιστεί με την παραγωγή και την επεξεργασία εικόνων με λίγα μόνο κλικ.
Κατά την παρουσίαση, η Google παρουσίασε μια σειρά από παραδείγματα για το πώς μπορεί να αξιοποιηθεί το Gemini 2.5 Flash Image στην καθημερινότητα:
Σε μια εποχή όπου η τεχνητή νοημοσύνη στην εικόνα προκαλεί ανησυχίες γύρω από την αυθεντικότητα και την παραπληροφόρηση, η Google τονίζει ότι δεν χρησιμοποιεί τις εικόνες που ανεβάζουν οι χρήστες για εκπαίδευση των μοντέλων της, εκτός εάν δοθούν ρητά ως feedback.
Παράλληλα, κάθε εικόνα που παράγεται μέσω της εφαρμογής Gemini θα φέρει δύο είδη υδατοσήμων: ένα ορατό και ένα αόρατο, μέσω της τεχνολογίας SynthID. Στόχος είναι να διασφαλιστεί ότι η προέλευση του περιεχομένου θα είναι πάντα αναγνωρίσιμη, μειώνοντας τον κίνδυνο παραπλανητικής χρήσης.
Η κίνηση αυτή τοποθετεί τη Google σε πλεονεκτική θέση στον σκληρό ανταγωνισμό της γενετικής τεχνητής νοημοσύνης. Ενώ εταιρείες όπως η OpenAI και η Stability AI έχουν ήδη παρουσιάσει εντυπωσιακές εξελίξεις, η Google προβάλλει το Gemini 2.5 Flash Image ως το πρώτο μοντέλο που συνδυάζει με συνέπεια αισθητική ποιότητα και ακριβή κατανόηση του πραγματικού κόσμου.
Η μεγάλη πρόκληση είναι πώς θα υιοθετηθεί το μοντέλο στην πράξη. Οι προγραμματιστές μπορούν να το ενσωματώσουν σε εφαρμογές, παιχνίδια και πλατφόρμες, ενώ οι καταναλωτές μπορούν να το χρησιμοποιούν για να φτιάχνουν προσωπικά έργα ή να πειραματίζονται με νέες ιδέες.
MORE NEWS FOR YOU