Η Google παρουσιάζει το Gemini 2.5 Flash Image

SHARE IT

28 Αυγούστου 2025

Η Google ανακοίνωσε επίσημα το Gemini 2.5 Flash Image, το πιο προηγμένο μοντέλο δημιουργίας και επεξεργασίας εικόνας που έχει παρουσιάσει μέχρι σήμερα. Το νέο σύστημα, το οποίο δοκιμάστηκε εσωτερικά με την κωδική ονομασία “nano-banana”, φιλοδοξεί να αλλάξει τους κανόνες του παιχνιδιού στον χώρο της τεχνητής νοημοσύνης, συνδυάζοντας ρεαλισμό με δημιουργική ευελιξία.

Σε αντίθεση με προηγούμενα μοντέλα, που συχνά εντυπωσίαζαν αισθητικά αλλά υστερούσαν σε ακριβή κατανόηση του πραγματικού κόσμου, το Gemini 2.5 Flash Image υπόσχεται να προσφέρει και τα δύο. Όπως αναφέρει το LMArena, το σύστημα έχει ήδη κατακτήσει την κορυφή της παγκόσμιας κατάταξης στα μοντέλα επεξεργασίας εικόνας, ξεπερνώντας ανταγωνιστές όπως το GPT Image 1 της OpenAI και το Flux.1 Kontext.

Η Google αποδίδει την υπεροχή του μοντέλου στη βαθύτερη γνώση του κόσμου που διαθέτει η οικογένεια Gemini, στοιχείο που επιτρέπει τη δημιουργία εικόνων με περισσότερη συνέπεια και ακρίβεια. Εκεί όπου άλλα συστήματα ενδεχομένως να παρουσίαζαν ανακρίβειες ή ασυνέχειες, το Gemini 2.5 Flash Image καταφέρνει να ισορροπεί τη δημιουργικότητα με τη σαφήνεια.

Η ιδιαιτερότητα της νέας ανακοίνωσης βρίσκεται στο ότι η Google δεν στοχεύει μόνο στους επαγγελματίες αλλά και στο ευρύ κοινό.

Οι προγραμματιστές μπορούν να αποκτήσουν πρόσβαση στο μοντέλο μέσω του Gemini API, του Google AI Studio και του Vertex AI, που απευθύνεται σε επιχειρήσεις μεγάλης κλίμακας. Η τιμή έχει οριστεί στα 30 δολάρια ανά 1 εκατομμύριο output tokens, ποσό που μεταφράζεται σε περίπου 0,039 δολάρια ανά εικόνα. Με αυτή την τιμολόγηση, η Google επιχειρεί να καταστήσει τις προηγμένες δυνατότητες δημιουργικής τεχνητής νοημοσύνης πιο προσιτές.

Για τους απλούς χρήστες, το μοντέλο ενσωματώνεται στις web και mobile εφαρμογές του Gemini. Έτσι, χωρίς καμία τεχνική γνώση, οποιοσδήποτε μπορεί να πειραματιστεί με την παραγωγή και την επεξεργασία εικόνων με λίγα μόνο κλικ.

Κατά την παρουσίαση, η Google παρουσίασε μια σειρά από παραδείγματα για το πώς μπορεί να αξιοποιηθεί το Gemini 2.5 Flash Image στην καθημερινότητα:

Αλλαγές εμφάνισης και σκηνικού: Μεταφόρτωσε μια φωτογραφία ενός ανθρώπου ή κατοικιδίου και το σύστημα θα διατηρήσει τα χαρακτηριστικά του σταθερά, τοποθετώντας τον σε νέα περιβάλλοντα ή με διαφορετικά ρούχα.
Συνδυασμός φωτογραφιών: Η δυνατότητα να ενώσεις πολλές εικόνες σε μία νέα σύνθεση. Για παράδειγμα, μια φωτογραφία σου μαζί με το σκυλί σου μπορεί να μετατραπεί σε ενιαίο πορτρέτο πάνω σε ένα γήπεδο μπάσκετ.
Πολυβηματική επεξεργασία: Μπορείς να επεξεργάζεσαι διαδοχικά μια εικόνα. Ξεκίνα με ένα άδειο δωμάτιο, χρωμάτισε τους τοίχους, πρόσθεσε βιβλιοθήκες, έπιπλα ή έναν καναπέ μέχρι να ολοκληρώσεις τη σκηνή.
Μεταφορά σχεδίων και υφών: Εφάρμοσε το στυλ μιας εικόνας σε αντικείμενα μιας άλλης. Για παράδειγμα, πάρε την υφή από πέταλα λουλουδιών και μεταμόρφωσε ένα ζευγάρι μπότες βροχής ή σχεδίασε ένα φόρεμα με το μοτίβο από φτερά πεταλούδας.

Σε μια εποχή όπου η τεχνητή νοημοσύνη στην εικόνα προκαλεί ανησυχίες γύρω από την αυθεντικότητα και την παραπληροφόρηση, η Google τονίζει ότι δεν χρησιμοποιεί τις εικόνες που ανεβάζουν οι χρήστες για εκπαίδευση των μοντέλων της, εκτός εάν δοθούν ρητά ως feedback.

Παράλληλα, κάθε εικόνα που παράγεται μέσω της εφαρμογής Gemini θα φέρει δύο είδη υδατοσήμων: ένα ορατό και ένα αόρατο, μέσω της τεχνολογίας SynthID. Στόχος είναι να διασφαλιστεί ότι η προέλευση του περιεχομένου θα είναι πάντα αναγνωρίσιμη, μειώνοντας τον κίνδυνο παραπλανητικής χρήσης.

Η κίνηση αυτή τοποθετεί τη Google σε πλεονεκτική θέση στον σκληρό ανταγωνισμό της γενετικής τεχνητής νοημοσύνης. Ενώ εταιρείες όπως η OpenAI και η Stability AI έχουν ήδη παρουσιάσει εντυπωσιακές εξελίξεις, η Google προβάλλει το Gemini 2.5 Flash Image ως το πρώτο μοντέλο που συνδυάζει με συνέπεια αισθητική ποιότητα και ακριβή κατανόηση του πραγματικού κόσμου.

Η μεγάλη πρόκληση είναι πώς θα υιοθετηθεί το μοντέλο στην πράξη. Οι προγραμματιστές μπορούν να το ενσωματώσουν σε εφαρμογές, παιχνίδια και πλατφόρμες, ενώ οι καταναλωτές μπορούν να το χρησιμοποιούν για να φτιάχνουν προσωπικά έργα ή να πειραματίζονται με νέες ιδέες.

Δες τα όλα

Η Google παρουσιάζει το Gemini 2.5 Flash Image

Spotify: Δωρεάν ψηφιακή ομπρέλα προστασίας για νεαρούς ακροατές χωρίς συνδρομή

Οι Big Tech στο στόχαστρο καθώς οι αρχές απαιτούν την πλήρη εξάλειψη των AI nudify apps

Η Meta επιστρατεύει την AI για να ειδοποιεί τους γονείς για συζητήσεις εφήβων περί αυτοτραυματισμού