DALL-E 3: Η OpenAI ανακοίνωσε τη νέα έκδοση του εργαλείου μετατροπής κειμένου σε εικόνα

DALL-E 3: Η OpenAI ανακοίνωσε τη νέα έκδοση του εργαλείου μετατροπής κειμένου σε εικόνα

SHARE IT

21 Σεπτεμβρίου 2023

Η OpenAI αποκάλυψε πρόσφατα μια βελτιωμένη έκδοση του DALL-E, του εργαλείου μετατροπής κειμένου σε εικόνα, το οποίο συνδυάζει το ChatGPT, το δημοφιλές chatbot τεχνητής νοημοσύνης της OpenAI, για να μειώσει τον κόπο της σύνταξης μιας περιγραφής.

Η πλειονότητα των σύγχρονων τεχνολογιών παραγωγής εικόνων με τεχνητή νοημοσύνη δέχεται υποδείξεις, όπως περιγραφές φωτογραφιών, και δημιουργεί έργα τέχνης από αυτές σε διάφορα στυλ, από το φωτορεαλιστικό έως το ευφάνταστο. Αλλά η δημιουργία της ιδανικής περιγραφής μπορεί να είναι δύσκολη, σε σημείο που η "μηχανική περιγραφών" αναδύεται ως νόμιμο επάγγελμα.

Το DALL-E 3, ένα νέο εργαλείο από την OpenAI, αξιοποιεί το ChatGPT για να βοηθήσει στη συμπλήρωση των περιγραφών. Μέσω του ChatGPT, οι πελάτες των κορυφαίων πακέτων ChatGPT της OpenAI, ChatGPT Plus και ChatGPT Enterprise, μπορούν να υποβάλουν ένα αίτημα εικόνας και να το βελτιώσουν μέσω συζητήσεων με το chatbot, λαμβάνοντας τα αποτελέσματα απευθείας στην εφαρμογή συνομιλίας.

Ένα αίτημα μόλις λίγων λέξεων μπορεί να βελτιωθεί από το ChatGPT για να γίνει πιο λεπτομερές και να δώσει στο μοντέλο DALL-E 3 πρόσθετη κατεύθυνση.

Το DALL-E 3 εισάγει περισσότερα από την ενσωμάτωση του ChatGPT. Σύμφωνα με την OpenAI, το DALL-E 3 παράγει επίσης εικόνες υψηλότερης ποιότητας και μεγαλύτερης ακρίβειας όταν ανταποκρίνεται σε μεγαλύτερες οδηγίες. Επιπλέον, χειρίζεται υλικό όπως το κείμενο και τα ανθρώπινα χέρια καλύτερα από τις προηγούμενες εκδόσεις των μοντέλων παραγωγής εικόνων.

Επιπλέον, σύμφωνα με την OpenAI, το DALL-E 3 διαθέτει νέες τεχνικές για τη μείωση της αλγοριθμικής προκατάληψης και την αύξηση της ασφάλειας. Για παράδειγμα, το DALL-E 3 θα απορρίπτει τα αιτήματα για εικόνες που προορίζονται να αναπαραστήσουν δημόσια πρόσωπα ή που έχουν δημιουργηθεί στο ύφος σύγχρονων καλλιτεχνών. Επιπλέον, οι καλλιτέχνες μπορούν πλέον να επιλέξουν να μην χρησιμοποιηθούν κάποια ή όλα τα έργα τους για την εκπαίδευση των μοντέλων μετατροπής κειμένου σε εικόνα του OpenAI στο μέλλον. (Η OpenAI και ορισμένοι από τους ανταγωνιστές της έχουν μηνυθεί επειδή φέρονται να εκπαιδεύουν τα μοντέλα εικόνας της γεννητικής τεχνητής νοημοσύνης τους χρησιμοποιώντας έργα καλλιτεχνών που προστατεύονται από πνευματικά δικαιώματα).

Η κυκλοφορία του DALL-E 3 συμπίπτει με την εντατικοποίηση του ανταγωνισμού στην παραγωγική τεχνητή νοημοσύνη, ιδίως στον τομέα της σύνθεσης εικόνων. Η OpenAI βρίσκεται υπό πίεση για να συμβαδίσει με ανταγωνιστές όπως η Midjourney και η Stability AI που βελτιώνουν συνεχώς τα μοντέλα τους που δημιουργούν εικόνες.

Τον Οκτώβριο, η OpenAI σκοπεύει να διαθέσει το DALL-E 3 στους premium συνδρομητές του ChatGPT και στη συνέχεια σε ερευνητικές εγκαταστάσεις και στους χρήστες του API της. Το πότε και πότε θα εκδώσει ένα δωρεάν διαδικτυακό εργαλείο, όπως έκανε με το DALL-E 2 και το πρώτο μοντέλο DALL-E, δεν έχει γίνει ακόμη γνωστό από τον οργανισμό.

Δες τα όλα