Το Veo 2 είναι ένα νέο AI εργαλείο παραγωγής video για να ανταγωνιστεί το Sora του OpenAI

SHARE IT

17 Δεκεμβρίου 2024

Τη Δευτέρα, το τμήμα DeepMind της Google παρουσίασε τη δεύτερη γενιά του μοντέλου παραγωγής βίντεο Veo, το οποίο μπορεί να παράγει κλιπ διάρκειας έως και δύο λεπτών και με ανάλυση έως και 4K - έξι φορές μεγαλύτερη διάρκεια και τέσσερις φορές μεγαλύτερη ανάλυση από τα κλιπ 20 δευτερολέπτων/1080p του Sora.

Φυσικά, αυτά είναι τα θεωρητικά μέγιστα του Veo 2. Το μοντέλο είναι τώρα διαθέσιμο μόνο στο VideoFX, την πειραματική πλατφόρμα δημιουργίας βίντεο της Google, με κλιπ που περιορίζονται σε οκτώ δευτερόλεπτα και ανάλυση 720p. Το VideoFX έχει επίσης λίστα αναμονής, οπότε δεν μπορούν όλοι να δοκιμάσουν το Veo 2, ωστόσο η επιχείρηση έχει δηλώσει ότι η πρόσβαση θα επεκταθεί τις επόμενες εβδομάδες.

Το Veo 2 λέγεται ότι διαθέτει μια σειρά από πλεονεκτήματα σε σχέση με τους προκατόχους του, συμπεριλαμβανομένης της καλύτερης κατανόησης της φυσικής (σκεφτείτε καλύτερη δυναμική ρευστών και εφέ φωτισμού/σκίασης) και τη δυνατότητα δημιουργίας «καθαρότερων» βίντεο κλιπ, πράγμα που σημαίνει ότι οι παραγόμενες υφές και εικόνες είναι πιο ευκρινείς και λιγότερο πιθανό να θολώνουν όταν κινούνται. Το ενημερωμένο μοντέλο περιλαμβάνει επίσης καλύτερες δυνατότητες κάμερας, επιτρέποντας στον χρήστη να τοποθετεί τον φακό της εικονικής κάμερας με μεγαλύτερη ακρίβεια από ό,τι προηγουμένως.

Το Veo 2 δεν έχει ακόμη τελειοποιήσει τη διαδικασία παραγωγής βίντεο, ωστόσο φαίνεται να έχει παραισθήσεις σημαντικά λιγότερες από τους ανταγωνιστές όπως το Sora, το Kling, το Movie Gen και το Gen 3 Alpha. «Η συνοχή και η συνέπεια είναι τομείς για ανάπτυξη», δήλωσε ο Collins. «Το Veo μπορεί να τηρήσει με συνέπεια μια προτροπή για μερικά λεπτά, αλλά [δεν μπορεί] να τηρήσει πολύπλοκες προτροπές για μεγάλο χρονικό διάστημα. Ομοίως, η συνέπεια των χαρακτήρων μπορεί να αποτελέσει πρόκληση. Υπάρχει επίσης περιθώριο βελτίωσης στη δημιουργία περίπλοκων λεπτομερειών, γρήγορων και πολύπλοκων κινήσεων και στη συνέχιση της διεύρυνσης των ορίων του ρεαλισμού».

Η Google ανακοίνωσε επίσης αλλαγές στο Imagen 3 τη Δευτέρα, επιτρέποντας στο εμπορικό μοντέλο δημιουργίας εικόνων να παράγει «φωτεινότερα, καλύτερα συντεταγμένα» αποτελέσματα. Το μοντέλο, το οποίο είναι διαθέσιμο στο ImageFX, θα παρέχει επίσης περαιτέρω περιγραφικές ιδέες με βάση τις λέξεις-κλειδιά στην προτροπή του χρήστη, με κάθε λέξη-κλειδί να ενεργοποιεί μια αναπτυσσόμενη επιλογή σχετικών όρων.

Δες τα όλα

Το Veo 2 είναι ένα νέο AI εργαλείο παραγωγής video για να ανταγωνιστεί το Sora του OpenAI

YouTube και FIFA συνάπτουν μια ιστορική συμμαχία για το World Cup 2026

Το απόλυτο κέντρο AI: Η στρατηγική της OpenAI για το desktop superapp

Η Google επεκτείνει το Personal Intelligence για τον επαναπροσδιορισμό της καθημερινής ψηφιακής βοήθειας