Η Google ανακοινώνει το Gemini 1.5 για να αναβαθμίσει την AI βιομηχανία

Η Google ανακοινώνει το Gemini 1.5 για να αναβαθμίσει την AI βιομηχανία

SHARE IT

16 Φεβρουαρίου 2024

Η Google ανακοίνωσε τον διάδοχο του Gemini, ενός τεράστιου γλωσσικού μοντέλου που στοχεύει να αναβαθμίσει τη βιομηχανία της τεχνητής νοημοσύνης. Η Google κυκλοφορεί σήμερα το Gemini 1.5, καθιστώντας το διαθέσιμο σε προγραμματιστές και εταιρικούς πελάτες πριν από την πλήρη ανάπτυξη για τους καταναλωτές σύντομα. Η εταιρεία έχει δεσμευτεί να χρησιμοποιήσει το Gemini ως επιχειρηματικό εργαλείο, προσωπικό βοηθό και όχι μόνο, και ακολουθεί ενεργά αυτή τη στρατηγική.

Υπάρχουν αρκετές βελτιώσεις στο Gemini 1.5: Το μοντέλο γενικής χρήσης της Google, το Gemini 1.5 Pro, είναι συγκρίσιμο με το high-end Gemini Ultra, το οποίο μόλις ανακοινώθηκε. Ξεπέρασε το Gemini 1.0 Pro στο 87% των δοκιμών αναφοράς. Δημιουργήθηκε χρησιμοποιώντας μια ολοένα και πιο δημοφιλή προσέγγιση γνωστή ως "Mixture of Experts" ή MoE, που σημαίνει ότι όταν βάζετε ένα ερώτημα, εκτελείται απλώς ένα μέρος του συνολικού μοντέλου και όχι ολόκληρο με τη μία. (Εδώ υπάρχει μια αξιοπρεπής εξήγηση σχετικά με το θέμα.) Αυτή η μέθοδος θα πρέπει να κάνει το μοντέλο πιο γρήγορο στη χρήση από εσάς, ενώ παράλληλα θα καταστήσει τις λειτουργίες της Google πιο αποτελεσματικές.


Υπάρχει όμως ένα νέο στοιχείο στο Gemini 1.5 που έχει ενθουσιάσει ολόκληρη την εταιρεία, αρχής γενομένης από τον CEO Sundar Pichai: Το Gemini 1.5 διαθέτει ένα τεράστιο παράθυρο περιβάλλοντος, το οποίο του επιτρέπει να επεξεργάζεται σημαντικά μεγαλύτερα ερωτήματα και να προβάλλει πολύ περισσότερα δεδομένα ταυτόχρονα. Αυτό το παράθυρο περιέχει ένα τεράστιο 1 εκατομμύριο μάρκες, σε αντίθεση με 128.000 για το GPT-4 του OpenAI και 32.000 για το τρέχον Gemini Pro. Τα token είναι ένα μέτρο που είναι δύσκολο να γίνει κατανοητό (εδώ είναι μια ωραία συζήτηση), οπότε ο Pichai το απλοποιεί: "Είναι περίπου 10 ή 11 ώρες βίντεο, δεκάδες χιλιάδες γραμμές κώδικα". Το παράθυρο περιβάλλοντος σας επιτρέπει να ρωτήσετε το AI bot για όλο το περιεχόμενο ταυτόχρονα.

Ο Pichai αναφέρει αδιάφορα ότι το παράθυρο πλαισίου είναι αρκετά μεγάλο για να χωρέσει ολόκληρη την τριλογία του Άρχοντα των Δαχτυλιδιών. Αυτό φαίνεται πολύ λεπτομερές, οπότε τον ρωτάω αν έχει ήδη συμβεί. Κάποιος στη Google απλώς ελέγχει αν το Gemini εντοπίζει τυχόν σφάλματα συνέχειας, προσπαθεί να κατανοήσει την περίπλοκη γενεαλογία της Μέσης Γης και δοκιμάζει αν η τεχνητή νοημοσύνη μπορεί επιτέλους να βγάλει νόημα από τον Tom Bombadil. "Είμαι σίγουρος ότι έχει συμβεί", γελάει ο Pichai, "ή θα συμβεί - ένα από τα δύο".


Ο Pichai πιστεύει ότι το διευρυμένο παράθυρο περιβάλλοντος θα είναι αρκετά πολύτιμο για τις επιχειρήσεις. "Αυτό επιτρέπει περιπτώσεις χρήσης όπου μπορείτε να προσθέσετε πολλά προσωπικά συμφραζόμενα και πληροφορίες τη στιγμή της ερώτησης", είπε. "Σκεφτείτε το σαν να έχουμε επεκτείνει δραματικά το παράθυρο ερωτήσεων". Φαντάζεται τους κινηματογραφιστές να ανεβάζουν ολόκληρη την ταινία τους και να ρωτούν το Gemini τι θα έλεγαν οι κριτικές, και τις επιχειρήσεις να χρησιμοποιούν το Gemini για να κοσκινίζουν τεράστιες ποσότητες οικονομικών δεδομένων. "Το θεωρώ ως μία από τις μεγαλύτερες ανακαλύψεις που έχουμε κάνει", είπε.

Το Gemini 1.5 είναι προς το παρόν αποκλειστικά διαθέσιμο σε εμπορικούς χρήστες και προγραμματιστές μέσω των Vertex AI και AI Studio της Google. Η κανονική έκδοση του Gemini Pro, η οποία είναι διαθέσιμη στη διεύθυνση gemini.google.com και στις εφαρμογές της εταιρείας, θα αντικαταστήσει τελικά το Gemini 1.0. Θα διαθέτει ένα παράθυρο πλαισίου 128.000 συμβόλων. Θα πρέπει να πληρώσετε περισσότερα για να φτάσετε στο εκατομμύριο. Η Google διερευνά επίσης την ασφάλεια και τα ηθικά όρια του μοντέλου, ιδίως σε σχέση με το νέο διευρυμένο παράθυρο περιβάλλοντος.

Η Google βρίσκεται σήμερα σε διαγωνισμό για τη δημιουργία του καλύτερου εργαλείου τεχνητής νοημοσύνης, καθώς οι επιχειρήσεις σε όλο τον κόσμο προσπαθούν να καθορίσουν τη δική τους στρατηγική τεχνητής νοημοσύνης - και αν θα υπογράψουν συμφωνίες ανάπτυξης με το OpenAI, τη Google ή κάποιον άλλο. Η πρόσφατη ανακοίνωση της OpenAI για τη "μνήμη" του ChatGPT υποδηλώνει μια πιθανή επέκταση στην αναζήτηση στο διαδίκτυο. Ενώ το Gemini φαίνεται να είναι καταπληκτικό για όσους ανήκουν ήδη στο οικοσύστημα της Google, υπάρχει ακόμη περισσότερη δουλειά που πρέπει να γίνει από όλες τις πλευρές.

Σύμφωνα με τον Pichai, όλα αυτά τα 1.0 και 1.5, τα Pros και Ultras και οι εταιρικές συγκρούσεις θα γίνουν τελικά άσχετα με τους χρήστες. "Οι άνθρωποι θα καταναλώνουν απλώς τις εμπειρίες", είπε. "Είναι σαν να χρησιμοποιείς ένα smartphone χωρίς να δίνεις πάντα προσοχή στον επεξεργαστή από κάτω". Αλλά, συνεχίζει, είμαστε ακόμα στη φάση όπου όλοι γνωρίζουν το τσιπ μέσα στο τηλέφωνό τους, επειδή είναι σημαντικό. "Η υποκείμενη τεχνολογία αλλάζει τόσο γρήγορα", είπε. "Οι άνθρωποι ενδιαφέρονται"

Δες τα όλα