Το OpenAI παρουσιάζει το νέο μοντέλο παραγωγικής Τεχνητής Νοημοσύνης GPT-4 Turbo

Το OpenAI παρουσιάζει το νέο μοντέλο παραγωγικής Τεχνητής Νοημοσύνης GPT-4 Turbo

SHARE IT

07 Νοεμβρίου 2023

Η OpenAI ανακοίνωσε το GPT-4 Turbo στο πρώτο της συνέδριο προγραμματιστών, μια αναβαθμισμένη έκδοση του κορυφαίου μοντέλου τεχνητής νοημοσύνης που παράγει κείμενα, το GPT-4, το οποίο η εταιρεία ισχυρίζεται ότι είναι και πιο "ισχυρό" και λιγότερο ακριβό.

Το GPT-4 Turbo διατίθεται σε δύο εκδόσεις: μία που αναλύει μόνο κείμενο και μία άλλη που αναγνωρίζει το πλαίσιο τόσο του κειμένου όσο και των γραφικών. Το μοντέλο ανάλυσης κειμένου είναι τώρα προσβάσιμο σε προεπισκόπηση μέσω ενός API και η OpenAI λέει ότι και τα δύο θα είναι ευρέως διαθέσιμα "τις επόμενες εβδομάδες".

Κοστίζουν 0,01 δολάρια για 1.000 tokens εισόδου (750 λέξεις), όπου τα "tokens" αντιπροσωπεύουν ακατέργαστα κομμάτια κειμένου (για παράδειγμα, η λέξη "fantastic" σπασμένη σε "fan", "tas" και "tic"), και 0,03 δολάρια ανά 1.000 tokens εξόδου. (Τα tokens εισόδου είναι tokens που τροφοδοτούνται στο μοντέλο και τα tokens εξόδου είναι tokens που παράγονται από το μοντέλο ανάλογα με τα tokens εισόδου). Η τιμή του GPT-4 Turbo για την επεξεργασία εικόνας θα καθορίζεται από το μέγεθος της εικόνας. Το πέρασμα μιας εικόνας με 10801080 εικονοστοιχεία στο GPT-4 Turbo, για παράδειγμα, θα κοστίζει 0,00765 δολάρια, σύμφωνα με το OpenAI.

Βελτιστοποιήσαμε τις επιδόσεις ώστε να είμαστε σε θέση να προσφέρουμε το GPT-4 Turbo σε 3x φθηνότερη τιμή για τα tokens εισόδου και 2x φθηνότερη τιμή για τα tokens εξόδου σε σύγκριση με το GPT-4.

Το GPT-4 Turbo παρέχει αρκετά πλεονεκτήματα σε σχέση με το GPT-4, συμπεριλαμβανομένης μιας πιο πρόσφατης βάσης γνώσεων από την οποία μπορούμε να απαντάμε σε αιτήματα.

Το GPT-4 Turbo, όπως όλα τα γλωσσικά μοντέλα, είναι πρωτίστως ένα στατιστικό εργαλείο για την πρόβλεψη λέξεων. Το GPT-4 Turbo έμαθε πόσο συχνά πρόκειται να εμφανιστούν λέξεις με βάση πρότυπα, συμπεριλαμβανομένου του σημασιολογικού πλαισίου του περιβάλλοντος κειμένου, αφού τροφοδοτήθηκε με έναν τεράστιο όγκο παραδειγμάτων, κυρίως από τον ιστό. Για παράδειγμα, αν ένα μήνυμα ηλεκτρονικού ταχυδρομείου τελειώνει με τη φράση "Ανυπομονώ...", το GPT-4 Turbo μπορεί να το τελειώσει με "... να ακούσω απάντηση".

Το GPT-4 εκπαιδεύτηκε σε δεδομένα από τον ιστό μέχρι τον Σεπτέμβριο του 2021, ενώ το όριο γνώσης για το GPT-4 Turbo είναι ο Απρίλιος του 2023. Αυτό θα πρέπει να σημαίνει ότι οι ερωτήσεις σχετικά με τρέχοντα γεγονότα ή γεγονότα που συνέβησαν πριν από τη νέα ημερομηνία αποκοπής, θα παράγουν πιο ακριβείς απαντήσεις. Το GPT-4 Turbo διαθέτει επίσης ένα μεγαλύτερο παράθυρο πλαισίου.

Το παράθυρο πλαισίου αναφέρεται στο κείμενο που εξετάζει το μοντέλο πριν από τη δημιουργία οποιουδήποτε νέου κειμένου, και μετράται σε tokens. Τα μοντέλα με περιορισμένο παράθυρο πλαισίου έχουν την τάση να "ξεχνούν" την ουσία ακόμη και πρόσφατων συνομιλιών, με αποτέλεσμα να παρεκκλίνουν - συχνά με επικίνδυνους τρόπους.

Το GPT-4 Turbo διαθέτει παράθυρο πλαισίου 128.000 tokens, το οποίο είναι τέσσερις φορές μεγαλύτερο από το GPT-4 και το μεγαλύτερο από οποιοδήποτε άλλο εμπορικά διαθέσιμο μοντέλο, ξεπερνώντας ακόμη και το Claude 2 της Anthropic (το Claude 2 υποστηρίζει έως και 100.000 tokens- η Anthropic ισχυρίζεται ότι δοκιμάζει παράθυρο πλαισίου 200.000 tokens, αλλά δεν το έχει αποκαλύψει ακόμη δημόσια). Πράγματι, 128.000 tokens ισοδυναμούν με περίπου 100.000 λέξεις ή 300 σελίδες, δηλαδή περίπου όσο το "Ανεμοδαρμένα Ύψη", το "Ταξίδια του Γκιούλιβερ" και το "Ο Χάρι Πότερ και ο φυλακισμένος του Αζκαμπάν".

Το GPT-4 Turbo διαθέτει επίσης μια νέα "λειτουργία JSON", η οποία διασφαλίζει ότι το μοντέλο επιστρέφει σωστό JSON - την ανοιχτή τυποποιημένη μορφή αρχείου και το πρωτόκολλο μεταφοράς δεδομένων. Σύμφωνα με το OpenAI, αυτό είναι σημαντικό σε εφαρμογές ιστού που μεταδίδουν δεδομένα, όπως αυτές που μεταφέρουν δεδομένα από έναν διακομιστή σε έναν πελάτη, ώστε να μπορούν να εμφανιστούν σε μια ιστοσελίδα. Άλλες νέες ρυθμίσεις θα επιτρέψουν στους προγραμματιστές να κάνουν το μοντέλο να επιστρέφει "συνεπείς" συμπληρώσεις περισσότερες φορές, καθώς και να καταγράφουν πιθανότητες για τα πιο πιθανά tokens εξόδου που παράγονται από το GPT-4 Turbo για πιο εξειδικευμένες εφαρμογές.

Το GPT-4 Turbo αποδίδει καλύτερα από τα προηγούμενα μοντέλα μας σε εργασίες που απαιτούν την προσεκτική τήρηση οδηγιών, όπως η παραγωγή συγκεκριμένων μορφών (π.χ. "απαντάτε πάντα σε XML"). Και το GPT-4 Turbo είναι πιο πιθανό να επιστρέψει τις σωστές παραμέτρους της λειτουργίας.

Κατά την ανάπτυξη του GPT-4 Turbo, η OpenAI δεν παρέβλεψε το GPT-4. Η επιχείρηση έχει ξεκινήσει ένα πειραματικό πρόγραμμα πρόσβασης για την τελειοποίηση του GPT-4. Σε αντίθεση με την προσπάθεια τελειοποίησης για το GPT-3.5, τον προκάτοχο του GPT-4, το πρόγραμμα GPT-4 θα περιλαμβάνει πρόσθετη επίβλεψη και βοήθεια από τις ομάδες της OpenAI, σύμφωνα με την εταιρεία, λόγω τεχνικών προκλήσεων.

Τα προκαταρκτικά αποτελέσματα δείχνουν ότι η τελειοποίηση του GPT-4 απαιτεί περισσότερη δουλειά για να επιτευχθούν ουσιαστικές βελτιώσεις σε σχέση με το βασικό μοντέλο, σε σύγκριση με τα σημαντικά κέρδη που επιτεύχθηκαν με τη τελειοποίηση του GPT-3.5

Σε άλλα νέα, το OpenAI διπλασίασε το όριο του ποσοστού tokens ανά λεπτό για όλους τους χρήστες που πληρώνουν GPT-4. Ωστόσο, η τιμή θα παραμείνει αμετάβλητη στα $0,03 ανά μάρκα εισόδου και $0,06 ανά μάρκα εξόδου (για το μοντέλο GPT-4 με παράθυρο πλαισίου 8.000 μαρκών) ή $0,06 ανά μάρκα εισόδου και $0,012 ανά μάρκα εξόδου (για το μοντέλο GPT-4 με παράθυρο πλαισίου 32.000 μαρκών).

Δες τα όλα