ΑΝΑΖΗΤΗΣΗ
SHARE IT
Η εταιρεία τεχνητής νοημοσύνης του Elon Musk, xAI, παρουσίασε επίσημα το Grok 4, το νεότερο κορυφαίο μοντέλο τεχνητής νοημοσύνης που στοχεύει να θέσει νέα πρότυπα στον κλάδο. Το Grok 4, που ανακοινώθηκε στις 10 Ιουλίου 2025, τοποθετείται ως ένα σύστημα τεχνητής νοημοσύνης πολλαπλών λειτουργιών με κορυφαία απόδοση, ικανό να χειρίζεται ένα ευρύ φάσμα ακαδημαϊκών, μαθηματικών και λογικών εργασιών με υψηλό βαθμό ακρίβειας. Η xAI ισχυρίζεται ότι αυτό το μοντέλο όχι μόνο ανταγωνίζεται, αλλά και ξεπερνά τους κορυφαίους ανταγωνιστές του, όπως το Gemini 2.5 Pro της Google και τη σειρά o3 της OpenAI.
Στον πυρήνα των δυνατοτήτων του Grok 4 βρίσκεται η εξαιρετική του απόδοση σε τυποποιημένες δοκιμές και δείκτες λογικής. Στο απαιτητικό Humanity’s Last Exam (HLE), το Grok 4, χωρίς τη βοήθεια πρόσθετων εργαλείων, σημείωσε 25,4%. Αυτό το αποτέλεσμα το τοποθετεί μπροστά από το Google Gemini 2.5 Pro με 21,6% και το o3-high της OpenAI με 21%. Ωστόσο, όταν ενισχύθηκε με δυνατότητες πολλαπλών πρακτόρων και εργαλείων, η προηγμένη παραλλαγή Grok 4 Heavy πέτυχε ένα σημαντικό άλμα, φτάνοντας το 44,4% στο ίδιο benchmark. Για σύγκριση, το Gemini 2.5 Pro με υποστήριξη εργαλείων πέτυχε μόλις 26,9%.
Στο benchmark ARC-AGI-2, το οποίο ελέγχει την αφηρημένη λογική και τη γενική νοημοσύνη, το Grok 4 πέτυχε βαθμολογία 16,2%, σχεδόν διπλάσια από τον πλησιέστερο ανταγωνιστή του, το Claude Opus 4. Το μοντέλο επέδειξε επίσης ισχυρή απόδοση σε αξιολογήσεις τύπου MMLU, όπου εξασφάλισε βαθμολογία 86,6% και συνολικό δείκτη νοημοσύνης 73 — τον υψηλότερο στον κλάδο, ξεπερνώντας τόσο το OpenAI όσο και τις κορυφαίες προσφορές της Google.
Στις αξιολογήσεις που σχετίζονται με STEM και κωδικοποίηση, το Grok 4 συνέχισε να εντυπωσιάζει. Σημείωσε αποτέλεσμα 87,5% στο benchmark GPQA, ενώ το Grok 4 Heavy ανέβασε αυτό το ποσοστό στο 88,9%. Στο AIME (American Invitational Mathematics Examination), η βαριά παραλλαγή του μοντέλου έφτασε σε άψογη βαθμολογία 100%, με την βασική έκδοση να ακολουθεί από κοντά με 98,8%. Επιπλέον, μια εξειδικευμένη έκδοση κωδικοποίησης, το Grok 4 Code, πρόκειται να κυκλοφορήσει τον Αύγουστο του 2025 και έχει ήδη επιτύχει μεταξύ 72% και 75% στο SWE-Bench, μια αξιολόγηση απόδοσης ειδικά για εργασίες μηχανικής λογισμικού.
Σύμφωνα με τον ανεξάρτητο πάροχο μετρήσεων Artificial Analysis, το Grok 4 έχει επιτύχει βαθμολογία 73 στον Δείκτη Νοημοσύνης, που το τοποθετεί μπροστά από το o3 της OpenAI με 70 και το Gemini 2.5 Pro της Google, επίσης με 70. Ο Musk τόνισε την αξιοπιστία του Grok 4 σε σύνθετους επιστημονικούς τομείς όπως τα μαθηματικά και η φυσική, δηλώνοντας ότι το μοντέλο πλέον δεν κάνει σχεδόν ποτέ λάθη σε ερωτήσεις τύπου εξετάσεων — εκτός αν αυτές οι ερωτήσεις έχουν σχεδιαστεί σκόπιμα για να είναι αντιφατικές. Πρόσθεσε ότι το Grok 4 έχει την ικανότητα να ανιχνεύει και να επιλύει αμφισημίες ή λάθη σε ερωτήσεις εξετάσεων και να παρέχει ακριβείς απαντήσεις ακόμη και όταν οι ερωτήσεις είναι λανθασμένες.
Όσον αφορά την προσβασιμότητα, η xAI διατηρεί την ίδια δομή τιμολόγησης για το API του Grok 4 όπως και για το Grok 3. Αυτό περιλαμβάνει μια τιμή 3 δολαρίων ανά εκατομμύριο εισερχόμενα tokens και 15 δολαρίων ανά εκατομμύριο εξερχόμενα tokens, με τα cache εισερχόμενα tokens να κοστίζουν 0,75 δολάρια ανά εκατομμύριο. Αυτή η ανταγωνιστική τιμολόγηση υποδηλώνει ότι η xAI επιδιώκει να προσελκύσει προγραμματιστές και επιχειρήσεις που απαιτούν AI υψηλής απόδοσης χωρίς δραστική αύξηση του κόστους.
Για μεμονωμένους χρήστες, η xAI έχει εισαγάγει νέα μοντέλα συνδρομής υπό την επωνυμία Grok. Το βασικό δωρεάν επίπεδο προσφέρει περιορισμένη πρόσβαση στο Grok 3, απευθυνόμενο σε περιστασιακούς χρήστες και σε όσους μόλις αρχίζουν να εξερευνούν τη γενετική AI. Η συνδρομή «SuperGrok», με τιμή 30 δολάρια το μήνα, παρέχει εκτεταμένη πρόσβαση τόσο στο Grok 3 όσο και στο Grok 4. Εν τω μεταξύ, οι επαγγελματίες και οι έμπειροι χρήστες μπορούν να επιλέξουν το πρόγραμμα «SuperGrok Heavy» με τιμή 300 δολάρια το μήνα, το οποίο ξεκλειδώνει όλες τις δυνατότητες του Grok 4 Heavy, μαζί με πρόσβαση στο βασικό Grok 4 και Grok 3.
Αυτή η κυκλοφορία αποτελεί ένα σημαντικό ορόσημο για την xAI, καθώς συνεχίζει την αποστολή της να αναπτύξει ανταγωνιστικές εναλλακτικές λύσεις για τα μοντέλα τεχνητής νοημοσύνης που παράγονται από την Google, την OpenAI και την Anthropic. Η προώθηση της εταιρείας σε συστήματα πολλαπλών πρακτόρων, προηγμένη συλλογιστική και βελτιστοποίηση ακαδημαϊκών δεικτών αναφοράς αντικατοπτρίζει τη φιλοδοξία της να ηγηθεί όχι μόνο στην απόδοση, αλλά και στη μελλοντική κατεύθυνση της τεχνητής νοημοσύνης.
Καθώς η xAI διαθέτει το Grok 4 σε περισσότερους χρήστες, μένει να δούμε πώς θα αποδώσει το μοντέλο σε πραγματικές συνθήκες πέρα από τις δοκιμές αναφοράς. Ωστόσο, με τις δημόσιες δηλώσεις υποστήριξης του Musk και τις τεχνικές προδιαγραφές που έχουν δοθεί μέχρι στιγμής, το Grok 4 είναι έτοιμο να αμφισβητήσει το status quo στην ανάπτυξη της τεχνητής νοημοσύνης και να προσφέρει στους προγραμματιστές, τους ερευνητές και τις επιχειρήσεις μια συναρπαστική νέα επιλογή στο τοπίο της γενετικής τεχνητής νοημοσύνης.
MORE NEWS FOR YOU