Η Google ανοίγει τον κώδικα του SynthID για την αναγνώριση περιεχομένου που παράγεται από AI

Η Google ανοίγει τον κώδικα του SynthID για την αναγνώριση περιεχομένου που παράγεται από AI

SHARE IT

25 Οκτωβρίου 2024

Η τεχνολογία υδατογράφησης κειμένου SynthID της Google, που έχει σχεδιαστεί για την αναγνώριση κειμένου που έχει δημιουργηθεί με τεχνητή νοημοσύνη, είναι πλέον ανοικτού κώδικα μέσω του Google Responsible Generative AI Toolkit, όπως ανακοινώθηκε στο X.

«Τώρα, άλλοι προγραμματιστές [γεννητικής] ΤΝ θα μπορούν να χρησιμοποιούν αυτή την τεχνολογία για να τους βοηθήσει να ανιχνεύσουν αν οι έξοδοι κειμένου έχουν προέλθει από τα δικά τους [μεγάλα γλωσσικά μοντέλα], διευκολύνοντας έτσι περισσότερους προγραμματιστές να δημιουργήσουν ΤΝ με υπευθυνότητα», δήλωσε ο Pushmeet Kohli, αντιπρόεδρος έρευνας της Google DeepMind, στο MIT Technology Review.

Τα υδατογραφήματα διαδραματίζουν κρίσιμο ρόλο στην καταπολέμηση της πολιτικής παραπληροφόρησης, του μη συναινετικού σεξουαλικού περιεχομένου και άλλων αρνητικών χρήσεων των μαζικών γλωσσικών μοντέλων. Η Καλιφόρνια εξετάζει το ενδεχόμενο να καταστήσει υποχρεωτική την υδατογράφηση της τεχνητής νοημοσύνης, ενώ η κυβέρνηση της Κίνας άρχισε να την απαιτεί πέρυσι. Ωστόσο, τα εργαλεία αυτά είναι ακόμη σε εξέλιξη.

Το SynthID, το οποίο παρουσιάστηκε τον Αύγουστο, βοηθά στην αναγνώριση των αποτελεσμάτων που παράγονται με τεχνητή νοημοσύνη, ενσωματώνοντας ένα αόρατο υδατογράφημα σε εικόνες, ήχο, βίντεο και κείμενο κατά την παραγωγή τους. Σύμφωνα με την Google, η έκδοση κειμένου του SynthID λειτουργεί κάνοντας την έξοδο κειμένου ελαφρώς λιγότερο πιθανή με τρόπο που το λογισμικό μπορεί να εντοπίσει, αλλά οι άνθρωποι δεν μπορούν.

Μια LLM παράγει κείμενο ένα σύμβολο κάθε φορά. Αυτά τα σημεία μπορούν να αντιπροσωπεύουν έναν μεμονωμένο χαρακτήρα, μια λέξη ή μέρος μιας φράσης. Για να δημιουργηθεί μια ακολουθία συνεκτικού κειμένου, το μοντέλο προβλέπει το επόμενο πιο πιθανό σύμβολο που θα παραχθεί. Οι προβλέψεις αυτές βασίζονται στις προηγούμενες λέξεις και στις βαθμολογίες πιθανότητας που αποδίδονται σε κάθε πιθανό σύμβολο.

Για παράδειγμα, με τη φράση «Τα αγαπημένα μου τροπικά φρούτα είναι __». Το LLM μπορεί να ξεκινήσει τη συμπλήρωση της πρότασης με τα σημεία «μάνγκο», «λίτσι», «παπάγια» ή «ντούριαν» και σε κάθε σημείο δίνεται μια βαθμολογία πιθανότητας. Όταν υπάρχει ένα εύρος διαφορετικών tokens προς επιλογή, το SynthID μπορεί να προσαρμόσει τη βαθμολογία πιθανότητας κάθε προβλεπόμενου token, σε περιπτώσεις όπου αυτό δεν θα θέσει σε κίνδυνο την ποιότητα, την ακρίβεια και τη δημιουργικότητα του αποτελέσματος.

Αυτή η διαδικασία επαναλαμβάνεται σε όλο το παραγόμενο κείμενο, οπότε μια μόνο πρόταση μπορεί να περιέχει δέκα ή περισσότερες προσαρμοσμένες βαθμολογίες πιθανότητας, ενώ μια σελίδα μπορεί να περιέχει εκατοντάδες. Το τελικό μοτίβο των βαθμολογιών τόσο για τις επιλογές λέξεων του μοντέλου σε συνδυασμό με τις βαθμολογίες προσαρμοσμένης πιθανότητας θεωρείται το υδατογράφημα.


Το ρομπότ συνομιλίας Gemini της Google ενσωματώνει έναν μηχανισμό υδατοσήμανσης που δίνει προτεραιότητα στην ποιότητα του κειμένου, την ακρίβεια, την εφευρετικότητα και την ταχύτητα, αντιμετωπίζοντας ένα μακροχρόνιο ζήτημα. Η Google ισχυρίζεται ότι μπορεί να λειτουργήσει με περιεχόμενο τόσο σύντομο όσο τρεις προτάσεις, καθώς και με κείμενο που έχει αποκοπεί, παραφραστεί ή τροποποιηθεί. Ωστόσο, δυσκολεύεται με σύντομο κείμενο, τροποποιημένο ή μεταφρασμένο περιεχόμενο, ακόμη και με πραγματολογικά ερωτήματα.

"Το SynthID δεν είναι η χρυσή τομή για τον εντοπισμό περιεχομένου που παράγεται με τεχνητή νοημοσύνη", ανέφερε η Google σε ανάρτηση στο blog της τον Μάιο. «[Αλλά] είναι ένα σημαντικό δομικό στοιχείο για την ανάπτυξη πιο αξιόπιστων εργαλείων αναγνώρισης AI και μπορεί να βοηθήσει εκατομμύρια ανθρώπους να λάβουν τεκμηριωμένες αποφάσεις σχετικά με το πώς αλληλεπιδρούν με περιεχόμενο που δημιουργείται από AI».

Δες τα όλα