Αυτό το όριο ανάγνωσης μυαλού μπορεί να μεταφράσει τις σκέψεις σε κείμενο χάρη στο AI

By | December 13, 2023

Φορώντας ένα καπάκι γεμάτο με ηλεκτρόδια και γεμάτο με σύρματα, ένας νεαρός άνδρας διαβάζει σιωπηλά μια πρόταση στο κεφάλι του. Λίγα λεπτά αργότερα, εμφανίζεται μια φωνή σαν Siri, που προσπαθεί να μεταφράσει τις σκέψεις σας σε κείμενο: «Ναι, θα ήθελα ένα μπολ κοτόσουπα, παρακαλώ». Είναι το πιο πρόσφατο παράδειγμα υπολογιστών που μεταφράζουν τις σκέψεις ενός ατόμου σε λέξεις και προτάσεις.

Παλαιότερα, οι ερευνητές είχαν χρησιμοποιήσει χειρουργικά τοποθετημένα εμφυτεύματα στον εγκέφαλο ή ογκώδη, ακριβά μηχανήματα για να μεταφράσουν την εγκεφαλική δραστηριότητα σε κείμενο. Η νέα προσέγγιση, που παρουσιάστηκε στο συνέδριο NeurIPS αυτής της εβδομάδας από ερευνητές στο Πανεπιστήμιο Τεχνολογίας του Σίδνεϊ, είναι εντυπωσιακή για τη χρήση ενός μη επεμβατικού ορίου EEG και τη δυνατότητα γενίκευσης πέρα ​​από ένα ή δύο άτομα.

Η ομάδα κατασκεύασε ένα μοντέλο τεχνητής νοημοσύνης που ονομάζεται DeWave που εκπαιδεύεται στη δραστηριότητα και τη γλώσσα του εγκεφάλου και το συνέδεσε με ένα μεγάλο γλωσσικό μοντέλο – την τεχνολογία πίσω από το ChatGPT – για να βοηθήσει στη μετατροπή της εγκεφαλικής δραστηριότητας σε λέξεις. Σε μια προεκτύπωση που δημοσιεύτηκε στο arXiv, το μοντέλο ξεπέρασε τα προηγούμενα σημεία αναφοράς μετάφρασης από σκέψη σε κείμενο EEG με ακρίβεια περίπου 40%. Ο Chin-Teng Lin, ο αντίστοιχος συγγραφέας της εργασίας, είπε στο MSN ότι πρόσφατα αύξησε την ακρίβεια στο 60%. Τα αποτελέσματα εξακολουθούν να εξετάζονται από ομοτίμους.

Αν και υπάρχει ακόμη πολύς δρόμος όσον αφορά την αξιοπιστία, αυτό δείχνει πρόοδο στις μη επεμβατικές μεθόδους ανάγνωσης και μετάφρασης των σκέψεων στη γλώσσα. Η ομάδα πιστεύει ότι η δουλειά τους μπορεί να δώσει φωνή σε όσους δεν μπορούν πλέον να επικοινωνήσουν λόγω τραυματισμού ή ασθένειας ή που έχουν συνηθίσει να οδηγούν μηχανές, όπως ρομπότ που περπατούν ή ρομποτικά χέρια, με μόνο σκέψεις.

Μαντέψτε τι σκέφτομαι

Ίσως θυμάστε τους τίτλους σχετικά με τις μηχανές «ανάγνωσης μυαλού» που μεταφράζουν τις σκέψεις σε κείμενο με μεγάλη ταχύτητα. Κι αυτό γιατί τέτοιες προσπάθειες δεν είναι κάτι καινούργιο.

Νωρίτερα φέτος, οι ερευνητές του Στάνφορντ περιέγραψαν τη συνεργασία με έναν ασθενή, τον Πατ Μπένετ, ο οποίος έχασε την ικανότητα ομιλίας λόγω ALS. Μετά την εμφύτευση τεσσάρων αισθητήρων σε δύο μέρη του εγκεφάλου του και την εκτεταμένη εκπαίδευση, ο Μπένετ μπόρεσε να επικοινωνήσει μετατρέποντας τις σκέψεις του σε κείμενο με ταχύτητα 62 λέξεων ανά λεπτό – βελτίωση σε σχέση με το ρεκόρ της ίδιας ομάδας το 2021 με 18 λέξεις ανά λεπτό.

Είναι ένα απίστευτο αποτέλεσμα, αλλά τα εμφυτεύματα εγκεφάλου μπορεί να είναι επικίνδυνα. Οι επιστήμονες θα ήθελαν να επιτύχουν ένα παρόμοιο αποτέλεσμα χωρίς χειρουργική επέμβαση.

Σε μια άλλη μελέτη φέτος, ερευνητές στο Πανεπιστήμιο του Τέξας στο Όστιν στράφηκαν σε μια τεχνολογία σάρωσης εγκεφάλου που ονομάζεται fMRI. Στη μελέτη, οι ασθενείς έπρεπε να μείνουν ακίνητοι σε ένα μηχάνημα που κατέγραφε τη ροή του αίματος στον εγκέφαλό τους ενώ άκουγαν ιστορίες. Αφού χρησιμοποίησε αυτά τα δεδομένα για να εκπαιδεύσει έναν αλγόριθμο – που βασίζεται εν μέρει στον πρόγονο του ChatGPT, GPT-1 – η ομάδα χρησιμοποίησε το σύστημα για να μαντέψει τι άκουγαν οι συμμετέχοντες με βάση τη δραστηριότητα του εγκεφάλου τους.

Η ακρίβεια του συστήματος δεν ήταν τέλεια, απαιτούσε μεγάλη προσαρμογή για κάθε συμμετέχοντα και τα μηχανήματα fMRI ήταν ογκώδη και ακριβά. Ωστόσο, η μελέτη χρησίμευσε ως απόδειξη της ιδέας ότι οι σκέψεις μπορούν να αποκωδικοποιηθούν μη επεμβατικά και ότι η τελευταία λέξη της τεχνητής νοημοσύνης μπορεί να βοηθήσει να γίνει αυτό.

Το Καπέλο Διαλογής

Σε Χάρρυ Πόττερ, οι μαθητές ταξινομούνται σε σχολεία με ένα μαγικό καπέλο που διαβάζει το μυαλό. Εμείς οι Μαγκλ καταφεύγουμε σε αστεία σκουφάκια κολύμβησης, τρυπημένα με καλώδια και ηλεκτρόδια. Γνωστά ως καλύμματα ηλεκτροεγκεφαλογράφου (EEG), αυτές οι συσκευές διαβάζουν και καταγράφουν την ηλεκτρική δραστηριότητα στον εγκέφαλό μας. Σε αντίθεση με τα εμφυτεύματα εγκεφάλου, δεν απαιτούν χειρουργική επέμβαση, αλλά είναι πολύ λιγότερο ακριβή. Η πρόκληση, λοιπόν, είναι να διαχωρίσουμε το σήμα από τον θόρυβο για να έχουμε ένα χρήσιμο αποτέλεσμα.

Στη νέα μελέτη, η ομάδα χρησιμοποίησε δύο σύνολα δεδομένων που περιείχαν παρακολούθηση ματιών και εγγραφές ΗΕΓ από 12 και 18 άτομα, αντίστοιχα, καθώς διάβαζαν κείμενο. Τα δεδομένα παρακολούθησης ματιών βοήθησαν το σύστημα να αναλύσει τη δραστηριότητα του εγκεφάλου με λέξη. Με άλλα λόγια, όταν τα μάτια ενός ατόμου μετακινούνται από τη μια λέξη στην άλλη, σημαίνει ότι θα πρέπει να υπάρχει μια παύση μεταξύ της εγκεφαλικής δραστηριότητας που σχετίζεται με αυτή τη λέξη και της δραστηριότητας που θα πρέπει να συσχετιστεί με την επόμενη.

Στη συνέχεια εκπαίδευσαν τον DeWave με αυτά τα δεδομένα και με την πάροδο του χρόνου ο αλγόριθμος έμαθε να συσχετίζει συγκεκριμένα μοτίβα εγκεφαλικών κυμάτων με λέξεις. Τέλος, με τη βοήθεια ενός μεγάλου προ-εκπαιδευμένου γλωσσικού μοντέλου που ονομάζεται BART – συντονισμένο για να κατανοεί τη μοναδική έξοδο του μοντέλου – οι συσχετίσεις εγκεφαλικών κυμάτων προς λέξη του αλγορίθμου μεταφράστηκαν ξανά σε προτάσεις.

Σε δοκιμές, ο DeWave ξεπέρασε τους αλγόριθμους της κατηγορίας του καλύτερου στη μετάφραση τόσο των ακατέργαστων εγκεφαλικών κυμάτων όσο και των εγκεφαλικών κυμάτων κομμένων λέξεων. Οι τελευταίες ήταν πιο ακριβείς, αλλά παρόλα αυτά υστερούσαν πολύ πίσω από τη μετάφραση μεταξύ γλωσσών – όπως τα αγγλικά και τα γαλλικά – και την αναγνώριση ομιλίας. Διαπίστωσαν επίσης ότι ο αλγόριθμος είχε παρόμοια απόδοση μεταξύ των συμμετεχόντων. Τα προηγούμενα πειράματα έτειναν να αναφέρουν αποτελέσματα σε ένα άτομο ή απαιτούσαν ακραία εξατομίκευση.

Η ομάδα λέει ότι η έρευνα αποτελεί περαιτέρω απόδειξη ότι τα μεγάλα γλωσσικά μοντέλα μπορούν να βοηθήσουν στην ανάπτυξη συστημάτων εγκεφάλου κειμένου. Αν και χρησιμοποίησαν έναν σχετικά παλιό αλγόριθμο στην επίσημη μελέτη, σε συμπληρωματικό υλικό συμπεριέλαβαν αποτελέσματα από μεγαλύτερα μοντέλα, συμπεριλαμβανομένου του αρχικού αλγόριθμου Llama του Meta. Είναι ενδιαφέρον ότι οι μεγαλύτεροι αλγόριθμοι δεν βελτίωσαν πολύ τα αποτελέσματα.

«Αυτό υπογραμμίζει την πολυπλοκότητα του προβλήματος και τις προκλήσεις της γεφύρωσης των εγκεφαλικών δραστηριοτήτων με τα LLMs», έγραψαν οι συγγραφείς, ζητώντας πιο λεπτή έρευνα στο μέλλον. Ωστόσο, η ομάδα ελπίζει να είναι σε θέση να προχωρήσει το δικό της σύστημα ακόμα πιο μακριά, ίσως με ακρίβεια έως και 90%.

Το έργο δείχνει πρόοδο στην περιοχή.

«Οι άνθρωποι ήθελαν να μετατρέψουν το ΗΕΓ σε κείμενο εδώ και πολύ καιρό και το μοντέλο της ομάδας δείχνει μια αξιοσημείωτη διόρθωση», δήλωσε ο Craig Jin από το Πανεπιστήμιο του Σίδνεϊ. MSN. “Πριν από αρκετά χρόνια, οι μετατροπές EEG σε κείμενο ήταν εντελώς ανοησίες.”

Πίστωση εικόνας: University of Technology Sydney

Leave a Reply

Your email address will not be published. Required fields are marked *