Ακουστικά τεχνητής νοημοσύνης επιτρέπουν στο χρήση να ακούσει ένα άτομο μέσα στο πλήθος, κοιτάζοντάς το μόνο μία φορά

1 Ιουνίου 2024

xr:d:DAEFPiBe-LE:22592,j:47837321195,t:23022818

Τα ακουστικά ακύρωσης θορύβου έχουν εξελιχτεί πολύ στο να δημιουργούν ένα φιλικότερο ηχητικό περιβάλλον για το χρήστη, αποκλείοντας τη συντριπτική πλειοψηφία των ήχων. Όμως, το να επιτρέπουν σε συγκεκριμένους ήχους από το περιβάλλον να περνούν από το τείχος αυτό εξακολουθεί να συνιστά πρόκληση για τους ερευνητές. Η νέα έκδοση των AirPods Pro της Apple, λόγου χάρη, ρυθμίζει αυτόματα τα επίπεδα του ήχου -έχοντας τη δυνατότητα να αντιληφθεί πότε συνομιλείτε, λόγου χάρη- όμως ο χρήστης έχει ελάχιστο έλεγχο πάνω στο ποιον θέλουν να ακούσουν ή πότε συμβαίνει αυτό.

Ομάδα ερευνητών του Πανεπιστημίου της Ουάσιγκτον ανέπτυξε σύστημα τεχνητής νοημοσύνης το οποίο επιτρέπει σε χρήστη που φορά ακουστικά να κοιτάξει ένα άτομο, την ώρα που μιλά, για δύο με τρία δευτερόλεπτα, προκειμένου να το “εγγράψει”. Το σύστημα, με την ονομασία TSH (Target Speech Hearing), στη συνέχεια ακυρώνει όλους τους άλλους περιβάλλοντες ήχους και απλά αναπαράγει τη φωνή του εγγεγραμμένου ομιλητή σε πραγματικό χρόνο, ακόμη και όταν ο χρήστης των ακουστικών κινείται σε θορυβώδεις χώρους και δεν είναι πλέον στραμμένος προς τον ομιλητή.

Η ομάδα παρουσίασε τα ευρήματά της στο πλαίσιο διάσκεψης με θέμα τους Ανθρώπινους Παράγοντες στα Υπολογιστικά Συστήματα, το οποίο πραγματοποιήθηκε στη Χονολουλού. Ο κώδικας που επιτρέπει αυτή τη διαδικασία είναι διαθέσιμος σε όσους θα ενδιαφέρονταν να τον εξελίξουν. Το σύστημα δεν διατίθεται εμπορικά.

Προκειμένου να ενεργοποιηθεί το σύστημα, ένα άτομο που φορά ένα απλό ζευγάρι εμπορικά διαθέσιμων ακουστικών, εφοδιασμένο με μικρόφωνα, πατά ένα πλήκτρο, ενώ στρέφει το κεφάλι του προς κάποιον ομιλητή. Τα ηχητηικά κύματα της φωνής του ομιλητή φτάνουν ταυτόχρονα στα μικρόφωνα που τοποθετημένα και στις δύο πλευρές των ακουστικών: υπάρχει περιθώριο σφάλματος 16 μοιρών. Τα ακουστικά στέλνουν το σήμα αυτό σε ενσωματωμένο υπολογιστή, όπου το λογισμικό μηχανικής μάθησης που ανέπτυξαν οι ερευνητές μαθαίνει τα φωνητικά μοτίβα του επιθυμητού ομιλητή. Το σύστημα εστιάζει στη φωνή του συγκεκριμένου ατόμου και συνεχίζει να την αναπαράγει στον ακροατή, ακόμη και όταν οι δυο τους κινούνται. Η ικανότητα του συστήματος να εστιάζει στην εγγεγραμμένη φωνή βελτιώνεται καθώς ο στόχος συνεχίζει να μιλά, προσφέροντας στο σύστημα περισσότερα εκπαιδευτικά δεδομένα.

Η ομάδα δοκίμασε το σύστημα σε 21 άτομα, τα οποία έδωσαν σχεδόν διπλάσια βαθμολογία κατά μέσο όρο στη διαύγεια της φωνής του εγγεγραμμένου ομιλητή σε σχέση με τον αφιλτράριστο ήχο.

Η διαδικασία αυτή βασίζεται σε προηγούμενη έρευνα της ομάδας, που επέτρεπε στους χρήστες να επιλέγουν συγκεκριμένες κατηγορίες ήχων -όπως τιτιβίσματα πουλιών ή φωνές ανθρώπων- τους οποίους ήθελαν να ακούνε, ακυρώνοντας άλλους ήχους του περιβάλλοντος.

Επί του παρόντος το TSH έχει τη δυνατότητα εγγραφής ενός μόνο ομιλητή τη φορά, ενώ μπορεί να προχωρά στην εγγραφή μόνο όταν δεν εντοπίζει άλλη δυνατή φωνή από την ίδια κατεύθυνση με αυτή του στόχου. Εφόσον ο χρήστης δεν είναι ευχαριστημένος με την ποιότητα του ήχου, μπορεί να προχωρήσει σε νένα διαδικασία εγγραφής, ώστε να έχει καλύτερο αποτέλεσμα.

Η ομάδα εργάζεται πάνω στη μελλοντική επέκταση του συστήματος ώστε να χρησιμοποιείται μέσω earbuds και βοηθημάτων βαρηκοΐας.

Προηγούμενο άρθρο

Σύσκεψη Σχεδιασμού ΟΧΕ των Δήμων πέριξ του Αμβρακικού Κόλπου στο Δημαρχείο του Δήμου Αρταίων

Επόμενο άρθρο

Ιωάννινα: Τραυματισμός τριών στελεχών των Ενόπλων Δυνάμεων κατά τη διάρκεια εκπαίδευσης

Ακουστικά τεχνητής νοημοσύνης επιτρέπουν στο χρήση να ακούσει ένα άτομο μέσα στο πλήθος, κοιτάζοντάς το μόνο μία φορά

Τελευταία Νέα

Σοβαρούς προβληματισμούς προκαλούν τα πύρινα μέτωπα που ξέσπασαν το Σαββατοκύριακο σε διάφορα σημεία της Πρέβεζας

Προδημοσίευση Δράσης “Επιχειρώ Καινοτομώ στην Ήπειρο”

Πρωταθλήτρια Ελλάδος η ΑΝΑΓΕΝΝΗΣΗ ΑΡΤΑΣ στο Beach Handball

Επιστολή της κ. Γεροβασίλη προς το Δημοτικό Συμβούλιο Δήμου Αρταίων, σχετικά με τις εξελίξεις στο στρατόπεδο ΒΕΡΣΗ

ΕΠΙΛΟΓΈΣ ΣΥΝΤΆΚΤΗ

ΔΗΜΟΦΙΛΗ ΑΡΘΡΑ

Παράταση μέχρι την 1η Ιουλίου για τις δηλώσεις «πόθεν έσχες»

EuroLeague Final 4: Στο Κάουνας Ολυμπιακός, Μπαρτσελόνα περιμένουν τους άλλους δύο

Ομόφωνα ένοχοι και οι 12 που δολοφόνησαν τον Άλκη Καμπανό

ΔΗΜΟΦΙΛΗ ΚΑΤΗΓΟΡΙΑ

Ακουστικά τεχνητής νοημοσύνης επιτρέπουν στο χρήση να ακούσει ένα άτομο μέσα στο πλήθος, κοιτάζοντάς το μόνο μία φορά

RELATED ARTICLES

Τελευταία Νέα

ΕΠΙΛΟΓΈΣ ΣΥΝΤΆΚΤΗ

ΔΗΜΟΦΙΛΗ ΑΡΘΡΑ

ΔΗΜΟΦΙΛΗ ΚΑΤΗΓΟΡΙΑ