fbpx
ΑρχικήΕΠΙΣΤΗΜΗ & ΤΕΧΝΟΛΟΓΙΑΑκουστικά τεχνητής νοημοσύνης επιτρέπουν στο χρήση να ακούσει ένα άτομο μέσα στο...

Ακουστικά τεχνητής νοημοσύνης επιτρέπουν στο χρήση να ακούσει ένα άτομο μέσα στο πλήθος, κοιτάζοντάς το μόνο μία φορά

Τα ακουστικά ακύρωσης θορύβου έχουν εξελιχτεί πολύ στο να δημιουργούν ένα φιλικότερο ηχητικό περιβάλλον για το χρήστη, αποκλείοντας τη συντριπτική πλειοψηφία των ήχων. Όμως, το να επιτρέπουν σε συγκεκριμένους ήχους από το περιβάλλον να περνούν από το τείχος αυτό εξακολουθεί να συνιστά πρόκληση για τους ερευνητές. Η νέα έκδοση των AirPods Pro της Apple, λόγου χάρη, ρυθμίζει αυτόματα τα επίπεδα του ήχου -έχοντας τη δυνατότητα να αντιληφθεί πότε συνομιλείτε, λόγου χάρη- όμως ο χρήστης έχει ελάχιστο έλεγχο πάνω στο ποιον θέλουν να ακούσουν ή πότε συμβαίνει αυτό.

Ομάδα ερευνητών του Πανεπιστημίου της Ουάσιγκτον ανέπτυξε σύστημα τεχνητής νοημοσύνης το οποίο επιτρέπει σε χρήστη που φορά ακουστικά να κοιτάξει ένα άτομο, την ώρα που μιλά, για δύο με τρία δευτερόλεπτα, προκειμένου να το “εγγράψει”. Το σύστημα, με την ονομασία TSH (Target Speech Hearing), στη συνέχεια ακυρώνει όλους τους άλλους περιβάλλοντες ήχους και απλά αναπαράγει τη φωνή του εγγεγραμμένου ομιλητή σε πραγματικό χρόνο, ακόμη και όταν ο χρήστης των ακουστικών κινείται σε θορυβώδεις χώρους και δεν είναι πλέον στραμμένος προς τον ομιλητή.

Η ομάδα παρουσίασε τα ευρήματά της στο πλαίσιο διάσκεψης με θέμα τους Ανθρώπινους Παράγοντες στα Υπολογιστικά Συστήματα, το οποίο πραγματοποιήθηκε στη Χονολουλού. Ο κώδικας που επιτρέπει αυτή τη διαδικασία είναι διαθέσιμος σε όσους θα ενδιαφέρονταν να τον εξελίξουν. Το σύστημα δεν διατίθεται εμπορικά.

Προκειμένου να ενεργοποιηθεί το σύστημα, ένα άτομο που φορά ένα απλό ζευγάρι εμπορικά διαθέσιμων ακουστικών, εφοδιασμένο με μικρόφωνα, πατά ένα πλήκτρο, ενώ στρέφει το κεφάλι του προς κάποιον ομιλητή. Τα ηχητηικά κύματα της φωνής του ομιλητή φτάνουν ταυτόχρονα στα μικρόφωνα που τοποθετημένα και στις δύο πλευρές των ακουστικών: υπάρχει περιθώριο σφάλματος 16 μοιρών. Τα ακουστικά στέλνουν το σήμα αυτό σε ενσωματωμένο υπολογιστή, όπου το λογισμικό μηχανικής μάθησης που ανέπτυξαν οι ερευνητές μαθαίνει τα φωνητικά μοτίβα του επιθυμητού ομιλητή. Το σύστημα εστιάζει στη φωνή του συγκεκριμένου ατόμου και συνεχίζει να την αναπαράγει στον ακροατή, ακόμη και όταν οι δυο τους κινούνται. Η ικανότητα του συστήματος να εστιάζει στην εγγεγραμμένη φωνή βελτιώνεται καθώς ο στόχος συνεχίζει να μιλά, προσφέροντας στο σύστημα περισσότερα εκπαιδευτικά δεδομένα.

Η ομάδα δοκίμασε το σύστημα σε 21 άτομα, τα οποία έδωσαν σχεδόν διπλάσια βαθμολογία κατά μέσο όρο στη διαύγεια της φωνής του εγγεγραμμένου ομιλητή σε σχέση με τον αφιλτράριστο ήχο.

Η διαδικασία αυτή βασίζεται σε προηγούμενη έρευνα της ομάδας, που επέτρεπε στους χρήστες να επιλέγουν συγκεκριμένες κατηγορίες ήχων -όπως τιτιβίσματα πουλιών ή φωνές ανθρώπων- τους οποίους ήθελαν να ακούνε, ακυρώνοντας άλλους ήχους του περιβάλλοντος.

Επί του παρόντος το TSH έχει τη δυνατότητα εγγραφής ενός μόνο ομιλητή τη φορά, ενώ μπορεί να προχωρά στην εγγραφή μόνο όταν δεν εντοπίζει άλλη δυνατή φωνή από την ίδια κατεύθυνση με αυτή του στόχου. Εφόσον ο χρήστης δεν είναι ευχαριστημένος με την ποιότητα του ήχου, μπορεί να προχωρήσει σε νένα διαδικασία εγγραφής, ώστε να έχει καλύτερο αποτέλεσμα.

Η ομάδα εργάζεται πάνω στη μελλοντική επέκταση του συστήματος ώστε να χρησιμοποιείται μέσω earbuds και βοηθημάτων βαρηκοΐας.

- Advertisement -

Τελευταία Νέα