Στοχευμένη Ενεργή Ακύρωση Θορύβου Βασισμένη με Μετρικές Ενόχλησης
Συγγραφείς
Παναγιώτης Ζάχος, Παναγιώτης Χατζηαντωνίου, Γιώργος Μοιράγιας, Ιωάννης Μουρτζόπουλος
Σύνοψη
ΣΤΟΧΟΣ
Οι περισσότερες μέθοδοι Ενεργής Ακύρωσης Θορύβου (ANC), βασίζονται στην ακύρωση ανεπιθύμητου θορύβου δημιουργώντας ένα σήμα ίδιου πλάτους αλλά με αντίστροφη φάση, εξασθενώντας θεωρητικά βέλτιστα τον θόρυβο μέσω της αρχής της υπέρθεσης στο ακουστικό πεδίο. Τέτοιου είδους προσεγγίσεις επί το πλείστων δεν επιτρέπουν την χωρική επιλογή ανεπιθύμητων πηγών θορύβου
Σε αυτή την εργασία προτείνεται μια Στοχευμένη μέθοδος ANC (TBANC-D) που βασίζεται σε έναν διαμορφωτή ζώνης (beamformer) στο πεδίο του χρόνου, ο οποίος κατευθύνεται και εστιάζει στη διεύθυνση της πιο ενοχλητικής πηγής στο χώρο, με τη βοήθεια ενός μοντέλου μηχανικής μάθησης που εντοπίζει και ταξινομεί τις πηγές στο πεδίο, αξιοποιώντας ένα έξυπνο σύστημα εκτίμησης της ενόχλησης της εκάστοτε πηγής. Το σύστημα αυτό έχει εκπαιδευτεί από τα αποτελέσματα υποκειμενικών εκτιμήσεων ακροατών σε τυπικά σενάρια (σκηνές) χωρικής διάταξης πηγών θορύβου.
ΜΕΘΟΔΟΣ
Το μοντέλο μηχανικής μάθησης αξιοποιεί τις καταγραφές των μικροφώνων που βρίσκονται εξωτερικά του περιβλήματος των ακουστικών ώστε από αυτά να εξάγει 2 φασματογραφήματα, και τη διαφορά φάσης μεταξύ των 2 σημάτων. Οι παράμετροι αυτοί οδηγούν ένα νευρωνικό δίκτυο με αρχιτεκτονική τύπου Encoder-Decoder για να εντοπίσει και να χαρακτηρίσει τις πηγές που βρίσκονται στον ίδιο χώρο με τον ακροατή.
Οι διάφορες πηγές μέσω των αποτελεσμάτων ενός υποκειμενικού τεστ ακρόασης συσχετίζονται με ένα σκορ ενόχλησης το οποίο σε συνδυασμό με τα αποτελέσματα του μοντέλου οδηγούν τη δέσμη του beamformer σε αυτή την πηγή που κρίνεται η πιο ενοχλητική στη συγκεκριμένη σκηνή.
Το σύστημα ANC δημιουργεί 2 σήματα αντιθορύβου τα οποία υπολογίζονται ανεξάρτητα: ένα σήμα βασισμένο στην έξοδο του beamformer, και ένα σήμα βασισμένο στην έξοδο ενός από τα 2 μικρόφωνα που βρίσκονται εξωτερικά του περιβλήματος των ακουστικών, ώστε να ακυρωθεί βέλτιστα τόσο η ενοχλητική/κυρίαρχη πηγή όσο και ο διάχυτος θόρυβος της σκηνής.
ΑΠΟΤΕΛΕΣΜΑΤΑ
Από στατιστική ανάλυση των αποτελεσμάτων που συλλέχθηκαν κατά το υποκειμενικό τεστ ακρόασης σε προκαθορισμένες αμφιωτικές καταγραφές τυπικών σκηνών (π.χ. κυκλοφοριακού θορύβου, καφέ, κλπ.), προέκυψε πως ο θόρυβος που προέρχεται από κυκλοφοριακή κίνηση συσχετίζεται συχνότερα με υψηλή ενόχληση, ακολουθούμενος από διεγέρσεις που προέρχονται από θορύβους που καταγράφηκαν σε καφέ ή σταθμούς μετρό.
Το τμήμα του μοντέλου που μετά από αρχική εκμάθηση είναι υπεύθυνο για την αναγνώριση των θορύβων αυτών, επιτυγχάνει υψηλά ποσοστά επιτυχών ανιχνεύσεων, με μέσο Precision 82% και μέσο Recall 89%. Ο εντοπισμός γωνίας άφιξης των θορύβων επίσης λειτουργεί με μεγάλη ακρίβεια που κυμαίνεται σε μέσο απόλυτο σφάλμα (Mean Absolute Error) 〖0.34〗^ο.
Το σύστημα ANC επιτυγχάνει επιπλέον ακύρωση της τάξης των 20dB σε σύγκριση με αντίστοιχα συστήματα State-of-the-art, ειδικά στις κρίσιμες συχνοτικές ζώνες των 3-5kHz όπου οι ακροατές είναι περισσότερο ευαίσθητοι σε ενοχλητικές διεγέρσεις.
Συνολικά, τα αποτελέσματα δείχνουν την αποτελεσματικότητα της προτεινόμενης μεθόδου (TBANC-D) στην ακύρωση ενοχλητικών πηγών θορύβου αλλά και στην εξασθένηση του διάχυτου θορύβου περιβάλλοντος σε αποδεκτά επίπεδα.