Χαρακτηρισμός και έλεγχος υπερ-υψίσυχνων τρεχόντων ακουστικών κυμάτων σε κρυσταλλικά στερεά με την χρήση ταχείας φασικής απεικόνισης με ns λέιζερ
Παρουσιαστής:
Εμμανουήλ Κανιολάκης Καλούδης (ΕΛΜΕΠΑ)
Συγγραφείς:
Εμμανουήλ Κανιολάκης Καλούδης, Κωνσταντίνος Καλέρης, Ευάγγελος Κασελούρης, Ιωάννης Ορφανός, Μάκης Μπακαρέζος, Βασίλειος Δημητρίου, Μιχαήλ Ταταράκης, Νεκτάριος Παπαδογιάννης
Περίληψη:
Σε αυτή την εργασία παρουσιάζονται μέθοδοι και αποτελέσματα χαρακτηρισμού και απεικόνισης τρεχόντων ακουστικών κυμάτων μέσα σε κρυστάλλους. Για τον ακριβή ποσοτικό και ποιοτικό χαρακτηρισμό και έλεγχο της έντασης, της συχνότητας και της χωρικής κατανομής των τρέχοντων ακουστικών κυμάτων απαραίτητη προϋπόθεση είναι η απεικόνιση τους με υψηλή ευκρίνεια και ταχύτητα, προκειμένου να αποτυπώνονται στατικά. Για τον σκοπό αυτό κατάλληλες μέθοδοι οπτικής απεικόνισης αποτελούν η συμβολομετρία λέιζερ και η φασική απεικόνιση. Στη συμβολομετρία, πχ. με χρήση συμβολόμετρου Mach-Zehnder, η χωρική κατανομή των ακουστικών κυμάτων απεικονίζεται μέσω της διαφοράς φάσης που αποκτά το φως όταν διασχίζει περιοχές του κρυστάλλου με διαφορετικό δείκτη διάθλασης. Πιο συγκεκριμένα, η αρχικά ομοιογενής πυκνότητα του κρυστάλλου διαμορφώνεται δυναμικά από τα τρέχοντα ακουστικά κύματα, τα οποία μετατοπίζουν τα κρυσταλλικά επίπεδα και δημιουργούν περιοχές υψηλής και χαμηλής χωρικής πυκνότητας στη διεύθυνση διάδοσης τους. Η φασική ανομοιογένεια της φωτεινής δέσμης που διέρχεται από τον κρύσταλλο (probe beam-δέσμη ελέγχου) προκαλεί παραμόρφωση των κροσσών συμβολής, η οποία με κατάλληλη επεξεργασία μας δίνει πληροφορία για την αλλαγή του δείκτη διάθλασης λόγω των ακουστικά διαμορφωμένων κρυσταλλικών επιπέδων. Η μέθοδος έχει ικανοποιητική διακριτική ικανότητα (της τάξης των μερικών nm) αλλά παρουσιάζει σχετικά υψηλή πολυπλοκότητα ως προς την βελτιστοποίησή της. Η οπτική φασική απεικόνιση είναι εναλλακτική μέθοδος απεικόνισης ανομοιογενειών στον δείκτη διάθλασης υλικών, η οποία βρίσκει εφαρμογή μεταξύ άλλων στην απεικόνιση ακουστικών κυμάτων. Η μέθοδος βασίζεται στην εκτροπή του φωτός λόγω της περιοδικής διαμόρφωσης του δείκτη διάθλασης κάθετα στην διάδοση της δοκιμαστικής οπτικής δέσμης, όπως περιεγράφηκε προηγουμένως. Όταν, η οπτική δέσμη διαδίδεται διαμέσου του κρυστάλλου, η κλίση του δείκτη διάθλασής αναγκάζει το φως να εκτραπεί λόγω του φαινομένου της διάθλασης. Η εκτροπή αυτή απεικονίζεται ως ανομοιομορφία στην κατανομή της έντασης του φωτός πάνω στην οθόνη μιας κάμερας υψηλής ευκρίνειας. Το βασικό πλεονέκτημα της μεθόδου είναι ότι επιτρέπει την ανίχνευση ακουστικών κυμάτων με υψηλή διακριτική ικανότητα, της τάξης των nm, με χρήση σχετικά απλών πειραματικών διατάξεων.
Εδώ παρουσιάζονται αποτελέσματα από την ανίχνευση και απεικόνιση ακουστικών κυμάτων σε κρυστάλλους χαλαζία (Quartz) με την μέθοδο οπτικής απεικόνισής φάσης αλλά και με συμβολομετρία Mach-Zender. Διαμήκη ημιτονοειδή ακουστικά κύματα παράγονται από ειδικά κατασκευασμένους πιεζοηλεκτρικούς μετατροπείς σε εύρος συχνοτήτων από 20 έως 60 MHz. Τα κύματα ταξιδεύουν μέσα στον κρύσταλλο χαλαζία (Quartz) με ταχύτητα 5570 m/s διαμορφώνοντας δυναμικά τα κρυσταλλικά επίπεδα. Ένα παλμικό σύστημα λέιζερ Nd:YAG, με παλμούς διάρκειας 6 ns και κεντρικό μήκος κύματος στα 1064 nm, χρησιμοποιείται για την απεικόνιση των τρέχοντων ακουστικών κυμάτων. Η χρήση παλμικού λέιζερ επιτρέπει την στατική απεικόνιση των τρεχόντων ακουστικών κυμάτων, καθώς στην διάρκεια των 6ns που διαρκεί ο κάθε παλμός το κύμα έχει ταξιδέψει μέσα στο Quartz 33μm που είναι αρκετά μικρότερο από το μήκος κύματος των τρεχόντων κυμάτων. Για την περίπτωση της ταχείας φασικής απεικόνισης παρουσιάζεται, επίσης υπολογιστικό μοντέλο που επιτρέπει την ποσοτικοποίηση διαφόρων χαρακτηριστικών των ακουστικών κυμάτων, όπως η ακουστική πίεση και η γωνία εκτροπής του φωτός.
Απώτερος σκοπός της βελτιστοποίησης του χαρακτηρισμού των ακουστικά διαμορφωμένων κρυστάλλων είναι η χρήση τους σε διάφορα επιστημονικά πεδία, όπως στις φυσικές επιστήμες και η ιατρική. Επίσης, προτείνονται ως πηγές ακτίνων γ με ενέργεια MeV με εξαιρετική απόδοση και χαμηλό κόστος. Συνεπώς, η ικανότητα αποτελεσματικού χαρακτηρισμού τους είναι απαραίτητη προϋπόθεση για οποιαδήποτε περαιτέρω πρόοδο στην ανάπτυξη των εφαρμογών τους.
|
Προσομοίωση ακουστικής απόκρισης χώρου για αυθαίρετη επιλογή θέσης δέκτη-πηγής
Συγγραφείς:
Σωτήρης Λοής, Ρήγας Κωτσάκης, Χρήστος Σεβαστιάδης, Νικόλαος Βρύζας, Λάζαρος Βρύσης, Χαράλαμπος Δημούλας, Γεώργιος Καλλίρης
Περίληψη:
Η παρούσα εργασία πραγματοποιείται στο πλαίσιο του Ευρωπαϊκού Έργου Searchable multi-dimensional Data Lakes supporting Cognitive Film Production & Distribution for the Promotion of the EuropeaN Cultural HeritagE, το οποίο έχει ως στόχο την παροχή εργαλείων για την υποστήριξη των εργασιών κινηματογραφικής παραγωγής σε όλα τα στάδια προπαραγωγής, παραγωγής και μεταπαραγωγής. Μεταξύ άλλων, παρέχεται στους ενδιαφερόμενους χρήστες (κινηματογραφικοί παραγωγοί, σκηνοθέτες, υπεύθυνοι ήχου κλπ.) η δυνατότητα εικονικής πλοήγησης σε χώρο τόσο οπτικά μέσω του τρισδιάστατου μοντέλου, όσο και ηχητικά, μέσω μιας ηχητικής προσομοίωσης της απόκρισης του χώρου για διαφορετικές θέσεις πηγής και δέκτη εντός του χώρου. Η χρησιμότητα αυτής της λειτουργικότητας είναι να παρέχει μια ενδεικτική πληροφορία σχετικά αφενός με την καταλληλότητα του χώρου για πραγματοποίηση ηχογραφήσεων, αφετέρου για τα ποιοτικά χαρακτηριστικά του για την υποβοήθηση του ηχητικού σχεδιασμού.
Η ηχητική προσομοίωση βασίζεται στην πραγματοποίηση ηχογραφήσεων σε έναν χώρο. Οι χώροι ενδιαφέροντος στο πλαίσιο του συγκεκριμένου έργου αποτελούν κατά κανόνα χώρους πολιτιστικής κληρονομιάς. Στη συνήθη περίπτωση, τέτοιοι χώροι δεν προσφέρουν παροχή ηλεκτρικού ρεύματος και η διαδικασία απαιτεί δυνατότητες φορητότητας. Επιπλέον, στόχος είναι η δημιουργία μεγάλων και δυναμικών αποθετηρίων με τη συνδρομή πολλών διαφορετικών χρηστών. Οι παραπάνω απαιτήσεις δικαιολογούν έναν συμβιβασμό στην πιστότητα και την ακρίβεια των μετρήσεων, οι οποίες πρέπει να μπορούν να εκτελεστούν από μη εξειδικευμένους χρήστες και με προσβάσιμο εξοπλισμό.
Σε αυτή την κατεύθυνση, έχει επιλεγεί σαν μεθοδολογία η χρήση ενός φορητού εγγραφέα με μικρόφωνα σε διάταξη Soundfield που επιτρέπει την εγγραφή και κωδικοποίηση τόσο σε κωδικοποίηση B-Format, όσο και τη χρήση μόνο της πανκατευθυντικής συνιστώσας W του B-Format. Ως πηγή ήχου χρησιμοποιείται μία φορητή πηγή ήχου που αναπαράγει ημιτονοειδής σαρώσεις με διαφορετικά χαρακτηριστικά, καθώς και μπαλόνια για κρουστικές διεγέρσεις. Οι σαρώσεις δημιουργούνται από το λογισμικό REW με χρήση διαφορετικών παραμετροποιήσεων ως προς την ταχύτητα σάρωσης.
Κατά την ηχογράφηση στον χώρο επιλέγονται συγκεκριμένες θέσεις της πηγής και του εγγραφέα. Οι θέσεις επιλέγονται εμπειρικά, με βάση τα πιο χαρακτηριστικά του χώρου. Επιλέγονται οι πιο πιθανές θέσεις πηγής και ακροατή για ένα τυπικό σενάριο κινηματογράφησης. Ωστόσο, στόχος είναι να δοθεί στον χρήστη η δυνατότητα να επιλέξει σχετικές θέσεις πηγής και χρήστη οι οποίες δεν έχουν προβλευθεί κατά τη διαδικασία των ηχογραφήσεων. Σε αυτή την κατεύθυνση, πρέπει να βρεθεί ένα μοντέλο προσομοίωσης που να υπολογίζει την απόκριση σε κάθε θέση πηγής-δέκτη με χρήση των καταγεγραμμένων θέσεων. Αυτή η μεθοδολογία εφαρμόστηκε για την καταγραφή και τη μοντελοποίηση συγκεκριμένων χώρων που σχετίζονται με την πολιτιστική κληρονομιά στην Κύπρο. Σε κανέναν από τους επιλεγμένους χώρους δεν υπήρχε η δυνατότητα ηλεκτρικής παροχής, οπότε η απαίτηση της φορητότητας ήταν δεδομένη.
Στην παρούσα εργασία πραγματοποιείται μια διπλή διερεύνηση. Αφενός διερευνάται η επίδραση των διαφορετικών σημάτων διέγερσης, δηλαδή η αναπαραγωγή των ημιτονοειδών σαρώσεων με διαφορετικά χαρακτηριστικά, καθώς και η χρήση κρουστικών διεγέρσεων (π.χ. μπαλόνι). Παράλληλα, εξετάζεται πειραματικά η μεθοδολογία προσομοίωσης της απόκρισης σε συγκεκριμένη θέση πηγής-δέκτη με βάση της υπόλοιπες. Για αυτό τον λόγο πραγματοποιείται πείραμα σε ελεγχόμενο χώρο, όπου γίνεται η καταγραφή για 10 διαφορετικές θέσεις πηγής και δέκτη σύμφωνα με τη μεθοδολογία που παρουσιάστηκε. Στη συνέχεια, η μία θέση θεωρείται άγνωστη και υπολογίζεται έχοντας ως είσοδο της υπόλοιπες 9. Τα αποτελέσματα συγκρίνονται με την καταγεγραμμένη απόκριση για τη δεδομένη θέση πηγής-δέκτη.
|
Inverse characterization of sound absorbing media using one dimensional analytical Biot’s poroelasticity theory solutions
Παρουσιαστής:
Christos Panagiotopoulos (PYTHMEN, AUTh)
Συγγραφείς:
Luis Sanchez-Ricart, Christos Panagiotopoulos
Περίληψη:
Design of vibro-acoustic systems including poroelastic material, with main aim the reduction if not cancellation of noise, require the knowledge of several material parameters. These material parameters usually are possible to be defined using some regular test in a standard acoustic laboratory. Here, we study an inverse technique for the characterization of poroelastic materials based on Biot’s theory of poroelasticity. Experimental setups for such a procedure usually consist of some configuration of several sequentially positioned layers each of it in the general case could be a poroelastic medium, some fluid or an elastic solid. As an indicative example we mention a configuration formed by a fluid, two porous layers saturated by a fluid, a solid layer and a second fluid. The configurations considering here result in an one-dimensional problem in the longitudinal direction, free of external forces per unit volume, stationary, and in the frequency domain ω. The problem represents the ideal conditions of the Kundt’s or impedance tube. In our work we take advantage of analytical solutions for the one-dimensional case of the poroelasticity’s boundary value problem. Based on previous works of one of the authors (LSR), the macroscopic model is valid from low to high frequencies; therefore, the analytical solutions are valid from low to high frequencies. Utilizing these solutions we develop a java-based toolkit that solves genelar case of an indefinite finite number of layers multidomain problem and calculates acoustical indicators, e.g. the surface impedance, the reflection coefficient or the absorption coefficient, important for poroelastic material characterization in vibro-acoustic applications. Following that we set a minimization problem in order to approximate the material parameters using the measured acoustical indicators. For the minimization procedure we use an evolutionary algorithm, namely the differential evolution, which is a gradient free algorithm appropriate for global optimization. Finally, examples that validate the current approach are presented.
|
Ανάπτυξη μοντέλου πρόλεξης της κυματομορφής κρότου υπερηχητικού αεροσκάφους στο έδαφος με είσοδο τις συνθήκες πτήσης
Συγγραφείς:
Πέτρος Νικολάου, Πηνελόπη Μενούνου
Περίληψη:
Οι υπερηχητικοί κρότοι (sonic booms) είναι κρότοι υψηλής έντασης που δημιουργούνται κατά την πτήση υπερηχητικών αεροπλάνων, διαδίδονται στην ατμόσφαιρα μέχρι το έδαφος και μπορεί να προκαλέσουν ηχορύπανση ή και υλικές ζημιές. Οι συνθήκες της πτήσης ενός υπερηχητικού αεροσκάφους, όπως ταχύτητα πτήσης, γωνία προσβολής και υψόμετρο πτήσης επηρεάζουν τη δημιουργία ενός υπερηχητικού κρότου γύρω από το αεροσκάφος και κατ’ επέκταση την κυματομορφή του κρότου που θα φτάσει στο έδαφος. Στην παρούσα εργασία μελετάται ο τρόπος δημιουργίας του υπερηχητικού κρότου γύρω από το αεροπλάνο και διάδοσης του στην ατμόσφαιρα μέχρι το έδαφος. Επιπλέον παρουσιάζεται ένα νευρωνικό δίκτυο το οποίο, έπειτα από κατάλληλη εκπαίδευση, δέχεται ως είσοδο τις συνθήκες πτήσης και επιστρέφει ως έξοδο την κυματομορφή στο έδαφος.
Στα πλαίσια της παρούσας εργασίας δημιουργήθηκε ένα προκαταρκτικό σχέδιο ενός υπερηχητικού επιβατηγού αεροσκάφους και μελετήθηκε ο υπερηχητικός του κρότος. Η μελέτη του υπερηχητικού κρότου περιλαμβάνει 2 φάσεις: i) την δημιουργία του κρότου κοντά στο αεροπλάνο όπου η κυματομορφή του διαμορφώνεται από την υπερηχητική ροή γύρω από το αεροπλάνο, ii) την διάδοση του κρότου μέσα στην ατμόσφαιρα όπου η κυματομορφή του αλλάζει λόγω μη γραμμικότητας καθώς και των μηχανισμών απορρόφησης της ατμόσφαιρας.
Για τον κρότο κοντά στο αεροπλάνο χρησιμοποιήθηκε η θεωρία του Whitham (Whitham 1952). Με βάση τη θεωρία αυτή η κυματομορφή του κρότου κοντά στο αεροπλάνο προκύπτει από τον υπολογισμό ενός ολοκληρώματος κατά μήκος του άξονα διατοιχισμού (διαμήκη άξονα) του αεροπλάνου. Η υπό ολοκλήρωση ποσότητα περιλαμβάνει τη δεύτερη παράγωγο της διατομής του αεροπλάνου σε κάθε θέση του διαμήκη άξονα συν τη δεύτερη παράγωγο μιας ισοδύναμης διατομής που αντιστοιχεί στην τιμή της δύναμης άντωσης σε κάθε θέση του διαμήκη άξονα. Η διατομή κατά το διαμήκη άξονα υπολογίστηκε από τη σχεδίαση του αεροπλάνου ενώ η ισοδύναμη διατομή που αντιστοιχεί στην άντωση με βάση τη θεωρία του Carlson (Carlson 1971). Το άθροισμα των συναρτήσεων των διατομών ως προς το διαμήκη άξονα δεν είναι 2 φορές παραγωγίσιμο. Συνεπώς, ο αριθμητικός υπολογισμός της δεύτερης παράγωγου του αθροίσματος των 2 διατομών επιστρέφει απειρισμούς με αποτέλεσμα το ολοκλήρωμα να αποκλίνει. Διάφοροι τρόποι έχουν προταθεί για την αντιμετώπιση αυτού του προβλήματος όπως η εισαγωγή συναρτήσεων Bessel στην υπό ολοκλήρωση ποσότητα (Whitham 1952), (Lighthill 1949). Στην παρούσα εργασία προτείνεται μία εναλλακτική λύση. Το άθροισμα των διατομών προσεγγίζεται τμηματικά από πολυώνυμα. Τα όρια του κάθε τμήματος τοποθετούνται εκεί όπου υπάρχει ασυνέχεια της 2ης παραγώγου. Κάτι τέτοιο συμβαίνει στις αλλαγές γεωμετρίας όπως αρχή πτέρυγας ή αρχή ουραίου κ.α. Κατ’ επέκταση το ολοκληρωμα που δίνει την κυματομορφή υπολογίζεται αναλυτικά και τμηματικά από τα επιμέρους ολοκληρώματα που δημιουργούνται.
Για την διάδοση του κρότου στην ατμόσφαιρα χρησιμοποιείται υπάρχων κώδικας ο οποίος λύνει τις μη γραμμικές εξισώσεις Burgers για διάδοση σε μη ομογενή ατμόσφαιρα και λαμβάνει υπόψιν του το θερμοιξώδες καθώς και τους μηχανισμούς μοριακής χαλάρωσης του οξυγόνου και του αζώτου.
Στην παρούσα εργασία αναπτύσσεται ένα μοντέλο πρόλεξης της κυματομορφής του κρότου στο έδαφος το οποίο έχει ως είσοδο την ταχύτητα πτήσης, τη γωνία προσβολής και το ύψος της πτήσης. Το μοντέλο βασίζεται σε ένα νευρωνικό δίκτυο FCNN (fully connected neural network), το οποίο έχει εκπαιδευτεί με δεδομένα από πολλούς συνδυασμούς εισόδων και εξόδων. Τα δεδομένα προκύπτουν από την εύρεση του ολοκληρώματος της κυματομορφής κοντά στο αεροσκάφος με βάση τη θεωρία του Whitham και την προσομοίωση της διάδοσης αυτού στην ατμόσφαιρά μέσα από τις εξισώσεις Burgers. Το πλεονέκτημα του νευρωνικού έναντι των παραδοσιακών μεθόδων είναι ότι αφού εκπαιδευτεί μπορεί να δώσει προλέξεις του υπερηχητικού κρότου σε πραγματικό χρόνο.
|
Ταυτοποίηση πλαστικής παραμόρφωσης, σχηματισμού ρωγμών και εξέλιξης αστοχίας σε χάλυβα με την μέθοδο της Ακουστικής Εκπομπής
Παρουσιαστής:
Νικόλαος Αγγελόπουλος (Ινστιτούτο Βιώσιμης Κινητικότητας & Δικτύων Μεταφορών (Ι.ΜΕΤ.)/Εθνικό Κέντρο Έρευνας και Τεχνολογικής Ανάπτυξης (ΕΚΕΤΑ))
Συγγραφείς:
Vassilis Kappatos, Νικόλαος Αγγελόπουλος, Θεοχάρης Τσένης
Περίληψη:
Στην παρούσα εργασία διερευνάται η χρησιμοποίηση της μεθόδου της Ακουστικής Εκπομπής (AE) για την ανίχνευση πλαστικής παραμόρφωσης, σχηματισμού ρωγμών, και εξέλιξης της αστοχίας σε δομικό χάλυβα κατασκευών. Ο προσδιορισμός των σημάτων ΑΕ που σχετίζονται με αστοχία και έναρξη πλαστικής παραμόρφωσης αποτελεί σημαντικό παράγοντα στην ανάπτυξη και εφαρμογή συστημάτων παρακολούθησης δομικής ακεραιότητας (Structural Health Monitoring - SHM) σε κρίσιμες υποδομές. Κατά συνέπεια, στα πλαίσια της προβλεπτικής συντήρησης, είναι δυνατή η έγκαιρη πρόβλεψη αστοχιών, ενισχύοντάς σημαντικά την ασφάλεια, την αξιοπιστία και τη μακροβιότητα των υποδομών.
Στην συγκεκριμένη εργασία ακολουθήθηκε η παρακάτω μεθοδολογία: Για τον προσδιορισμό των κύριων χαρακτηριστικών των κυμάτων ΑΕ που παράγονται ενδογενώς από το ίδιο το υλικό κατά τα στάδια της πλαστικής παραμόρφωσης, σχηματισμού ρωγμών και εξέλιξης αστοχίας, το διάγραμμα της χρονικής εξέλιξης της ΑΕ κατά την διάρκεια των μηχανικών δοκιμών απεικονίστηκε μαζί με τη καμπύλη Τάσης – Παραμόρφωσης. Η καταγεγραμμένη δραστηριότητα AE διαχωρίστηκε σε διακριτές ομάδες σημάτων που αντιστοιχούν στα στάδια ελαστικής παραμόρφωσης, ορίου διαρροής, πλαστικής παραμόρφωσης, και αστοχίας που παρατηρήθηκαν στην καμπύλη Τάσης-Παραμόρφωσης. Για την ανάλυση της κατανομής της έντασης των σημάτων ΑΕ κατά τα παραπάνω στάδια, αξιοποιήθηκε η ενέργεια των αντίστοιχων σημάτων, καθώς συμβάντα αστοχίας και μεταβολής στη δομή του υλικού συνοδεύονται από υψηλές τιμές ενέργειας σε σχέση με τον ανεπιθύμητο θόρυβο που μπορεί επίσης να καταγραφεί κατά την δοκιμή ΑΕ. Υψηλότερη ενέργεια διαπιστώθηκε στο όριο διαρροής του υλικού όπου πραγματοποιείται η μετάβαση από την αντιστρέψιμη ελαστική παραμόρφωση στη μόνιμη πλαστική παραμόρφωση. Στη συνέχεια, η παραγόμενη ενέργεια στα σήματα της ΑΕ μειώνεται κατά το στάδιο της πλαστικής παραμόρφωσης, ενώ στη συνέχεια αυξάνεται κατά τον σχηματισμό και εξέλιξη ρωγμών, καθώς και κατά την τελική αστοχία του δείγματος. Κατόπιν ανάλυσης των καταγεγραμμένων σημάτων ΑΕ διαπιστώθηκε ότι το κάθε στάδιο, από την ελαστική παραμόρφωση έως την τελική θραύση, χαρακτηρίζεται από συγκεκριμένα μοτίβα σημάτων. Αυτή η ανάλυση οδήγησε στον προσδιορισμό των κυρίως χαρακτηριστικών των σημάτων ΑΕ που σχετίζονται με την ελαστική παραμόρφωση, πλαστική παραμόρφωση, τον σχηματισμό και διάδοση ρωγμών, καθώς και την τελική αστοχία. Η κατηγοριοποίηση των σημάτων AE μπορεί να παρέχει σημαντική πληροφορία σχετικά με την συμπεριφορά του υλικού υπό συνθήκες εντατικής φόρτισης, επιτρέποντας τον προσδιορισμό και τον εντοπισμό σε πραγματικό χρόνο την έναρξη και εξέλιξη της αστοχίας υπό συνθήκες εντατικής φόρτισης. Κατά την εκκίνηση και εξέλιξη αστοχίας παρατηρήθηκε έντονη δημιουργία σημάτων ΑΕ υψηλής ενέργειας που σχετίζονται με την έναρξη της πλαστικής παραμόρφωσης και διάδοσης ρωγμών.
Επομένως, με την ταυτοποίηση και την εξαγωγή των κυρίως χαρακτηριστικών των σημάτων ΑΕ που σχετίζονται με τα συμβάντα αυτά, είναι δυνατή η έγκαιρη διάγνωση και πρόβλεψη εκτεταμένης πλαστικής παραμόρφωσης και ρηγμάτωσης στο υλικό, πριν εξελιχθούν σε κρίσιμο βαθμό και προκαλέσουν στατική αστάθεια και ξαφνική αστοχία σε μια κατασκευή.
|
Μελέτη ηχηρότητας υπερηχητικού κρότου (sonic boom) στο έδαφος και σε αστικό περιβάλλον
Συγγραφείς:
Πέτρος Νικολάου, Πηνελόπη Μενούνου
Περίληψη:
Οι υπερηχητικοί κρότοι (sonic booms) είναι κρότοι υψηλής έντασης που δημιουργούνται κατά την πτήση υπερηχητικών αεροπλάνων, διαδίδονται στην ατμόσφαιρα μέχρι το έδαφος και μπορεί να προκαλέσουν ηχορύπανση ή και υλικές ζημιές. Η γεωμετρία ενός υπερηχητικού αεροσκάφους και οι συνθήκες της πτήσης, όπως ταχύτητα πτήσης, γωνία προσβολής και υψόμετρο πτήσης επηρεάζουν τη δημιουργία του υπερηχητικού κρότου γύρω από το αεροσκάφος και κατ’ επέκταση την κυματομορφή του κρότου που θα φτάσει στο έδαφος. Σε άλλη εργασία στο ίδιο συνέδριο οι συγγραφείς έχουν αναπτύξει ένα μοντέλο το οποίο προβλέπει τον υπερηχητικό κρότο στο έδαφος ανάλογα με τις συνθήκες πτήσης. Σε αυτήν την εργασία οι συγγραφείς χρησιμοποιούν το ήδη υπάρχον μοντέλο για να συνδέσουν τις συνθήκες πτήσης και τη γεωμετρία του αεροσκάφους με τους συντελεστές ηχηρότητας. Η μελέτη αποσκοπεί στην επίλυση του προβλήματος θορύβου των υπερηχητικών αεροσκαφών.
Η εργασία αυτή χρησιμοποιεί ως δεδομένα τις κυματομορφές υπερηχητικών κρότων. Υπάρχουν διάφοροι συντελεστές ηχηρότητας στη βιβλιογραφία όπως είναι η χρήση φίλτρων Α, Β, Cή D. Σε αυτήν την εργασία επιλέγεται η μέθοδος του Stevens (Stevens 1972). Σε αυτήν τη μέθοδο ο υπολογισμός του συντελεστή ηχηρότητας ξεκινάει με την εύρεση του μετασχηματισμού Fourier (FFT) (φάσμα) της κυματομορφής του υπερηχητικού κρότου. Στη συνέχεια βρίσκουμε την ενέργεια του φάσματος που υπάρχει σε κάθε τριτο-οκτάβα συχνοτήτων (ολοκλήρωμα του φάσματος στο τετράγωνο με όρια τις ακραίες συχνότητες της τριτο-οκτάβας). Από την ενέργεια με βάση ειδική εξίσωση προκύπτουν τα dB που αντιστοιχούν σε κάθε τριτο-οκτάβα. Τα dB αυτά μετασχηματίζονται σε μία ισοδύναμη τιμή η οποία ανάγεται σε μία τριτο-οκτάβα αναφοράς την 3150Hz.Η τριτο-οκτάβα αναφοράς επιλέγεται με βάση την αντίληψη του ήχου από το ανθρώπινο αυτί. Στην συνέχεια πραγματοποιείται ένας δεύτερος μετασχηματισμός. Τα dΒ που προέκυψαν από προηγούμενο μετασχηματισμό μετατρέπονται σε μία άλλη μονάδα τα sone. Ένα Sone είναι θόρυβος 32dB τον οποίο προκαλεί πηγή συχνότητας 3150Hz. Αφού γίνουν οι μετασχηματισμοί σε sone για την κάθε τριτο-οκτάβα με κατάλληλους αθροιστικούς τύπους προκύπτει η συνολική ηχηρότητα σε sone και dB.
Με τον παραπάνω τρόπο η ηχηρότητα υπολογίζεται με βάση την κυματομορφή του κρότου που φτάνει στο έδαφος. Η κυματομορφή αυτή ωστόσο θα αλλάξει και θα αλλοιωθεί όταν έρθει σε επαφή με τις γεωμετρίες των κτιρίων ενός αστικού περιβάλλοντος. Η αλλοίωση αυτή προκύπτει από την ανάκλαση του κρότου στις επιφάνειες αλλά και από την περίθλαση του κρότου στις ακμές των κτιρίων. Στην παρούσα εργασία χρησιμοποιείται ένας υπάρχον αλγόριθμος (Menounou 2023) ο οποίος μας επιτρέπει να προβλέψουμε την κατοπτρική ανάκλαση και την περίθλαση του υπερηχητικού κρότου γύρω από κτίρια. Ο αλγόριθμος υπολογίζει την απόκριση σε μοναδιάια βαθμίδα του χώρου διάδοσης και στη συνέχεια χρησιμοποιεί συνέλιξη με την παράγωγο της κυματομορφής για να προβλέψει το πώς η γεωμετρία αλλάζει την κυματομορφή. Το προσπίπτον κύμα θεωρείται επίπεδο. Οι αποκρίσεις των ανακλάσεων σε μοναδιαία βαθμίδα είναι επίσης μοναδιαίες βαθμίδες με διαφορετικό χρόνο άφιξης ανάλογα με την απόσταση του δέκτη από την ανακλούσα επιφάνεια. Οι αποκρίσεις των περιθλάσεων έχουν επίσης διαφορετικούς χρόνους άφιξης και η μορφή τους προκύπτει από αναλυτική λύση που αναπτύχθηκε σε προηγούμενη δουλειά των συγγραφέων για περίθλαση επίπεδων κυμάτων.
Ο παραπάνω αλγόριθμος εφαρμόστηκε σε μια γεωμετρία σπιτιού. Ο συντελεστής ηχηρότητας υπολογίστηκε για συγκεκριμένη γεωμετρία αεροσκάφους σε διαφορετικές συνθήκες πτήσης με και χωρίς τη γεωμετρία του σπιτιού παρούσα.
|
Ανίχνευση Συμβάντων Ακουστικής Εκπομπής σε Μεταλλικές Πύλες Δεξαμενών Ανύψωσης σε Ποτάμια
Παρουσιαστής:
Νικόλαος Αγγελόπουλος (Ινστιτούτο Βιώσιμης Κινητικότητας & Δικτύων Μεταφορών (Ι.ΜΕΤ.) / Εθνικό Κέντρο Έρευνας και Τεχνολογικής Ανάπτυξης (ΕΚΕΤΑ))
Συγγραφείς:
Vassilis Kappatos, Θεοχάρης Τσένης, Νικόλαος Αγγελόπουλος
Περίληψη:
Η ανίχνευση συμβάντων ακουστικής εκπομπής μικρορωγμών αποτελεί κρίσιμο στοιχείο της παρακολούθησης και έγκαιρης ανίχνευσης στατικών δομικών αστοχιών σε υποδομές. Η παρούσα μελέτη επικεντρώνεται στην ανίχνευση συμβάντων μικρορωγμών ακουστικής εκπομπής σε μεταλλικές πύλες δεξαμενών ανύψωσης σε ποτάμια στα πλαίσια του Ευρωπαϊκού έργου CRISTAL. Το ευρωπαϊκό έργο CRISTAL αποσκοπεί στην αύξηση του όγκου φορτίων που μεταφέρονται μέσω εσωτερικών υδάτινων οδών κατά τουλάχιστον 20% και στη βελτίωση της αξιοπιστίας της μεταφοράς μέσω ποταμών κατά 80% σε σχέση με την παρούσα κατάσταση. Το έργο θα υλοποιηθεί σε τρεις πιλοτικές χώρες στην Ιταλία, την Πολωνία και Γαλλία. Προς επίτευξη των προηγούμενων στόχων η αύξηση της ανθεκτικότητας των μεταφορικών διαδρόμων απαιτείται. Προς τούτο ο έλεγχος της καλής λειτουργίας των μεταλλικών πυλών σε δεξαμενές ανύψωσης σε ευρωπαϊκά ποτάμια επιβάλλεται, ενώ η χρήση ανίχνευσης ακουστικών εκπομπών από τις μεταλλικές πύλες επιλέχθηκε. Μέσα σε αυτό το περιεχόμενο δράσεων και πλαίσιο του CRISTAL, κατά τη διάρκεια της παρούσας έρευνας επισκεφτήκαμε δεξαμενές ανύψωσης τόσο στην Γαλλία αλλά και Ιταλία όπου οι μεταφορές μέσω ποταμών ακμάζουν, ενώ ένα από τα κρίσιμα σημεία του έργου. Πιο συγκεκριμένα, στα πλαίσια αυτής της έρευνας αναπτύχθηκε νευρωνικό μοντέλο αποθορυβοποίησης ακουστικών εκπομπών προερχόμενες από τις μεταλλικές πύλες στις δεξαμενές ανύψωσης με τη χρήση κατάλληλου καταγραφέα ακουστικής εκπομπής υψηλής ευαισθησίας. Το σύνολο του χώρου εκμάθησης του νευρωνικού μοντέλου αποτελούν καταγραφές των ακουστικών εκπομπών κατά τη διάρκεια κανονικής λειτουργίας των μεταλλικών πυλών αλλά και χρήση φορητής συσκευής παραγωγής κυματομορφών υπερήχων με την πηγή κοντά και γύρω σε έκαστο πιεζοηλεκτρικό αισθητήριο ακουστικής εκπομπής και με εύρος συχνοτήτων κυματομορφής από 30-80kHz, μαζί με την παραδοσιακή προσομοίωση μικοορωγμών με τη χρήση μολυβιού και τη χρήση της τεχνικής του σπασίματος μυτών ενός μηχανικού μολυβιού. Το νευρωνικό μοντέλο που χρησιμοποιήθηκε στη συγκεκριμένη έρευνα είναι του είδους κωδικοποιητή-αποκωδικοποιητή (autoencoder), το οποίο χρησιμοποιείται ευρέως σε αποθορυβοποιήσεις και έμμεση εξαγωγή χαρακτηριστικών σήματος, με την προσθήκη μιας ακόμα εξόδου φέρουσα του επιπέδου εμπιστοσύνης ότι πράγματι πρόκειται για ένα συμβάν ακουστικής εκπομπής από μικρορωγμή. Η κάθε εγγραφή αποτελείται από 4096 δείγματα, οπότε είναι και είσοδος-διάνυσμα του εν λόγω νευρωνικού, με έξοδο την αποθορυβοποιημένη ακουστική εγγραφή αλλά και το επίπεδο εμπιστοσύνης ανίχνευσης μικρορωγμής. Κατά τη διάρκεια της παρούσας μελέτης, διάφορες μορφολογίες νευρωνικού δικτύου δοκιμάστηκαν, όπως με 1, 2 ή 3 επίπεδα νευρώνων, με διάφορες διαστάσεις του χώρου αναπαράστασης από 512 μέχρι 4096, διάφορες συναρτήσεις λάθους όπως MSE, L1Loss, HuberLoss, QuantileLoss, και διάφορους βελτιστοποιητές όπως Adam, Nadam, SGD, RMSprop, Adamax, Adadelta, ASGD, καθώς και με χρήση L1 και L2 regularizers. Όλα χρησιμοποιήθηκαν στην παρούσα εργασία με στόχο τη βελτιστοποίηση της εκμάθησης του νευρωνικού δικτύου..
|
Remote microphone virtual sensing with multi-microphone configurations
Παρουσιαστής:
Achilles Kappis (Institute of Sound and Vibration Research, University of Southampton)
Συγγραφείς:
Achilles Kappis, Jordan Cheer, Jihui (Aimee) Zhang
Περίληψη:
In conventional local Active Noise Control (ANC) systems, microphones must be placed directly where the sound field needs to be controlled. However, this is often impractical in many applications, such as the active headrest. To overcome this issue, Virtual Sensing (VS) methods are employed to project the control point from the location of physical sensors to the desired position. The Remote Microphone Technique is used in this study to estimate the sound field at a location remote from the physical sensors. This involves calculating an observation filter in a preliminary identification stage, which is then used during operation of the system to estimate the sound field at the position of interest from the measured signals.
Traditionally, omnidirectional microphones are used in the design and implementation of ANC and VS systems. However, this study aims to build upon previous findings in the literature that suggest knowledge of pressure and pressure gradient can provide significant advantages to the estimation process. To acquire estimates of the pressure gradient at the position of the physical sensors, multi-microphone configurations are used in this work, as omnidirectional microphones are sensitive to pressure only.
Expanding upon prior research on estimation with linear and circular microphone arrays, similar configurations have been implemented where multi-microphone sub-arrays have replaced each microphone in the array. Frequency domain simulations have been conducted where the optimal unconstrained observation filters have been calculated for a single-frequency sound field generated by multiple wide-sense stationary uncorrelated random noise sources situated on a circle around the area where estimation is required. The performance of the configurations is evaluated based on the spatial extent to which the estimation error is less than −10 dB, termed the estimation zone. Furthermore, the study explores the robustness of the multi-microphone configurations against perturbations and the effect regularisation has on the estimation performance.
The findings indicate that using multiple microphones per measurement position to incorporate the pressure gradient in the estimation process greatly improves performance, providing more accurate sound field estimation and greater spatial extension of the estimation zones. Estimation is improved along the direction of the pressure gradient estimate when this is available with higher-order estimates resulting in increased accuracy and larger zone extension. However, configurations with dense sub-arrays exhibit higher sensitivity to uncertainties, with setups providing high-order pressure gradient estimates being significantly affected by perturbations. Regularisation can partially alleviate the problem at the expense of decreasing the estimation performance, which results in smaller estimation zones.
|
Η χρήση οπτικοακουστικών διαδραστικών αφηγήσεων και δραστηριοτήτων ως μέσο ηχητικής ευαισθητοποίησης παιδιών 9-12 ετών
Παρουσιαστής:
Κωνσταντίνα Σταυροπούλου (Ιόνιο Πανεπιστήμιο)
Συγγραφείς:
Κωνσταντίνα Σταυροπούλου, Μηνάς Εμμανουήλ
Περίληψη:
Ζούμε σε ένα κόσμο, όπου τίποτα ουσιαστικό δε συμβαίνει χωρίς να είναι παρόν ο ήχος (Attali, 1991), ενώ παράλληλα διανύουμε την εποχή των καθημερινών θορύβων, των ήχων χαμηλής ευκρίνειας και της τάσης για μονοαισθητηριακή αντίληψη του περιβάλλοντος. Εν μέσω μίας τέτοιας περιόδου, ζητήματα όπως η καλλιέργεια της ακουσματικής εμπειρίας και η ευαισθητοποίηση των παιδιών στους ήχους και τα ηχοτοπία έρχονται στο προσκήνιο απασχολώντας τόσο την καλλιτεχνική, όσο και την ακαδημαϊκή αλλά και εκπαιδευτική κοινότητα. Η πολυσχιδής σχέση της τέχνης με τη φύση, αλλά και με τις σύγχρονες πολυμεσικές τεχνολογίες και τις τεχνολογίες του ήχου και της μουσικής, θεωρείται ολοένα και ικανότερη να ανταποκριθεί εκπαιδευτικά στις σύγχρονες αυτές ανάγκες.
Στην παρούσα ανακοίνωση αναδεικνύεται ο σχεδιασμός, η δημιουργία και η χρήση οπτικοακουστικών διαδραστικών αφηγήσεων και δραστηριοτήτων, ως βιωματικό εκπαιδευτικό εργαλείο καλλιέργειας της ακουσματικής εμπειρίας σε έρευνα που πραγματοποιήθηκε σε παιδιά ηλικίας 9-12 ετών στο τριθέσιο δημοτικό σχολείο του χωριού Ζάκρος στο νομό Λασιθίου. Στα πλαίσια της συγκεκριμένης έρευνας σχεδιάστηκαν και κατασκευάστηκαν με οπτικό και ηχητικό πρωτόλειο υλικό από το παγκόσμιο γεωπάρκο UNESCO της Σητείας, εντός των συνόρων του οποίου βρίσκεται και το χωριό Ζάκρος, τρεις οπτικοακουστικές διαδραστικές αφηγήσεις με περιφερικό ήχο και μία ηχητική διαδραστική δραστηριότητα. Βασικός σκοπός της έρευνας αποτέλεσε η μελέτη της ηχητικής ευαισθητοποίησης των παιδιών ως αποτέλεσμα του βιώματος των εν λόγω αφηγήσεων. Ως χαρακτηριστικά ηχητικής ευαισθητοποίησης και κατ’ επέκταση κάποια από τα βασικά ερευνητικά ερωτήματα εξετάστηκαν η αντιληπτική ικανότητα ηχητικών ιδιοτήτων, η ικανότητα συναισθηματικής σύνδεσης με ήχους και ηχοτοπία, αλλά και η συμβολή της διάδρασης προς μία δημιουργική αντίληψη του ήχου.
Η επιλογή της χρήσης οπτικοακουστικών διαδραστικών αφηγήσεων ως βασικό εργαλείο της συγκεκριμένης έρευνας θεωρήθηκε απολύτως σκόπιμη και σημαντική, κάτι που επιβεβαιώνεται τόσο από την υπάρχουσα βιβλιογραφία, όσο και από την ίδια την έρευνα όπως θα παρουσιαστεί εκτενέστερα και στη συνέχεια. Ο συνδυασμός της μακρόχρονης δύναμης των αφηγήσεων στον άνθρωπο με την εξέλιξη της ψηφιακής και της διαδραστικής τεχνολογίας, αλλά και την καθημερινή ζωή των σύγχρονων παιδιών, χρήζει τέτοιου είδους αφηγήσεις ως μία καινοτόμο παιδαγωγική προσέγγιση, η επιτυχία της οποίας βρίσκεται στην παροχή ευφάνταστων και δημιουργικών εργαλείων που επιτρέπουν στα παιδιά την καλλιέργεια της δημιουργικότητας, της στοχαστικής σκέψης και των τεχνολογικών δεξιοτήτων και γραμματισμών (Ohler, 2013, σ.15). Απολύτως σκόπιμη και εξέχουσας σημασίας για την ορθότητα της πραγματοποίησης μίας μελέτης τέτοιας φύσεως κρίθηκε επίσης εκ προοιμίου η αποδοχή και ανάδειξη της αμφίδρομης σχέσης μεταξύ καλλιτεχνικής δημιουργίας και ερευνητικής διαδικασίας. Στον κεντρικό άξονα της οπτικής όλων των δημιουργικών φάσεων, από την επιλογή των ιστοριών των αφηγήσεων μέχρι την ολοκλήρωση των οπτικοακουστικών διαδραστικών δημιουργιών, τοποθετήθηκε ο ήχος και η ανάδειξη αυτού, με σκοπό τη δημιουργία μίας ποιοτικής και πολύπλευρης ηχητικής εμπειρίας για τα παιδιά.
Ως εκ τούτου, η επιλογή των ιστοριών των αφηγήσεων πραγματοποιήθηκε με πρωτεύον κριτήριο την ύπαρξη ηχητικών στιγμών και στοιχείων εντός του κειμένου τους. Στα ίδια πλαίσια, πραγματοποιήθηκαν με την επιλογή των ιστοριών οι πολύμηνες ηχογραφήσεις πεδίου εντός διαφόρων σημείων του γεωπάρκου και στη συνέχεια δημιουργήθηκε ο ηχητικός σχεδιασμός κάθε αφήγησης. Με την ολοκλήρωση του συνόλου του ηχητικού σκέλους κάθε αφήγησης, πραγματοποιήθηκαν οι βιντεοσκοπήσεις στα ίδια σημεία των ηχογραφήσεων και ακολούθως η δημιουργία της οπτικοποίησης, η οποία ήταν απόλυτα βασισμένη στη ροή, το ρυθμό και τα χαρακτηριστικά του ηχητικού σχεδιασμού. Τελευταίο στάδιο της δημιουργίας υπήρξε ο σχεδιασμός της διάδρασης και ο προγραμματισμός των διεπαφών με ηχητικά δείγματα από το σχεδιασμό κάθε αφήγησης.
Για τις ανάγκες του σκοπού της έρευνας διεξήχθη συλλογική μελέτη περίπτωσης, όπου μέσω ποιοτικών μεθόδων ανάλυσης των δεδομένων εξήχθησαν ποικίλα αποτελέσματα και συμπεράσματα σε σχέση με τη διερεύνηση της ηχητικής ευαισθητοποίησης και εκπαίδευσης των παιδιών. Αρχικά επιβεβαιώθηκαν τα πολύμορφα και σημαντικά οφέλη των πολυμεσικών αφηγήσεων, όπως επίσης διαφάνηκε ότι οι σύγχρονες τεχνολογίες του ήχου και της διάδρασης δίνουν το χώρο και την απαιτούμενη ελευθερία στο παιδί για μία πολύπλευρη ηχητική καλλιέργεια. Μεταξύ των συμπερασμάτων παρουσιάζουν επίσης ενδιαφέρον η ικανότητα που επέδειξαν τα παιδιά στην αναγνώριση ηχητικών και μουσικών ιδιοτήτων των ηχητικών σχεδιασμών των αφηγήσεων, η εντυπωσιακή ικανότητα συναισθηματικής σύνδεσης ήχων με την καθημερινή ζωή, αλλά και το θετικό πρόσημο της χρήσης διαδραστικών συστημάτων στη διαδικασία ηχητικής σύνθεσης. Τέλος, εντύπωση και προβληματισμό για μελλοντική διερεύνηση προκάλεσε η ένδειξη αδυναμίας αντίληψης του περιφερικού ήχου από το σύνολο των παιδιών μεγαλύτερης ηλικίας (11-12 ετών).
Βιβλιογραφία
Attali, J. (1991). Θόρυβοι. Δοκίμιο Πολιτικής Οικονομίας της Μουσικής. Κέδρος
Ohler, J. B. (2013). Digital storytelling in the classroom: New pathways to literacy,
Learning, and creativity. Corwin Press. https://doi.org/10.4135/9781452277479
|
A framework for organising audio-visual cross-modal correspondences for the Soundsketcher project.
Παρουσιαστής:
Κωνσταντίνος Γιαννός (Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης)
Συγγραφείς:
Κωνσταντίνος Γιαννός, Αστέριος Ζαχαράκης, Γεώργιος Αθανασόπουλος, Αιμίλιος Καμπουρόπουλος
Περίληψη:
Attributes or features from different sensory modalities are often systematically associated with each other. This process is referred to as cross-modal correspondence. Unlike synesthesia, where associations are concurrent or immediately consecutive, cross-modal correspondences can occur between attributes that share similar positions on scales of sensory dimensions with distinct degrees of intensity (Spence, 2011).
This study aims to organise existing cross-modal associations between the auditory and the visual modalities in the context of the research project Soundsketcher. Soundsketcher seeks to create a prototype application for music visualisation in the form of graphic scores. One of the fundamental goals is to base mappings between sonic and visual structures on associations derived from existing knowledge of audio-visual correspondences.
The most extensively studied relationships to date are those between pitch and loudness and their visual correspondences. One of the most prominent identified associations with pitch is elevation, where ‘high’ corresponds to high pitch and ‘low’ to low pitch (Athanasopoulos et al., 2016; Baret 2005; Walker, 1987), a phenomenon also observed in many languages around the world (Stumpf, 1883; Evans & Treisman, 2010). The horizontal dimension, apart from indicating the passage of time in a significant amount of free-drawn systems of 2D music representation (Tan & Kelly 2004, Athanasopoulos & Moran, 2013) has also been mapped onto pitch, with ‘left’ corresponding to lower pitches and ‘right’ to higher pitches (Küssner et al., 2014; Lidji et al., 2007). In addition, size is another visual attribute that has been related to pitch. Specifically, large objects have been linked to low pitches, while small objects to high pitches (Speed et al., 2021; Evans & Treisman, 2010). Such correspondences can be attributed to statistical regularities in the environment where organisms smaller in size and living in higher elevations are more likely to produce higher pitches (Spence, 2022). In addition, Western music notation or the mere structure of a piano keyboard can also account for such cross-modalities. Another visual parameter that has been associated with high-low pitches is brightness and dark-bright objects, respectively (Ward et al., 2006; Marks, 1974). A notable mention should be made for colour and notes of the chromatic scale, where identified correspondences have been contrasting possibly due to the lack of a clear linear organisation (Spence & Di Stefano, 2022).
Several of the above-mentioned visual attributes have also been linked to loudness. For instance, large objects are typically matched to louder sounds, while small objects are to quieter ones (Eitan, 2013), which again may be grounded in naturally occurring statistical correlations (Spence, 2011), or occur due to metaphorical associations (Walker, 1987; Spence, 2022). Similarly, loudness and brightness have been significantly correlated, matching loud sounds to dark objects and quiet sounds to bright objects (e.g., Marks, 1987). Thickness has also been positively correlated to loudness (Küssner et al., 2014), as well as spatial location, such that louder sounds were related to higher elevation (Kohn & Eitan, 2012).
Duration and rhythm are crucial features in the perception of sound: the length of line segments has been found to be proportional to sound duration for Westerners, Japanese, literate and nonliterate Papua New Guineans (Athanasopoulos et al., 2016). These populations have graphically depicted stimuli featuring high attack densities with densely arranged lines, and the inverse for lower attack densities (Athanasopoulos et al., 2016; Athanasopoulos & Moran, 2013).
Timbre is one of the least explored sound elements for its potential visual analogues. A handful of studies have examined the relationship between timbre and shape, where instruments producing soft sounds such as the piano or the cello were associated with rounded shapes and instruments such as crash cymbals were associated with angular shapes (Adeli et al., 2014). At the same time, listeners have linked auditory roughness with jagged and spiky 2- and 3-dimensional shapes (Liew et al., 2017, 2018).
Despite the lack of studies on direct timbral-visual associations, recent works have demonstrated that some of the salient semantic dimensions of timbre such as brightness, roughness or mass (Zacharakis et al, 2016) and their various nuances (Wallmark, 2018; Reymore, 2022; Noble, 2022) could be visually represented. However, since timbre is significantly more complex than pitch or loudness, there is still room for adequate modelling of these semantic categories through audio features. This is a key area of focus for the Soundsketcher project, aiming to utilise such models for timbre semantics together with existing models for pitch, loudness and rhythm to achieve perceptually informed sound visualisations.
References
Adeli, M., Rouat, J., & Molotchnikoff, S. (2014). Audiovisual correspondence between musical timbre and visual shapes. Frontiers in Human Neuroscience, 8. https://doi.org/10.3389/fnhum.2014.00352
Athanasopoulos, G., & Moran, N. (2013). Cross-cultural representations of musical shape. Empirical Musicology Review, 8(3-4), 185-199. https://doi.org/10.18061/emr.v8i3-4.3940
Athanasopoulos, G., Tan, S. L., & Moran, N. (2016). Influence of literacy on representation of time in musical stimuli: An exploratory cross-cultural study in the UK, Japan, and Papua New Guinea. Psychology of Music, 44(5), 1126-1144. https://doi.org/10.1177/0305735615613427
Eitan, Z. (2013). How pitch and loudness shape musical space and motion: New findings and persisting questions. In S.-L. Tan, A. Cohen, S. Lipscomb & R. Kendall (Eds.), The psychology of music in multimedia (pp. 161-187). Oxford: Oxford University Press.
Evans, K. K., & Treisman, A. (2010). Natural cross-modal mappings between visual and auditory features. Journal of Vision, 10(1), 1-12. https://doi.org/10.1167/10.1.6
Kohn, D., & Eitan, Z. (2012). Seeing sound moving: congruence of pitch and loudness with human movement and visual shape. In 12th International Conference on Music Perception and Cognition/8th Triennial Conference of the European Society for the Cognitive Sciences of Music (p. 541). Thessaloniki: The School of Music Studies, Aristotle University of Thessaloniki.
Küssner, M. B., Tidhar, D., Prior, H. M., & Leech-Wilkinson, D. (2014). Musicians are more consistent: Gestural cross-modal mappings of pitch, loudness and tempo in real-time. Frontiers in Psychology, 5, 99328.
Lidji, P., Kolinsky, R., Lochy, A., & Morais, J. (2007). Spatial associations for musical stimuli: A piano in the head? Journal of Experimental Psychology: Human Perception and Performance, 33(5), 1189-1207. https://doi.org/10.1037/0096-1523.33.5.1189
Marks, L. E. (1974). On associations of light and sound: The mediation of brightness, pitch, and loudness. The American Journal of Psychology, 87(1-2), 173-188. https://doi.org/10.2307/1422011
Marks, L. E. (1987). On cross-modal similarity: Auditory–visual interactions in speeded discrimination. Journal of Experimental Psychology: Human Perception and Performance, 13, 384-394.
Noble, J., Thoret, E., Henry, M., & McAdams, S. (2020). Semantic dimensions of sound mass music: mappings between perceptual and acoustic domains. Music Perception, 38(2), 214-242.
Reymore, L. (2022). Characterizing prototypical musical instrument
timbres with Timbre Trait Profiles. Musicae Scientiae, 26(3), 648-674.
Speed, L. J., Croijmans, I., Dolscheid, S., & Majid, A. (2021). Crossmodal associations with olfactory, auditory, and tactile stimuli in children and adults. i-Perception, 12(6). https://doi.org/10.1177/20416695211048513
Spence, C. (2011). Crossmodal correspondences: A tutorial review. Attention, Perception, & Psychophysics, 73, 971-995. https://doi.org/10.3758/s13414-010-0073-7
Spence, C., & Di Stefano, N. (2022). Coloured hearing, colour music, colour organs, and the search for perceptually meaningful correspondences between colour and sound. i-Perception, 13(3), 1-42. https://doi.org/10.1177/20416695221092802
Spence, C. (2022). Exploring group differences in the crossmodal correspondences. Multisensory Research, 35(6), 495-536. https://doi.org/10.1163/22134808-bja10079
Stumpf, K. (1883). Tonpsychologie I [Psychology of the tone]. Leipzig: Hirzel.
Tan, S. L., & Kelly, M. E. (2004). Graphic representations of short musical compositions. Psychology of Music, 32(2), 191-212.
Walker, R. (1987). The effects of culture, environment, age, and musical training on choices of visual metaphors for sound. Perception & Psychophysics, 42, 491-502. https://doi.org/10.3758/BF03209757
Wallmark, Z. (2018). A corpus analysis of timbre semantics in orchestration treatises. Psychology of Music, 47(4), 585-605.
Ward, J., Huckstep, B., & Tsakanikos, E. (2006). Sound-colour synaesthesia: To what extent does it use cross-modal mechanisms common to us all? Cortex, 42(2), 264-280.
Zacharakis, A., & Pastiadis, K. (2016). Revisiting the Luminance-Texture-Mass Model for Musical Timbre Semantics: A Confirmatory Approach and Perspectives of Extension. Journal of the Audio Engineering Society, 64, 636-645.
|
Ακουστο-απτική διέγερση και αισθησιοκινητικός συγχρονισμός: μία μουσική διδακτική παρέμβαση
Παρουσιαστής:
Μάρθα Παπαδόγιαννη-Κουραντή (Εθνικό Καποδιστριακό Πανεπιστήμιο ΑΘήνας)
Συγγραφείς:
Μάρθα Παπαδόγιαννη-Κουραντή, Κωνσταντίνος Μπακογιάννης, Χριστίνα Αναγνωστοπούλου, Αρετή Ανδρεοπούλου
Περίληψη:
Κατά την ακρόαση της μουσικής βιώνουμε (συνήθως ασυνείδητα) μία πολυτροπική εμπειρία, όπου ακουστικές και απτικές πληροφορίες ολοκληρώνονται και επεξεργάζονται σε έναν κοινό εγκεφαλικό ρου. Η υποκείμενη χρονική περιοδικότητα κάθε μουσικού γεγονότος μπορεί να προβλεφθεί μέσα από την σύζευξη της αντίληψης του παλμού και αυτής της αυθόρμητης σωματικής αντίδρασης στην οποία δόθηκε ο όρος αισθησιοκινητικός συγχρονισμός. Εμπειρικές έρευνες έχουν δείξει ότι ο αισθησιοκινητικός συγχρονισμός με χτύπημα του χεριού παρουσιάζει βελτίωση όταν κυριαρχούν οι χαμηλές συχνότητες. Η απτική διέγερση επηρέαζει παράλληλα την αντίληψη χαρακτηριστικών του ήχου, όπως είναι η ένταση και χρονικών χαρακτηριστικών όπως ο παλμός. Η έκθεση σε επαναλαμβανόμενη απτική διέγερση που δεν απαιτεί την αντιληπτική προσοχή ή την ενεργό εμπλοκή των συμμετεχόντων υποστηρίζεται ότι επηρεάζει την απτική αντιληπτική ικάνοτητα του ανθρώπου.
Με αφετηρία τις θεωρητικές και εμπειρικές αναφορές στον αισθησιοκινητικό συγχρονισμό και την απτική διέγερση, η παρούσα πρόταση εξετάζει τις πιθανές επιδράσεις μίας διδακτικής παρέμβασης στο μάθημα της μουσικής αγωγής στο δημοτικό σχολείο, που περιλαμβάνει επαναλαμβανόμενη απτική διέγερση. Τα ευρήματα που αναλύονται αποτελούν μέρος μίας μεγαλύτερης πειραματικής έρευνας που ολοκληρώθηκε στα πλαίσια της διδακτορικής διατριβής “Auditory-tactile music perception: examining beat sensisivity and sensorimotor synchronization in education context” στο Τμήμα Μουσικών Σπουδών του ΕΚΠΑ (Φεβρουάριος 2024).
Στην έρευνα συμμετείχαν 60 παιδιά ηλικίας 8 έως 10 ετών. Η μεταφορά των δονήσεων πραγματοποιούνταν μέσω μίας κατασκευής που αποτελείτο από 10 πλάκες μοριοσανίδας, κάτω από τις οποίες εφάπτονταν 10 συσκευές μεταφοράς χαμηλών συχνοτήτων. Η έρευνα ακολούθησε μία μικτή μεθοδολογία, περιλαμβάνοντας ποσοτικές μετρήσεις και ποιοτικές συνεντεύξεις, με τη μορφή του προελέγχου-μεταελέγχου. Τα παιδιά ολοκλήρωσαν 16 διδακτικές παρεμβάσεις.
Οι ποσοτικές μετρήσεις είχαν σκοπό να αξιολογήσουν την ικανότητα συγχρονισμού των παιδιών της πειραματικής ομάδας και της ομάδας ελέγχου, χρησιμοποιώντας τρεις διαφορετικούς μετρονόμους: 80, 100, 120 BPM. Τα παιδιά κλήθηκαν να συγχρονιστούν με την ισόχρονη παλμική ακολουθία που άκουγαν χτυπώντας με μία μπαγκέτα ένα ηλεκτρονικό τύμπανο. Κάθε δοκιμασία πραγματοποιήθηκε τρεις φορές: πριν την έναρξη της έρευνας, κατά τη διάρκειά της και μετά την ολοκήρωση της διδακτικής παρέμβασης, ώστε να αποτυπωθούν τυχόν στατιστικά σημαντικές διαφορές τόσο μεταξύ της πειραματικής ομάδας και της ομάδας ελέγχου, όσο και μέσα στην ίδια ομάδα. Επιπλέον, στην αρχή κάθε μέτρησης τα παιδιά καλούνταν να χτυπήσουν την μπαγκέτα τους, όσο πιο σταθερά μπορούσαν για 30 sec σε μία ταχύτητα της επιλογής τους. Το αυθόρμητο αυτό χτύπημα ορίζεται ως spontaneous motor ή self-paced tapping. Προγενέστερες μελέτες υποστηρίζουν ότι η ταχύτητα με την οποία χτυπάμε αυθόρμητα χωρίς κάποιο εξωτερικό ερέθισμα συνδέεται με την απόδοση συγχρονισμού. Συγκεκριμένα η απόδοση αυτή εμφανίζεται υψηλότερη σε BPM που είναι κοντά στην “πηγαία” ταχύτητά μας. Η ερευνητική υπόθεση υποστήριζε ότι, κατά τη διάρκεια της παρέμβασης η πειραματική ομάδα θα εμφάνιζε στατιστικά σημαντικά μεγαλύτερη βελτίωση στον συγχρονισμό σε μετρονομικό παλμό, σε σύγκριση με την ομάδα ελέγχου. Επιπλέον, υποθέσαμε ότι τα μεγαλύτερα παιδιά θα εμφάνιζαν πιο ακριβή ικανότητα συγχρονισμού στον παλμό. Παράλληλα υποθέσαμε πώς κάθε παιδί θα χτυπούσε με μεγαλύτερη ακρίβεια στον παλμό που η ταχύτητά του ήταν πιο κοντά στην ταχύτητα του προσωπικού, πηγαίου χτυπήματός του και πώς, ανεξάρτητα από τη διδακτική παρέμβαση, τα παιδιά μικρότερης ηλικίας τείνουν να χτυπούν σε πιο γρήγορες ταχύτητες από τα μεγαλύτερης ηλικίας παιδιά.
Εξαιτίας της υψηλής μεταβλητότας στα χτυπήματα των παιδιών, η ανάλυση των δεδομένων έγινε με μεθόδους στατιστικής ανάλυσης κυκλικών δεδομένων. Χρησιμοποιήθηκε το CircStat toolbox της MATLAΒ. Η πρώτη μας υπόθεση ότι τα παιδιά της πειραματικής ομάδας θα παρουσίαζαν μεγαλύτερη βελτίωση δεν υποδείχθηκε από τα δεδομένα. Ο τύπος της διδακτικής παρέμβασης (με-χωρίς δόνηση) φάνηκε να μην έχει κάποια επίδραση στις αισθησιοκινητικές δεξιότητες, υπονοώντας ότι τα παιδιά μπορεί να επωφελήθηκαν μόνο από την διδακτική προσέγγιση. Τα αποτελέσματα υπέδειξαν ότι δεν υπήρχε στατιστικά σημαντική συσχέτιση μεταξύ της απόδοσης των παιδιών στον συγχρονισμό με μετρονόμους και το αυθόρμητο χτύπημα. Παρόλα αυτά, τα αποτελέσματα επιβεβαίωσαν την υπόθεση ότι η μεταβλητότητα στην απόδοση μειώνεται κατά τη διάρκεια της παιδικής ηλικίας, αλλά παραμένει υψηλή για παιδιά ηλικιών κάτω των 10 ετών. Παράλληλα, τα δεδομένα μας συμφώνησαν με παλαιότερα ευρήματα, ότι τα μεγαλύτερα παιδιά χτυπούν με πιο αργή ταχύτητα σε σχέση με τα μικρότερης ηλικίας παιδιά.
Σύμφωνα με τα παρόντα συμπεράσματα, οι επιδράσεις μία διδακτικής της μουσικής αγωγής με ταυτόχρονη απτική διέγερση θα πρέπει να διερευνηθούν περαιτέρω. Οι ατομικές δεξιότητες συγχρονισμού αναπτύσσονται με αρκετά διαφορετικούς ρυθμούς, ακόμη και σε παιδιά ίδιας ηλικιακής ομάδας και φαίνεται να επηρεάζονται από τη λεπτή κινητικότητα. Η έντονη διαφοροποίηση στην ακρίβεια και την σταθερότητα των χτυπημάτων μπορεί επίσης να οφείλεται σε ακουστικές ιδιαιτερότητες των πειραματικών ηχητικών παραδειγμάτων, προτείνοντας την χρήση ερεθισμάτων με διαφορετικά ακουστικά χαρακτηριστικά.
|
Κατευθυντικότητα των ελληνικών φωνηέντων στο τραγούδι βάσει συχνοτήτων φωνοσυντονισμού: Μελέτη περίπτωσης κλασικού τραγουδιού και Βυζαντινής ψαλτικής
Παρουσιαστής:
Γιώργος Δεδούσης (ΕΚΠΑ)
Συγγραφείς:
Γιώργος Δεδούσης, Κωνσταντίνος Μπακογιάννης, Αναστασία Γεωργάκη, Αρετή Ανδρεοπούλου
Περίληψη:
Έχουν διεξαχθεί εκτεταμένες έρευνες σχετικά με τα κατευθυντικά χαρακτηριστικά της ανθρώπινης φωνής (προφορικής και τραγουδιστής) οι οποίες επικεντρώνονται τόσο στο οριζόντιο ή/και στο κάθετο επίπεδο όσο και σε πλήρη σφαίρα. Μελέτες που συγκρίνουν τα χαρακτηριστικά κατευθυντικότητας της φωνής τραγουδιού και ομιλίας έχουν καταδείξει διαφορές μεταξύ των δύο, με τους κλασικούς τραγουδιστές να παρουσιάζουν υψηλότερη κατευθυντικότητα σε σύγκριση με την ομιλία (Brandner κ.ά., 2022). Διάφοροι παράγοντες, όπως το άνοιγμα του στόματος (Brandner κ.ά., 2020; Kocon & Monson, 2018), η στάση του σώματος, η κλίση του κεφαλιού(Blandin & Brandner, 2019) και η φυσιολογία της φωνητικής οδού (Kocon & Monson, 2018), επηρεάζουν τη φωνητική προβολή και την κατευθυντικότητα . Επιπλέον, έχει προταθεί ότι η κατευθυντικότητα μπορεί να επηρεαστεί από τη θέση του ήχου στη στοματική κοιλότητα, το ύψος και τον τύπο της φώνησης.
Η παρούσα μελέτη εξετάζει τα χαρακτηριστικά κατευθυντικότητας λαμβάνοντας υπόψη τα τραγουδιστικά στυλ κλασικών τραγουδιστών και τραγουδιστών Βυζαντινής ψαλτικής. Στόχος είναι να συμβάλει στην έρευνα σχετικά με τη φωνητική παραγωγή, τα ακουστικά χαρακτηριστικά της και στο σχεδιασμό συστημάτων προσομοίωσης και εικονικής πραγματικότητας με εφαρμογές στους τομείς της ομιλίας και της μουσικής.
Η έρευνα επικεντρώνεται στις ηχογραφήσεις τεσσάρων επαγγελματιών τραγουδιστών -δύο στην κλασική μουσική και δύο στη βυζαντινή ψαλμωδία- που καταγράφηκαν σε ελεγχόμενο ακουστικά χώρο τραγουδώντας τα ελληνικά φωνήεντα (μονοφθόγγων) /a/ (α), /e/ (ε, αι), /i/ (ι, η, υ, οι, ει), /o/ (ο, ω) και /u/ (ου), από δύο φορές το καθένα, στα τονικά ύψη A2, E3 και C#4 για περίπου δύο δευτερόλεπτα. Τα αποτελέσματα της ανάλυσης κατευθυντικότητας παρουσιάζονται για κάθε φωνήεν και την αντίστοιχη συχνότητα σε ζώνες τρίτης οκτάβας με κέντρο τις αντίστοιχες συχνότητες φωνοσυντονισμών (F1, F2, F3) κάθε τραγουδιστή. Οι μετρήσεις πραγματοποιήθηκαν με τη χρήση 29 πυκνωτικών μικροφώνων RODE-M5 μικρού διαφράγματος, τοποθετημένων συμμετρικά σε ημισφαιρική κατασκευή με ακτίνα 158,5cm, σε τέσσερα επίπεδα ύψους (+90°, +30°, 0°, -30°) με 12 μικρόφωνα ανά επίπεδο, τοποθετημένα σε αζιμουθιακά βήματα των 30°, στην ημι-ανηχοϊκή αίθουσα του Εργαστηρίου Μουσικής Ακουστικής και Τεχνολογίας (LabMAT) του ΕΚΠΑ. Τα δεδομένα συλλέχθηκαν με δύο ψηφιακούς μίκτες Yamaha TF1 (διασυνδεδεμένους μέσω DANTE) χρησιμοποιώντας τους ενσωματωμένους προενισχυτές τους και ηχογραφήθηκαν σε φορητό υπολογιστή i5 με το Cubase 11. Η ανάλυση των φωνοσυντονισμών πραγματοποιήθηκε με τη χρήση του Fast Track (Barreda, 2021), προσαρμόζοντας τις παραμέτρους ανάλογα με τους συμμετέχοντες.
Τα αποτελέσματα συνάδουν με την υπάρχουσα βιβλιογραφία σχετικά με τη συμμετρική (δεξιά/αριστερά) προβολή της τραγουδιστής φωνής (Bakogiannis κ.ά., 2022; Boren & Roginska, 2013; Katz & d’Alessandro, 2007). Τα μοτίβα κατευθυντικότητας ποικίλλουν ανάλογα με το ύψος και την κεντρική συχνότητα που μετρώνται (Brandner κ.ά., 2022; Marshall & Meyer, 1985). Είναι δύσκολο να εξαχθούν ασφαλή συμπεράσματα από τον τρόπο που μπορεί να επηρεάζει το είδος του τραγουδιού (Βυζαντινή ψαλτική, κλασικό τραγούδι) την κατευθυντικότητα. Εντούτοις, οι κλασικοί τραγουδιστές φαίνεται να διευρύνουν την προβολή των /i/ και /u/ στην περιοχή F3 (2219,5Hz – 2719Hz) σε σχέση με την περιοχή F1 στο C#4. Επιπλέον, οι δύο συμμετέχοντες Βυζαντινής ψαλτικής, έχουν διαφορετικές τιμές για το /i/ στην περιοχή F2 και F3 στο C#4, καθώς και στο /u/ στην περιοχή F2 στο C#4 και E3. Τέλος, η κατευθυντικότητα των φωνηέντων από το περισσότερο στο λιγότερο κατευθυντικό αναφέρεται στη βιβλιογραφία ως /a/, /e/, /i/, /o/, /u/ (Marshall & Meyer, 1985; Pörschmann & Arend, 2021). Σε αντίθεση με άλλες έρευνες, τα ελληνικά φωνήεντα /u/ και /i/ είναι λιγότερο κατευθυντικά, ειδικά στην περιοχή F3 στο C#4, ενώ το φωνήεν /e/ φαίνεται να είναι το πιο κατευθυντικό σε σχέση με την περιοχή F1, πιθανώς λόγω του τρόπου που εκφέρονται στην ελληνική γλώσσα που επηρεάζει τις συχνότητες φωνοσυντονισμού (κυρίως F1 και F2).
Δεδομένης της περιορισμένης έρευνας σχετικά με τους φωνοσυντονισμούς και την κατευθυντικότητα της τραγουδιστής φωνής στην ελληνική γλώσσα (Arvaniti, 2007; Bakogiannis κ.ά., 2022) αλλά και τη Βυζαντινή ψαλτική (Chrysochoidis κ.ά., 2013; D. Delviniotis, 2002; D. S. Delviniotis & Theodoridis, 2019), τα παραπάνω αποτελέσματα φιλοδοξούν να συμπληρώσουν και να διευρύνουν τη σχετική βιβλιογραφία. Οι μελλοντικές εργασίες θα επικεντρωθούν στην διερεύνηση της κατευθυντικότητας με κέντρο τις συχνότητες του τέταρτου και πέμπτου φωνοσυντονισμού (F4, F5). Επιπλέον, η ανάλυση θα επεκταθεί με περισσότερους τραγουδιστές διαφόρων επιπέδων κατάρτισης και ειδών τραγουδιού, με στόχο το μεγαλύτερο δείγμα να προσφέρει πιο γενικευμένα αποτελέσματα. Στόχος μας είναι να βρούμε πιθανές συνδέσεις μεταξύ της ελληνικής γλώσσας, της ανάλυσης των φωνοσυντονισμών, των τραγουδιστικών ειδών και εκπαίδευσης, σε σχέση με την κατευθυντικότητα και τη φωνητική προβολή.
|
Χαρτογράφηση του Εύρους Ζώνης των Φωνοσυντονισμών στο Σύγχρονο Φωνητικό Ιδίωμα του Ριζίτικου Τραγουδιού
Παρουσιαστής:
Σπύρος Καλοζάκης (Εργαστήριο Μουσικής Ακουστικής Τεχνολογίας (LabMAT) Τμήμα Μουσικών Σπουδών, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Πανεπιστημιούπολη - Ζωγράφου, 157 84, Αθήνα.)
Συγγραφείς:
Σπύρος Καλοζάκης, Αρετή Ανδρεοπούλου, Αναστασία Γεωργάκη
Περίληψη:
Σε έναν σημαντικά μεγάλο αριθμό σύγχρονων μελετών σχετικών με την ακουστική ανάλυση της ανθρώπινης φωνής, παρατηρούμε την ιδιαίτερη έμφαση η οποία δίνεται στα ηχοχρωματικά χαρακτηριστικά της και συγκεκριμένα στη διερεύνηση των προσαρμογών της φωνητικής οδού (vocal tract) κατά την τραγουδιστική επιτέλεση ή την ομιλία, οι οποίες (προσαρμογές) επηρεάζουν τους φωνοσυντονισμούς. Οι εκπεμπόμενοι ήχοι της ανθρώπινης φώνησης «μεταφέρονται» ακουστικά με μεγαλύτερη ευκολία (με μεγαλύτερο πλάτος/ένταση), όταν αυτοί οι ήχοι συμπίπτουν συχνοτικά (συντονίζονται) με τις συχνότητες των φωνοσυντονισμών (Sundberg, 1987, 1999).
Σε αυτήν την ανακοίνωση, θα αναφερθούμε στους φωνοσυντονισμούς του σύγχρονου φωνητικού ιδιώματος στο ριζίτικο τραγούδι και συγκεκριμένα στο εύρος ζώνης των φωνοσυντονισμών. Οι φωνοσυντονισμοί χαρακτηρίζονται ακουστικά από:
α) την κεντρική τους συχνότητα μέσω της οποίας μπορούμε να «αντλήσουμε» σημαντικές πληροφορίες για τις προσαρμογές της φωνητικής οδού κατά την τραγουδιστική επιτέλεση και την ομιλία.
β) Τη στάθμη ισχύος των, για την οποία τα συμπεράσματα τα οποία εξάγουμε προκύπτουν από την εξέταση των μεγάλου μέσου όρου φασμάτων (Long Term Average Spectrum – LTAS), ώστε να «θεμελιωθεί» εν πολλοίς, μία σημαντική αύξηση του ηχητικού σήματος της φωνής (άδουσας και ομιλούσας) η οποία δεν ενέχει τη χρήση μικροφώνου.
γ) Τη συσχέτισή τους είτε με τη συχνότητα φώνησης (θεμελιώδης συχνότητα), είτε με τις αρμονικές συχνότητες ή μέρη (partials) αυτών (αρμονικών), για την «ανίχνευση» τραγουδιστικών τεχνικών που ως σκοπό έχουν την αύξηση της ακουστότητας της φωνής σε σχέση με την ακουστότητα της ορχήστρας (Joliveau et al., 2004).
δ) Το εύρος ζώνης αυτών (Formant Bandwidth), το οποίο συνδέεται με το πλάτος των φωνοσυντονισμών, ώστε όσο μεγαλύτερο είναι το εύρος ζώνης, τόσο μικρότερο είναι το πλάτος κορυφής, επομένως το επίπεδο πλάτους των αρμονικών. Για τη μέτρησή του, λαμβάνεται υπόψιν το πλάτος της ζώνης το οποίο σχηματίζεται 3 Decibel (dB) κάτω από την κορυφή (peak) του φωνοσυντονισμού των αρμονικών.
To εύρος ζώνης των φωνοσυντονισμών, συνδέεται με τη λεπτομερή ακρίβεια σε ότι αφορά την αναγνώριση συλλαβών και λέξεων στην ομιλία και κατ’ επέκταση στο τραγούδι (Summerfield et al., 1985), (Vinceslas, 2011). Ειδικότερα, η λεπτομέρεια (η δυνατότητα καλύτερης αντίληψης αναγνώρισης από τον ακροατή της συλλαβής που αρθρώνεται από τον ομιλητή/τραγουδιστή) μειώνεται, όσο αυξάνεται το εύρος ζώνης των φωνοσυντονισμών (Broad Formant Bandwidth). Αντίστροφα, όσο στενεύει το εύρος ζώνης των φωνοσυντονισμών (Narrow Formant Bandwidth) από τον ομιλητή/τραγουδιστή, ο ακροατής έχει μία σαφώς λεπτομερέστερη αντίληψη (φασματική «αποτύπωση») της λέξης και της συλλαβής που αρθρώνεται κατά το άκουσμά της. Επιπλέον, το αυξημένο εύρος ζώνης του πρώτου φωνοσυντονισμού (B1), σχετίζεται άμεσα με το ποσοστό διεύρυνσης της γλωττίδας και τη ροή του εκπεμπόμενου αέρα (airflow) κατά τη φώνηση (Park, 2002), ενώ ταυτόχρονα διαφορετικές έρευνες υποστηρίζουν ότι το εύρος ζώνης των φωνοσυντονισμών σχετίζεται -μεταξύ άλλων- με τη «ρινικότητα» του φωνήεντος (vowel nasality) κατά τη φώνηση (Khodai et al., 2002).
Στο πλαίσιο της παρούσας μελέτης, θελήσαμε να πραγματοποιήσουμε μία πρώτη καταγραφή του εύρους ζώνης των δύο χαμηλότερων φωνοσυντονισμών (Β1,Β2) του σύγχρονου φωνητικού ιδιώματος στο ριζίτικο τραγούδι, μέσα από ένα -ενδεικτικό- δείγμα δεκατεσσάρων (14) Κρητών τραγουδιστών των οποίων η καταγωγή προέρχεται από τρεις (3) διαφορετικούς Νομούς της Μεγαλονήσου (Χανιά, Ρέθυμνο, Ηράκλειο), τους οποίους ηχογραφήσαμε κατά την τραγουδιστική «εκτέλεση» (στην τονική βαθμίδα της ανιούσας μείζονας κλίμακας) του «ανοιχτού» φωνήεντος /α/, εφαρμόζοντας την τεχνική του «αντίστροφου φιλτραρίσματος» (Inverse Filtering), κατά το πρότυπο (μεθοδολογία) προγενέστερων ερευνών οι οποίες εστίασαν στην εξέταση του εύρους ζώνης των φωνοσυντονισμών ανδρικών οπερατικών φωνών (Sundberg et al., 2013).
Η μεθοδολογία την οποία ακολουθήσαμε για την «εξαγωγή» της φωνητικής παραμέτρου του εύρους ζώνης των φωνοσυντονισμών των τραγουδιστών που ηχογραφήσαμε, βασίστηκε στην ψηφιακή επεξεργασία του ηχητικού σήματος της φωνής και ειδικότερα, στην εφαρμογή της προαναφερθείσας τεχνικής (Inverse Filtering). Η εφαρμογή από μέρους μας της συγκεκριμένης τεχνικής, βασίστηκε στους -απόλυτα- χειροκίνητους χειρισμούς μας (manual adjustments) επί του φάσματος της γλωττιδικής ροής και την επισημείωση των φωνοσυντονισμών του φωνητικού σήματος, μέσω της χρήσης εξειδικευμένου λογισμικού προγράμματος (Sopran) και της λογισμικής επέκτασης (plug-in) αυτού (DeCap).
Οι χειροκίνητοι χειρισμοί μας επί του φάσματος του φωνητικού σήματος, κρίθηκαν απαραίτητοι κατά τη χρήση του προαναφερθέντος λογισμικού προγράμματος, αφού αυτό (πρόγραμμα) δεν «στηρίζει» τη μέθοδο του αντίστροφου φιλτραρίσματος για την εύρεση του εύρους ζώνης των φωνοσυντονισμών σε ένα γραμμικό μοντέλο πρόγνωσης (Linear Prediction Code – LPC), αλλά στους προσεκτικούς χειρισμούς του χρήστη επί της γλωττιδικής ροής. Η εφαρμογή της τεχνικής του αντίστροφου φιλτραρίσματος η οποία χαρακτηρίζεται ιδιαίτερα χρήσιμη επίσης για την κωδικοποίηση, τη σύνθεση και την τροποποίηση της φωνής (Kafentzis, 2010) με τη χρήση του παραπάνω λογισμικού, κατέδειξε το σημαντικά «στενότερο» εύρος ζώνης των φωνοσυντονισμών των τραγουδιστών με καταγωγή από τα Χανιά για το φωνήεν /α/ σε σχέση με τους τραγουδιστές από το Ηράκλειο και το Ρέθυμνο, αναδεικνύοντας ταυτόχρονα το «έντονο» ένρινο στοιχείο ενός (1) Ρεθύμνιου τραγουδιστή.
|
Εφαρμογές σοβαρών παιχνιδιών στη συλλογή και συναισθηματική επισημείωση δειγμάτων ομιλίας
Παρουσιαστής:
Λάζαρος Ματσουλιάδης (Ελληνικό Ανοικτό Πανεπιστήμιο - ΕΑΠ)
Συγγραφείς:
Λάζαρος Ματσουλιάδης, Λουκάς Χαδέλλης, Χαράλαμπος Δημούλας
Περίληψη:
Στον τομέα των σοβαρών παιχνιδιών, η ενσωμάτωση της τεχνολογίας Αναγνώρισης Συναισθημάτων Ομιλίας (Speech Emotion Recognition – SER) παρουσιάζει μια πολλά υποσχόμενη οδό για τη βελτίωση της συλλογής δεδομένων και την ενίσχυση της δια δραστικότητας των χρηστών. Αυτή η έρευνα εξερευνά τις δυνατότητες των σοβαρών παιχνιδιών με δυνατότητα SER να συλλέγουν πλούσια δεδομένα ομιλίας από τους παίκτες, συμβάλλοντας στην πρόοδο τόσο της τεχνολογίας SER όσο και της ανάπτυξης σοβαρών παιχνιδιών.
Η έρευνα που παρουσιάζεται σε αυτή την εργασία επικεντρώνεται στον σχεδιασμό και την ανάπτυξη δύο διαφορετικών εφαρμογών σοβαρών παιχνιδιών ειδικά σχεδιασμένων για τη συλλογή δεδομένων χροιάς φωνής. Αυτά τα παιχνίδια, που δημιουργήθηκαν με χρήση της Unreal Engine 5, παρέχουν εμπειρίες παιχνιδιού, ενώ ταυτόχρονα καταγράφουν τις συναισθηματικές εκφράσεις των παικτών μέσω της ομιλίας τους.
Η ενσωμάτωση SER σε σοβαρά παιχνίδια προσφέρει πληθώρα πλεονεκτημάτων. Πρώτον, διευκολύνει τη συλλογή ποικίλων δεδομένων ομιλίας, τα οποία είναι απαραίτητα για την ανάπτυξη της τεχνολογίας SER. Δεύτερον, βελτιώνει την εμπειρία του χρήστη επιτρέποντας στα παιχνίδια να προσαρμόζονται και να ανταποκρίνονται στις συναισθηματικές καταστάσεις των παικτών, δημιουργώντας πιο εξατομικευμένη εμπειρία για κάθε χρήστη.
Πέρα από την ενσωμάτωση SER, η έρευνα εστιάζει και στην υλοποίηση προηγμένης τεχνολογίας ήχου, αξιοποιώντας χωρικό ήχο, Doppler, Binaural και μηχανισμούς τρισδιάστατης ηχητικής τοποθέτησης. Η ενσωμάτωση αυτών των στοιχείων συμβάλλει στην υλοποίηση ρεαλιστικών ηχητικών περιβαλλόντων, ενισχύοντας την αίσθηση παρουσίας και την συναισθηματική σύνδεση των παικτών με το παιχνίδι.
Αυτή η έρευνα αποδεικνύει την αποτελεσματικότητα των σοβαρών παιχνιδιών με την δυνατότητα SER ως εργαλείο για τη συλλογή δεδομένων και την ενίσχυση της δια δραστικότητας με τους χρήστες. Οι εφαρμογές παιχνιδιών που αναπτύχθηκαν και η υλοποίηση των τεχνολογιών ήχου ανοίγουν τον δρόμο για το μέλλον του σχεδιασμού παιχνιδιών, όπου η συναισθηματική νοημοσύνη και η ρεαλιστική ηχητική εμπειρία διαδραματίζουν καθοριστικό ρόλο στη δημιουργία παιχνιδιών με βαθύτερη απήχηση στους χρήστες και αισθητή επίδραση στην ψυχολογία και τη συμπεριφορά τους.
|
Ο ρόλος της οπτικής επικοινωνίας στη Δικτυακή Μουσική Εκτέλεση
Συγγραφείς:
ΚΩΝΣΤΑΝΤΙΝΟΣ ΤΣΙΟΥΤΑΣ, Κωνσταντίνος Θεόδωρος Τσάμης, Χρυσούλα Αλεξανδράκη
Περίληψη:
Στη Δικτυακή Μουσική Εκτέλεση (ΔΜΕ), δηλαδή την μουσική εκτέλεση μέσω δικτύου υπολογιστών, η επικοινωνία των μουσικών βασίζεται πρωτίστως, αν και όχι αποκλειστικά, στην ανταλλαγή ψηφιακών ροών ήχου και η εικόνας. Η αναγκαιότητα της ΔΜΕ αναδείχθηκε ιδιαίτερα κατά τη διάρκεια της πρόσφατης πανδημίας όπου πρωτίστως στην εκπαίδευση, η συνεργασία και επικοινωνία μέσω Διαδικτύου έγινε απαραίτητη. Ειδικά η μουσική εκπαίδευση μέσω Διαδικτύου αξιοποιεί συστήματα ΔΜΕ.
Στα σενάρια Διαδικτυακών μουσικών συναυλιών, η καθυστέρηση του ήχου λόγω καθυστέρησης του Διαδικτύου διαδραματίζει καθοριστικό ρόλο, καθώς καθιστά δύσκολο και στις περισσότερες περιπτώσεις αδύνατο το συγχρονισμό των μουσικών. Πολυάριθμες είναι οι έρευνες που μελετούν την επίδραση της καθυστέρησης του ήχου στην ΔΜΕ. Οι έρευνες αυτές φαίνεται να συμφωνούν στο γενικό συμπέρασμα ότι κατά την παρουσία δικτυακής καθυστέρησης, οι μουσικοί τείνουν να επιβραδύνουν το τέμπο της μουσικής εκτέλεσης σε μια προσπάθεια να συγχρονιστούν με τους συνεργάτες τους.
Οι έρευνες αυτές εστιάζουν πρωτίστως στην ηχητική επικοινωνία θεωρώντας ότι η οπτική επικοινωνία των μουσικών είναι συμπληρωματική ή/και δευτερεύουσα. Εντούτοις, εστιάζοντας στην περίπτωση της μουσικής εκπαίδευσης, όπου δάσκαλος και μαθητής αλληλεπιδρούν με πολλαπλά αισθητηριακά μέσα, η καθυστέρηση του ήχου δεν αποτελεί απαραίτητα απαγορευτικό παράγοντα. Σε ένα μάθημα μουσικής η ταυτόχρονη μουσική εκτέλεση δάσκαλου και μαθητή δεν είναι προϋπόθεση για τη διεξαγωγή μαθήματος. Αντίθετα, προϋπόθεση για τη διεξαγωγή μαθήματος μουσικής είναι η δυνατότητα οπτικής επικοινωνίας.
Αυτή η εργασία εξετάζει το ρόλο της οπτικής επικοινωνίας σε συνεδρίες ΔΜΕ, χωρίς όμως να επικεντρώνεται στη μουσική εκπαίδευση, ώστε να εξαχθούν γενικότερα συμπεράσματα για τη ΔΜΕ. Πραγματοποιήσαμε μια σειρά από πειράματα με δέκα (10) μουσικούς (πέντε ζευγάρια), οι οποίοι επικοινωνούσαν μέσω του τοπικού δικτύου του τμήματος Μουσικής Τεχνολογίας και Ακουστικής του ΕΛΜΕΠΑ. Στα πειράματα αυτά χρησιμοποιήθηκε λογισμικό το οποίο εισάγει μεταβλητή καθυστέρηση στην ηχητική επικοινωνία. Οι μουσικοί επιπρόσθετα με την ηχητική επικοινωνία, είχαν οπτική επικοινωνία με χρήση συνδεδεμένων καμερών και οθονών από άκρο σε άκρο. Η οπτική επικοινωνία είχε σταθερή καθυστέρηση της τάξεως των 64ms από τον ένα μουσικό στον άλλον. Τα πειράματα βασίστηκαν στη μεθοδολογία επαναλαμβανόμενων μετρήσεων (repeated measurements) . Συγκεκριμένα οι μουσικοί κλήθηκαν να πραγματοποιήσουν δύο (2) σενάρια τα οποία περιελάμβαναν επτά (7) επαναλήψεις το καθένα. Σε κάθε επανάληψη, η καθυστέρηση του ήχου είχε διαφορετική τιμή μέσα σε ένα εύρος τιμών από 17ms έως 60ms από το ένα άκρο στο άλλο. Πριν την πειραματική διαδικασία ζητήθηκε από τους μουσικούς να προετοιμάσουν ένα μουσικό θέμα της επιλογής τους το οποίο να μην υπερβαίνει σε διάρκεια το ένα λεπτό. Η επιλογή αυτή έγινε σκόπιμα ώστε να αποφευχθούν φαινόμενα όπως η επίδραση της πράξης (practice effect) που συναντάται σε περιπτώσεις επαναλαμβανόμενων μετρήσεων. Η προετοιμασία λάμβανε χώρα στον έναν από τους δύο χώρους του που επιλέχθηκαν για τη διεξαγωγή των πειραμάτων και χωρίς χρήση τεχνολογικών μέσων. Κατόπιν της προετοιμασίας ακολουθούσε η πειραματική διαδικασία. Κατά το Σενάριο 1 (πρώτες επτά επαναλήψεις) οι μουσικοί εκτέλεσαν το κομμάτι που προετοίμασαν χωρίς οπτική επαφή ενώ πραγματοποίησαν άλλες επτά επαναλήψεις κατά το Σενάριο 2 με οπτική επαφή.
Προκειμένου να γίνει συλλογή δεδομένων προς ανάλυση, εφαρμόστηκε η μέθοδος της υποκειμενικής αξιολόγησης (subjective evaluation), με χρήση ηλεκτρονικών ερωτηματολογίων τα οποία οι μουσικοί κλήθηκαν να απαντήσουν μετά από κάθε επανάληψη. Οι ερωτήσεις αφορούσαν την αξιολόγηση ζητημάτων όπως η αντίληψη της καθυστέρησης, η δυνατότητα συγχρονισμού ανάμεσα στους μουσικούς, η γενικότερη εμπειρία στην κάθε επανάληψη, αλλά και η χρησιμότητα της οπτικής επικοινωνίας. Η αξιολόγηση έγινε με χρήση ψυχομετρικής κλίμακας Likert από 1 έως 7. Επιπρόσθετα με τα ερωτηματολόγια, καταγράφηκαν οι ροές ήχου και βίντεο κατά τη διάρκεια των πειραμάτων. Οι καταγραφές βίντεο εστίαζαν στα πρόσωπα των μουσικών, προκειμένου να επιτραπεί η αναγνώριση εκφράσεων προσώπου με εργαλεία υπολογιστικής όρασης. Συμπληρωματικά, οι καταγραφές ήχου βοήθησαν μέσω της ευθυγράμμισής τους με τις εκφράσεις προσώπου στην επικύρωση των απαντήσεων που υποβλήθηκαν μέσω των ερωτηματολογίων.
Για την ανάλυση των ερωτηματολογίων, εφαρμόστηκαν στατιστικά εργαλεία κατάλληλα για τη μεθοδολογία των επαναλαμβανόμενων μετρήσεων. Τα αποτελέσματα των αναλύσεων καταδεικνύουν ότι παρόλο που η οι μουσικοί επικεντρώνονται στην ηχητική πληροφορία, επιβεβαιώνοντας προηγούμενες έρευνες, υπάρχουν ενδείξεις ότι σε συνθήκες αυξημένης καθυστέρησης της ηχητικής πληροφορίας οι μουσικοί τείνουν να στρέφουν τη προσοχή τους προς την οθόνη αναζητώντας μηχανισμούς αντιμετώπισης της αυξημένης ηχητικής καθυστέρησης. Αν και το δείγμα των δέκα μουσικών μπορεί να χαρακτηριστεί ως στατιστικά αδύναμο, τα ευρήματα φανερώνουν ότι η οπτική επαφή διαδραματίζει σημαντικό ρόλο στη συνεργασία κατά τη ΔΜΕ.
|