Εφαρμογές αλγορίθμων γενετικής τεχνητής νοημοσύνης για την παραγωγή ηχητικού περιεχομένου στα νέα μέσα και την επικοινωνία
Συγγραφείς
Αλέξανδρος Εμβολιάδης, Πάρις Ξυλογιάννης, Νικόλαος Βρύζας, Λάζαρος Βρύσης, Χαράλαμπος Δημούλας
Σύνοψη
Η παρούσα εργασία στοχεύει στην ανάλυση μεθόδων για την παραγωγή πολυμεσικών δεδομένων με ιδιαίτερη έμφαση στην επεξεργασία και παραγωγή ηχητικών σημάτων. Πιο συγκεκριμένα, η εργασία παρουσιάζει σύγχρονες τεχνικές βασισμένες σε αρχιτεκτονικές Βαθέων Νευρωνικών Δικτύων (ΒΝΔ) που στοχεύουν στην παραγωγή δεδομένων ήχου σε διάφορους τομείς (παραγωγή μουσικής, ομιλίας, περιβαλλοντικών ήχων και άλλα).Η εργασία ξεκινά με μια σύντομη ιστορική αναδρομή σε τεχνικές προσομοιώσεις καθώς και αναφορά σε σύγχρονες προσεγγίσεις. Συνεχίζει με την παρουσίαση νευραλγικών αρχιτεκτονικών ΒΝΔ, ικανές να παράξουν πληθώρα τύπων δεδομένων. Τέλος, η εργασία αναλύει μερικά σενάρια εφαρμογής για την παραγωγή ηχητικού περιεχομένου και παρουσιάζει τα συμπεράσματα.