THMMY.gr

Μαθήματα Κύκλου Ηλεκτρονικής & Υπολογιστών => Συστήματα Πολυμέσων => Topic started by: Rick Deckard on October 02, 2022, 21:55:24 pm



Title: [Πολυμέσα] Εργασία 2022/2023
Post by: Rick Deckard on October 02, 2022, 21:55:24 pm
Οποιαδήποτε απορία σχετικά με την εργασία. Stay on topic!


Title: Re: [Πολυμέσα] Εργασία 2022/2023
Post by: Rick Deckard on February 11, 2023, 00:10:16 am
Ρε μάγκες, τι εννοεί εδώ ο ποιητής; Αφορά την συνάρτηση Dksparse (Μέρος 3.3 ερώτημα 2)
 (https://scontent.fskg1-2.fna.fbcdn.net/v/t1.15752-9/326129312_888878529121255_7849665436269326516_n.png?_nc_cat=103&ccb=1-7&_nc_sid=ae9488&_nc_ohc=NF_5PkUsklAAX_8pmNV&_nc_oc=AQmm5RjHKibXLyhDd7QBb5YcMyJ1s4IQXmqXr5OOi6XeKXbtPoeSWaUGzuA6ImhzaIYkL0-gU1oL0tZwy1ZdHBMx&_nc_ht=scontent.fskg1-2.fna&oh=03_AdSp9lRKuN6-QIYeFWKC8xXztWZOI2Xj3L7zc7BaEkwvdQ&oe=640E197E)


Title: Re: [Πολυμέσα] Εργασία 2022/2023
Post by: EyeThere on February 18, 2023, 23:16:38 pm
Η πρώτη σχέση (ST) σου δίνει τις "οδηγίες" που χρειάζεσαι για να φτιάξεις την αρχική εκτίμηση του συνόλου ST. Αυτό που σου λέει είναι ότι στο σύνολο ST θα πρέπει να μπούνε όλοι εκείνοι οι ακέραιοι δείκτες k από το 0 ως το 1152 του φάσματος ισχύος P για τους οποίους ισχύουν ταυτόχρονα τα δύο παρακάτω:

 -> Πρώτον: Το φάσμα ισχύος P[k] είναι μεγαλύτερο από το φάσμα των εκατέρωθεν δεικτών k-1 και k+1.
-> Δεύτερον: Το φάσμα ισχύος P[k] ξεπερνά το φάσμα των  ευρύτερων "γειτονικών" δεικτών κατά 7 dB τουλάχιστον.

Η δεύτερη εξίσωση (Δk) σου δίνει τις οδηγίες που χρειάζεσαι για να βρεις αυτή την ευρύτερη "συχνοτική γειτονιά".

Πχ:
Για ένα δείκτη k από 2-282 (0.17-5.5kHz)  αυτή η γειτονιά περιλαμβάνει τους δείκτες k+2 και k-2.

Για ένα δείκτη k από 282 έως 570 (5.5-11kHz) αυτή η γειτονιά περιλαμβάνει τους δείκτες k+2, k+3, ... k+13 καθώς επίσης τους δείκτες k-2, k-3, ... k-13

Για ένα δείκτη k από 570-1152 (11-22kHz) αυτή η γειτονιά περιλαμβάνει τους δείκτες k+2, k+3 ... k+27 καθώς επίσης k-2, k-3, ... k-27

Επομένως αυτό που θα πρέπει να κάνεις εσύ, είναι να βρείς σε πρώτη φάση όλους εκείνους τους δείκτες k για τους οποίους το φάσμα ισχύος P[k] ξεπερνά το φάσμα των άμεσων γειτόνων k-1 και k+1. Στη συνέχεια θα πρέπει να κρατήσεις μόνο εκείνους τους δείκτες που ξεπερνούν το φάσμα ισχύος της ευρύτερης "συχνοτικής" γειτονίας κατά 7dB τουλάχιστον.

Στο τέλος -αν υλοποιήσεις σωστά αυτό τον αλγόριθμο- θα πρέπει να καταλήξεις με ένα σύνολο ακέραιων δεικτών οι οποίοι αντιστοιχούν στις συχνότητες του φάσματος ισχύος όπου εμφανίζονται τοπικά μέγιστα (Set of Tonal components)


Title: Re: [Πολυμέσα] Εργασία 2022/2023
Post by: kotsos420 on February 19, 2023, 00:32:55 am
Επειδή στην εκφώνηση δεν δίνει κάποια βοήθεια , εφόσον έχουμε γράψει τις συναρτήσεις τι πρέπει περίπου να κάνουμε στα mp3codec? Πώς χρησιμοποιούμε τις ακολουθίες από 0 και 1 του huffman?


Title: Re: [Πολυμέσα] Εργασία 2022/2023
Post by: EyeThere on February 19, 2023, 23:54:37 pm
Εάν έχεις υλοποιήσει όλες τις βοηθητικές συναρτήσεις που περιγράφονται στις οδηγίες της εργασίας, τότε μπορείς να χρησιμοποιήσεις την συνάρτηση ihuff πάνω στην ακολουθία 0,1 (bitstream) για να αντιστρέψεις την κωδικοποίηση huffman. Στην συνέχεια θα χρησιμοποιήσεις την συνάρτηση irle για να αντιστρέψεις την κωδικοποίηση τρέχοντος μήκους. Έπειτα, θα περάσεις τα σύμβολα που προκύπτουν από τον αποκβαντιστή για να πάρεις τους συντελεστές DCT του τρέχοντος frame και -τέλος- θα πρέπει να χρησιμοποιήσεις την συνάρτηση iframeDCT για να φύγεις από το πεδίο συχνότητας του μετασχηματισμού DCT και να επιστρέψεις στο πεδίο του χρόνου. Θα επαναλάβεις την παραπάνω διαδικασία για κάθε frame και στο τέλος κάθε επανάληψης θα σώζεις τα ανακατασκευασμένα δείγματα που προκύπτουν σε έναν buffer τον οποίο στη συνέχεια μπορείς να αποθηκεύσεις σαν αρχείο wav. στο δίσκο σου.