Μου φαίνεται ότι υπάρχει πολλή παρεξήγηση σχετικά με το τι είναι το βάθος του bit και πώς λειτουργεί στον ψηφιακό ήχο. Αυτή η παρεξήγηση υπάρχει όχι μόνο στον κόσμο των καταναλωτών και του audiophile, αλλά και σε ορισμένα εκπαιδευτικά ιδρύματα και ακόμη και σε ορισμένους επαγγελματίες.
Αυτή η παρεξήγηση προέρχεται από την υπόθεση του πώς λειτουργεί ο ψηφιακός ήχος αντί του τρόπου με τον οποίο λειτουργεί πραγματικά. Είναι εύκολο να βλέπετε σε μια φωτογραφία τη διαφορά ανάμεσα σε μια εικόνα βάθους χαμηλού βάθος bit και σε ένα με μεγαλύτερο βάθος bit, οπότε είναι λογικό να υποθέτουμε ότι τα υψηλότερα βάθη bit στον ήχο σημαίνουν επίσης καλύτερη ποιότητα. Αυτή η υπόθεση επιβάλλεται περαιτέρω από το γεγονός ότι ο όρος «ανάλυση» συχνά εφαρμόζεται σε βάθος bit και προφανώς μεγαλύτερη ανάλυση σημαίνει υψηλότερη ποιότητα. Έτσι, τα 24bit είναι Hi-Rez ήχος και τα 24bit περιέχουν περισσότερα δεδομένα, επομένως υψηλότερη ανάλυση και καλύτερη ποιότητα. Εντελώς λογικές υποθέσεις, αλλά φοβάμαι ότι αυτή η υπόθεση δεν είναι απόλυτα σύμφωνη με τα πραγματικά δεδομένα για το πώς λειτουργεί ο ψηφιακός ήχος. Θα προσπαθήσω να εξηγήσω:
Κατά την εγγραφή, ένας Μετατροπέας Αναλογικού σε Ψηφιακό (ADC) διαβάζει την εισερχόμενη αναλογική κυματομορφή και την μετρά τόσες φορές το δευτερόλεπτο (1 *). Στην περίπτωση του CD υπάρχουν 44.100 μετρήσεις ανά δευτερόλεπτο (συχνότητα δειγματοληψίας). Αυτές οι μετρήσεις αποθηκεύονται στον ψηφιακό τομέα με τη μορφή bit ηλεκτρονικών υπολογιστών. Όσο περισσότερα κομμάτια χρησιμοποιούμε, τόσο πιο ακριβή μπορούμε να μετρήσουμε την αναλογική κυματομορφή. Αυτό συμβαίνει επειδή κάθε bit μπορεί να αποθηκεύσει μόνο δύο τιμές (0 ή 1), για να πάρουμε περισσότερες τιμές που κάνουμε το ίδιο με τα bits όπως κάνουμε στην κανονική μέτρηση. IE. Μόλις φτάσουμε στο 9, θα πρέπει να προσθέσετε μια άλλη στήλη (η στήλη δεκάδες) και μπορούμε να συνεχίσουμε να προσθέτουμε άπειρες στήλες για 100s, 1000s, 10000s, κλπ Το ίδιο ακριβώς ισχύει και για τα κομμάτια, αλλά επειδή έχουμε μόνο δύο τιμές ανά bit (αντί 10) χρειαζόμαστε περισσότερες στήλες, κάθε στήλη (ή επιπλέον bit) διπλασιάζει τον αριθμό των τιμών που διαθέτουμε. IE. 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024 …. Αν αυτοί οι αριθμοί εμφανίζονται λίγο γνώριμοι, αυτό οφείλεται στο γεγονός ότι όλη η τεχνολογία υπολογιστών βασίζεται σε δυαδικά ψηφία. Στην περίπτωση των 16bit υπάρχουν περίπου 65.000 διαφορετικές τιμές διαθέσιμες.
Το πρόβλημα είναι ότι μια αναλογική κυματομορφή μεταβάλλεται διαρκώς. Ανεξάρτητα από το πόσες φορές το δευτερόλεπτο μετράμε την κυματομορφή ή πόσες bits χρησιμοποιούμε για την αποθήκευση της μέτρησης, θα υπάρχουν πάντα σφάλματα. Αυτά τα σφάλματα στην ποσοτικοποίηση της τιμής μιας συνεχώς μεταβαλλόμενης κυματομορφής καλούνται σφάλματα ποσοτικοποίησης. Τα σφάλματα ποσοτικοποίησης είναι κακά και προκαλούν παραμόρφωση στην κυματομορφή όταν μετατρέπουμε πίσω σε αναλογικό και ακούμε.
Μέχρι στιγμής αυτά που έχω πει μέχρι τώρα θα συμφωνούσαν με την υπόθεση του πώς λειτουργεί ο ψηφιακός ήχος. Φαίνεται ότι συμφωνώ ότι περισσότερα bits = υψηλότερη ανάλυση. Είναι αλήθεια ότι τα γεγονότα αρχίζουν να αποκλίνουν από την υπόθεση είναι στην κατανόηση του αποτελέσματος της υψηλότερης ανάλυσης. Επιστρέφοντας σε αυτά που είπα παραπάνω, κάθε φορά που αυξάνουμε το βάθος των δυαδικών ψηφίων κατά ένα bit, διπλασιάζουμε τον αριθμό των τιμών που διαθέτουμε (π.χ., 4bit = 16 τιμές, 5bit = 32 τιμές). Εάν διπλασιάσουμε τον αριθμό των τιμών, μειώνουμε κατά το ήμισυ το ποσό των σφαλμάτων ποσοτικοποίησης. Επειδή τώρα φτάνουμε στο ζουμί της ιστορίας. Υπάρχει στην πραγματικότητα μια τέλεια λύση στα σφάλματα ποσοτικοποίησης, τα οποία εξαλείφουν εντελώς (100%) την παραμόρφωση της ποσοτικοποίησης, η διαδικασία ονομάζεται ‘Dither’ και ενσωματώνεται σε κάθε ADC στην αγορά.
Dither: Βασικά κατά τη διάρκεια της διαδικασίας μετατροπής προστίθεται ένα πολύ μικρό ποσό λευκού θορύβου στο σήμα, αυτό έχει ως αποτέλεσμα την πλήρη τυχαιοποίηση των σφαλμάτων ποσοτικοποίησης. Η τυχαία εκτύπωση σε ψηφιακό ήχο, αφού μετατραπεί ξανά σε αναλογικό, ακούγεται ως καθαρός λευκός (μη συσχετισμένος) θόρυβος. Το αποτέλεσμα είναι ότι έχουμε μια απολύτως τέλεια μέτρηση της κυματομορφής (2 *) συν κάποιο θόρυβο. Με άλλα λόγια, με το Dither, όλα τα σφάλματα μέτρησης έχουν μετατραπεί σε θόρυβο. (3 *).
Ας ελπίσουμε ότι είστε ακόμα μαζί μου, επειδή μπορούμε τώρα να προχωρήσουμε σε ακριβώς τι συμβαίνει με το βάθος bit. Επιστρέφοντας στα παραπάνω, όταν προσθέτουμε ένα «κομμάτι» δεδομένων, διπλασιάζουμε τον αριθμό των διαθέσιμων τιμών και συνεπώς μειώνουμε κατά το ήμισυ τον αριθμό των σφαλμάτων ποσοτικοποίησης. Αν μειώσουμε κατά το ήμισυ τον αριθμό των σφαλμάτων ποσοτικοποίησης, το αποτέλεσμα (μετά από το dithering) είναι μια τέλεια κυματομορφή με τη μείωση του θορύβου στο ήμισυ. Για τη φράση αυτή χρησιμοποιώντας την ορολογία του ήχου, κάθε επιπλέον bit δεδομένων μετακινεί το πάτωμα του θορύβου κάτω από 6dB (το μισό). Μπορούμε να το μετατρέψουμε και να πούμε ότι κάθε bit δεδομένων παρέχει 6dB δυναμικού εύρους (* 4). Επομένως 16bit x 6db = 96dB. Αυτό το σχήμα 96dB καθορίζει το δυναμικό εύρος του CD. (24bit χ 6dB = 144dB).
Έτσι, τα 24bit προσθέτει περισσότερη ‘ανάλυση’ σε σύγκριση με 16bit, αλλά αυτή η προστιθέμενη ανάλυση δεν σημαίνει υψηλότερη ποιότητα, σημαίνει απλώς ότι μπορούμε να κωδικοποιήσουμε ένα μεγαλύτερο δυναμικό εύρος. Αυτή είναι η παρεξήγηση που έγινε από πολλούς. Δεν υπάρχουν επιπλέον μαγικές ιδιότητες, τίποτα που η επιστήμη δεν καταλαβαίνει ή δεν μπορεί να μετρήσει. Η μόνη διαφορά μεταξύ 16bit και 24bit είναι 48dB δυναμικού εύρους (8bits x 6dB = 48dB) και τίποτα άλλο. Αυτό δεν είναι ζήτημα ερμηνείας ή γνώμης, είναι τα αποδεδειγμένα, αδιαμφισβήτητα λογικά μαθηματικά που στηρίζουν την ίδια την ύπαρξη του ψηφιακού ήχου.
Έτσι, μπορείτε πραγματικά να ακούσετε οφέλη από τη μεγαλύτερη (48dB) δυναμική περιοχή που προσφέρεται από 24bit; Δυστυχώς, όχι δεν μπορείτε. Ολόκληρη η δυναμική περιοχή ορισμένων τύπων μουσικής είναι μερικές φορές μικρότερη από 12dB. Οι εγγραφές με το μεγαλύτερο δυναμικό εύρος τείνουν να είναι συμφωνικές συμφωνίες ορχήστρας, αλλά ακόμη και αυτές σχεδόν ποτέ δεν έχουν δυναμική κλίμακα μεγαλύτερη από περίπου 60dB. Όλα αυτά είναι καλά μέσα στην περιοχή 96dB του ταπεινού CD. Επιπλέον, οι σύγχρονες τεχνικές Dithering (βλ. 3 παρακάτω) βελτιώνουν διαδοχικά το δυναμικό εύρος του CD μετακινώντας το θόρυβο ποσοτικοποίησης από τη ζώνη συχνοτήτων όπου η ακοή μας είναι πιο ευαίσθητη. Αυτό δίνει ένα δυναμικό εύρος δυνατοτήτων για CD μέχρι 120dB (150dB σε ορισμένες ζώνες συχνοτήτων).
Πρέπει να συνειδητοποιήσετε ότι όταν αναπαράγετε ένα CD, ο ενισχυτής είναι συνήθως ρυθμισμένος έτσι ώστε οι πιο ήσυχοι ήχοι στο CD να μπορούν να ακουστούν μόνο πάνω από το θόρυβο του περιβάλλοντος ακρόασης (καθιστικό ή κουτιά). Έτσι εάν ο μέσος λόγος θορύβου για ένα καθιστικό λέγεται 50dB (ή 30dB για ακουστικά), τότε το δυναμικό εύρος του CD ξεκινά από αυτό το σημείο και μπορεί να είναι τουλάχιστον 96dB πάνω από το επίπεδο του θορύβου του δωματίου. Αν το πλήρες δυναμικό εύρος ενός CD χρησιμοποιήθηκε πραγματικά (πάνω από το θόρυβο), ο ακροατής του σπιτιού (αν είχε τον εξοπλισμό) θα προκαλούσε σχεδόν σίγουρα έντονο πόνο και μόνιμη βλάβη της ακοής. Αν συμβαίνει αυτό με το CD, τι γίνεται με το 24bit Hi-Rez. Εάν επρόκειτο να χρησιμοποιήσουμε το πλήρες δυναμικό εύρος των 24bit και ο ακροατής είχε τον εξοπλισμό για να τα αναπαράγει όλα, υπάρχει μια καλή πιθανότητα, ανάλογα με την ηλικία και τη γενική υγεία, να πεθάνει ο ακροατής αμέσως. Θα μπορούσε πιθανότατα να πάει σε κώμα για μερικές εβδομάδες και να ξυπνήσει εντελώς κουφός. Δεν αστειεύομαι ή υπερβάλλω εδώ, σκεφτείτε το, 144dB + πείτε 50dB για το θόρυβο του δωματίου. Αλλά 180dB είναι η τιμή που συχνά αναφέρεται για επίπεδα ηχητικής πίεσης αρκετά ισχυρά για να σκοτώσουν και μερικοί άνθρωποι έχουν σκοτωθεί από 160dB. Ωστόσο, αυτό είναι απίθανο να συμβεί στον πραγματικό κόσμο, καθώς δεν υπάρχουν DAC στην αγορά που να εξάγει το 144dB δυναμικό εύρος 24bit (έτσι δεν είναι true μετατροπείς 24bit), σχεδόν κανείς δεν έχει ένα σύστημα ηχείων ικανό να 144dB δυναμική περιοχή και όπως είπε πριν, περίπου 60dB είναι το πιο δυναμικό εύρος που θα βρείτε σε μια εμπορική εγγραφή.
Επομένως, αν δεχτείτε τα γεγονότα, γιατί υπάρχει ακουστικό 24bit ακόμα, ποιο είναι το νόημα; Υπάρχουν κάποιες χρήσιμες εφαρμογές για 24bit κατά την εγγραφή και την μίξη της μουσικής. Στην πραγματικότητα, κατά την μίξη είναι λίγο πολύ ο κανόνας τώρα να χρησιμοποιήσετε ανάλυση 48bit. Ο λόγος που είναι χρήσιμη οφείλεται στο άθροισμα των artefacts, της πολλαπλής επεξεργασίας σε σειρά και κυρίως στο headroom. Με άλλα λόγια, τα 24bit είναι πολύ χρήσιμα κατά την εγγραφή και την μίξη , αλλά άσκοπα για αναπαραγωγή. Θυμηθείτε ότι ακόμα και μια εγγραφή με δυναμική περιοχή 60dB χρησιμοποιεί μόνο 10bits δεδομένων, τα άλλα 6bits σε ένα CD είναι απλώς θόρυβος. Έτσι, η διαφορά στον πραγματικό κόσμο μεταξύ 16bit και 24bit είναι ένα επιπλέον 8bits θορύβου.
Ξέρω ότι μερικοί άνθρωποι πρόκειται να πουν ότι όλα αυτά είναι σκουπίδια και ότι «ακούω εύκολα τη διαφορά ανάμεσα σε μια εμπορική εγγραφή 16bit και μια 24bit Hi-Rez έκδοση». Δυστυχώς, δεν μπορείτε, δεν είναι ότι δεν έχετε τον εξοπλισμό ή τα αυτιά, δεν είναι ανθρώπινα εφικτό θεωρητικά ή στην πράξη υπό οποιεσδήποτε συνθήκες !! Εκτός αν μπορείτε να πείτε τη διαφορά μεταξύ του λευκού θορύβου και του λευκού θορύβου που είναι πολύ κάτω από το θόρυβο του περιβάλλοντος ακρόασης! Εάν παίζετε μια εγγραφή 24bit και στη συνέχεια η ίδια εγγραφή σε 16bit και παρατηρήσετε μια διαφορά, είτε επειδή κάτι έχει «γίνει» στην εγγραφή 16bit, κάποια ακατάλληλη επεξεργασία που χρησιμοποιείται ή ακούτε μια διαφορά επειδή αναμένετε μια διαφορά.
1 = Στην πραγματικότητα αυτές τις μέρες η διαδικασία μετατροπής AD είναι λίγο πιο περίπλοκη, χρησιμοποιώντας υπερδειγματοληψία (πολύ υψηλές συχνότητες δειγματοληψίας) και μόνο μια χούφτα bit. Αργότερα στη διαδικασία μετατροπής αυτή η αρχική δειγματοληψία “αποδεκατίζεται” πίσω στο απαιτούμενο βάθος δυφίων και ρυθμό δειγματοληψίας.
2 = Η ιδέα της τέλειας μέτρησης ή της αναδημιουργίας μιας κυματομορφής τέλεια μπορεί να φαίνεται σαν διαφημιστική εκστρατεία. Ωστόσο, σε αυτή την περίπτωση δεν είναι. Είναι στην πραγματικότητα το θεμελιώδες δόγμα του θεωρήματος δειγματοληψίας Nyquist-Shannon, στο οποίο βασίζεται η ίδια η ύπαρξη και η εφεύρεση του ψηφιακού ήχου. Από το WIKI: “Στην ουσία, το θεώρημα δείχνει ότι ένα αναλογικό σήμα που έχει δειγματοληψία μπορεί να ανακατασκευαστεί πλήρως από τα samples”. Ξέρω ότι θα υπάρχουν κάποιοι που θα διαφωνούν με αυτή την ιδέα, δυστυχώς, η διαφωνία ΔΕΝ είναι επιλογή. Αυτό το θεώρημα δεν έχει εφευρεθεί για να εξηγήσει πώς λειτουργεί ο ψηφιακός ήχος, είναι το αντίστροφο. Ο ψηφιακός ήχος εφευρέθηκε από το θεώρημα, αν δεν πιστεύετε στο θεώρημα τότε δεν μπορείτε να πιστέψετε στον ψηφιακό ήχο!
3 = Στην πραγματικότητα αυτές τις μέρες υπάρχουν διάφοροι τύποι διαίρεσης που χρησιμοποιούνται κατά τη δημιουργία ενός μουσικού προϊόντος. Οι περισσότεροι βασίζονται ακόμη στις αρχικές TPDF (τριγωνική συνάρτηση πυκνότητας πιθανότητας), αλλά ορισμένοι είναι λίγο πιο «έξυπνοι» και αναδιανέμουν το προκύπτον θόρυβο σε λιγότερο αισθητές περιοχές του φάσματος ακοής. Αυτό ονομάζεται θόρυβο.
4 = Δυναμικό εύρος, είναι το εύρος της έντασης μεταξύ του θορύβου θορύβου και της μέγιστης έντασης.
Το παρόν άρθρο είναι μια μετάφραση από τον Παναγιώτη Μάρκο (Midimod).
Πηγή: https://www.head-fi.org