طریقه گوش کردن ما به موسیقی در سالهای اخیر اساساً تغییر کرده است؛ موسیقیدوستان نهتنها دیگر CD نمیخرند، بلکه بهطور روزافزون از خرید حق دانلود آثار نیز کاسته میشود. بهجای اینها استریمینگ است که امروزه به مسیر اصلی رسیدن موسیقی به دست و گوش مخاطب تبدیل شده است. بهعنوان مثال، سال گذشته تنها در ایالات متحده، ۴۳۱ میلیارد استریم انجام شده است. این یعنی بیش از ۱۰۰۰ استریم به ازای هر نفر از جمعیت کشور! (هر استریم به معنی یک بار پخش شدن آهنگ در یک سرویس استریمینگ است)
بدیهی است که تمام استریمها نشانگر فروش نیستند. یک بار دانلود و یا خرید فیزیکی آهنگ ممکن است به صدها بار شنیده شدن آن آهنگ بینجامد؛ در حالی که هر استریم تنها بیانگر یک بار شنیده شدن یک آهنگ است. با این حال، آمارهای مربوط به سرویسهای استریمینگ آنچنان شگرف هستند که میتوان بهراحتی نتیجه گرفت که استریمینگ، بازار موسیقی را در دست گرفته است.
این مسئله تنها در زمینه حجم بازار صادق نیست. از سال ۲۰۱۵، استریمینگ مهمترین منبع درآمد از موسیقیهای ضبطشده است. اکنون درآمدهای دیجیتال از درآمدهای فیزیکی پیشی گرفتهاند و برای اولین بار از سال ۱۹۹۵، درآمد کلی از آثار ضبطشده موسیقی افزایش یافته است. بازار موسیقی چیزی را که بیش از ۲۰ سال به دنبال آن میگشت در استریمینگ پیدا کرده است؛ روشی آسان برای رساندن موسیقی دیجیتال به دست کاربران و ایجاد درآمد از آن. حرکت از رسانههای فیزیکی به سمت رسانههای آنلاین قطعاً ادامه خواهد داشت و در عرصه دیجیتال، دانلود روز به روز کاهش خواهد داشت و استریمینگ هر روز رشد خواهد کرد.
با تمام این اوصاف، چگونه باید اطمینان حاصل کنیم که موسیقی ما بهترین صدای ممکن را در درگاههای استریمینگ خواهد داشت؟ در این مقاله تلاش میکنیم که به این پرسش پاسخ دهیم.
نگاهی به استریمینگ
اگر تولیدکننده موسیقی هستید، نمیتوانید نسبت به استریمینگ بیتفاوت باشید. فراتر از این، اگر قصد دارید موسیقی خود را برای روشهای مختلف ارائه به مخاطب آماده کنید، بهتر است استریمینگ را به CD و دانلود ترجیح دهید. اما گفتن این حرف سادهتر از اجرای آن است. سرویسهای استریمینگ مختلف، فرایندهای گوناگونی را بر روی موسیقی شما اعمال میکنند و بیشتر آنها جزئیات این فرایندها را در اختیار عموم قرار نمیدهند. چگونه مطمئن شویم که موسیقی ما بهترین صدای ممکن را به مخاطب عرضه میکند؟
مانند بسیاری از فرمتهای دانلود، استریمینگ نیز معمولاً شامل فشردهسازی داده میشود. چیزی که در اختیار مخاطب قرار میگیرد، حاصل نسخهبرداری یک به یک از میکسی که برای سرور استریمینگ ارسال شده، نیست؛ بلکه تکنیکهای مختلفی مورد استفاده قرار میگیرند تا پهنای باند مورد نیاز برای انتقال داده را کاهش دهند. سایتهای استریمینگ مختلف از کدکهای فشردهسازی متفاوتی استفاده میکنند و اگرچه MP3 نیز یکی از این فرمتهاست، اما پُراستفادهترین فرمتها عبارتند از AAC و Vorbis.
تمامی این کدکها میتوانند سطوح مختلفی از کاهشِ داده را اعمال کنند و کیفیت صدایی که از هر یک حاصل میشود، تفاوت زیادی دارد. اما یک مشکل در بین تمام آنها مشترک است: میکسی که بدون فشردهسازی و با کیفیت ۱۶ بیت ۴۴.۱ کیلوهرتز صدایی زیبا دارد، ممکن است پس از کدگذاری در یک استریم با کاهش داده، دیستورت شود.
این مشکل در صنعت تلویزیون بهخوبی شناخته شده است و در نتیجه آن، ایستگاههای پخش تلویزیونی فرمتهای مشخصی را از تولیدکنندگان مطالبه کرده و ابزارهای اندازهگیری جدیدی را برای جلوگیری از مشکلات ناشی از تبدیل ابداع کردهاند. اما بازار موسیقی مانند بازار پخش تلویزیونی قانونمند نیست و دامنه فرمتهای آن وسیعتر و نظارت بر آن کمتر است. در دنیای تلویزیون، بهراحتی میتوان پیش از ارسال کار مطلع شد که چه اتفاقی برای دادههای صوتی شما میافتد و میتوان تأثیر این اتفاقات را در مرحله میکس یا پسا-تولید در نظر گرفت. این کار در دنیای موسیقی بسیار دشوارتر است. بخشی از این دشواری به دلیل این است که سرویسهای استریمینگ، کدکهای مورد استفاده و جزئیات فرایند یکسانسازی بلندای صدای خود را در اختیار عموم قرار نمیدهند و بخش دیگر به علت تعدد فرایندهایی است که ممکن است بر روی میکس شما اعمال کنند.
با رشد روزافزون استریمینگ، ابزارهای جدیدی طراحی میشوند که به شما اجازه میدهند تأثیر کدکهای استریمینگ را بر روی میکس خود بشنوید.
پلاگینهایی مانند Nugen Audio MasterCheck Pro ،Sonnox Fraunhofer Pro-Codec و گزینه بررسی کدک در پلاگین iZotope Ozone، به تهیهکنندگان و مهندسین مسترینگ اجازه میدهند تا کدکهای مختلف سرویسهای استریمینگ را بهطور زنده شنیده، با نسخه فشردهنشده مقایسه کرده و از ابزارهای اندازهگیری مخصوص استفاده کنند تا مشکلات مربوط به سقف سمپل را پیدا کرده و برطرف کنند.
سرعت متغیر
بخشی از پیچیدگی ارائه فایل برای سرویسهای استریمینگ ناشی از این امر است که سرویسهای مختلف نهتنها از کدکهای مختلف استفاده میکنند، بلکه سطح کاهش داده در بیشتر این درگاهها به دستگاه شنونده، نوع اتصال شنونده و پرداخت کردن یا نکردن هزینه از طرف شنونده بستگی دارد. عموماً سه سطح از کاهش داده وجود دارد:
سرعت بیت پایین: برای اتصال موبایل و سرویسهای رایگان
سرعت بیت متوسط: برای اتصال کامپیوتر و موبایل با سرویسهای ویژه
سرعت بیت بالا: برای اتصال کامپیوتر با سرویس ویژه
کدک از سه تکنیک برای سطوح مختلف فشردهسازی استفاده میکند. اولین تکنیک، دور ریختن بخشهایی از آدیو است که به نام «سیگنال بیاهمیت دریافتی»(perceptually irrelevant signal) شناخته میشود؛ یعنی بخشهایی از آدیو که توسط قسمتهای دیگر آدیو پوشش داده شده و چندان به گوش مخاطب نمیآیند. بهعنوان مثال، گوش انسان ممکن است قادر به شنیدن صدایی آرام بلافاصله بعد از یک صدای اسنِر بسیار بلند نباشد؛ بنابراین کدک بخشی از داده را که برای بازپخش این صدا مورد نیاز است دور میاندازد.
تکنیک دوم برای کاهش سرعت بیت در استریم آدیو، «شبیهسازی باند طیفی»(spectral band replication) نام دارد. فرکانسهای بالای فایل آدیوی اولیه دور ریخته شده و از این طریق سرعت نمونهبرداری کاهش مییابد. سپس این فرکانسها در هنگام پخش با استفاده از فرکانسهای پایینتر بازتولید میشوند. روش این بازتولید نیز شبیه به روش کار اکسایترها (exciter) و اینهنسرها (enhancer) است.
و در آخر، در مواقعی که مقادیر زیادی از کاهش داده مورد نیاز باشد، تکنیک مشابهی بر روی استریو اعمال میگردد. فایل اولیه از حالت استریو یا همان باند چپ و راست، به دو کانال میانی و کنارهها تبدیل شده و کانال کنارهها حذف شده یا کاهش داده شدیدی بر روی آن اعمال میشود. پس از این مرحله، بخشی از دادههای استریو در مرحله رمزخوانی بازسازی میشود؛ اما در سطوح شدید کاهش داده، ممکن است مخاطب به سیگنال مونو گوش دهد.
دست بالا را در نظر بگیرید
شما بهراحتی میتوانید گوشهای خود را تمرین دهید تا تغییرات کدک بر روی سیگنال آدیو را تشخیص دهید. اما تصمیم بر سر اینکه میکس خود را برای هماهنگی با کدام سطح از کاهش داده آماده کنید، بحث دیگری است. اگر موسیقی شما در یکی از این حالات بهترین صدای ممکن را داشته باشد، به احتمال زیاد در سطوح دیگر کاهش داده، کمی از کیفیت خود را از دست خواهد داد.
بهطور کلی بهتر است بیشازحد نگران صدادهی موسیقی خود در پهنای باند بسیار پایین نباشید. این فرمتها معمولاً دچار اضافه بار داده میشوند و برای پخش صدا بدون تخریب آدیو، نیازمند ورودی شدیداً محدودشده و کنترلشده هستند. پردازشی که برای این فرمتها مورد نیاز است، نوسانهای کوتاه و جزئیات موسیقایی که در پهنای باند بالاتر بهطور قابل قبولی ارائه میشوند را بهشدت سرکوب میکند. با توجه به اینکه استریمهای آدیو در پهنای باند پایین در هر حالت صدای زیبایی ندارند و معمولاً در شرایط شنیداری ضعیفی مورد استفاده قرار میگیرند (مثل پخش از اسپیکر گوشی و…)، ارزش آن را ندارند که جزئیات موسیقایی را به خاطر بهتر شنیده شدن در اینگونه تبدیلها از دست بدهیم.
عرصه رقابت برابر
کاهش داده تنها پردازشی نیست که سرویسهای استریمینگ بر روی موسیقی اعمال میکنند. تقریباً تمام این درگاهها نوعی از یکسانسازی بلندای صدا را برای موسیقی به کار میگیرند. گاهی اوقات این گزینه صرفاً توسط کاربر فعال میشود؛ اما اغلب این گزینه بهصورت پیشفرض فعال است و در برخی از موارد نیز این گزینه همیشه اعمال شده و نمیتوان آن را حذف کرد. این حالت آخر شامل درگاههایی مانند یوتیوب است که پرطرفدارترین سرویس استریمینگ موزیک است (البته عجیب است که پس از بارگذاری فایل، چند روز طول میکشد که اعمال این یکسانسازی بلندای صدا بر روی فایل صورت گیرد) و با اینکه کاربران اسپاتیفای، اپل موزیک و تایدال میتوانند گزینه یکسانسازی بلندای صدا را غیرفعال کنند، اما اکثر کاربران این کار را نمیکنند. در نتیجه، کسانی که بر روی سرویسهای استریمینگ به موسیقی شما گوش میدهند، نسخه یکسانسازیشده از آن را میشنوند.
هدف از یکسانسازی بلندای صدا این است که مخاطب در هنگام گوش کردن به آهنگهای هنرمندان مختلف مجبور نباشد دائماً صدای دستگاه خود را کم و زیاد کند تا موسیقی با ولومی ثابت به گوش برسد. نکته مهم این است که در این فرایند، دینامیک یک ترک تغییر نمیکند؛ بلکه کل ترک تجزیه و تحلیل شده و یک کاهنده گین استاتیک بر روی آهنگ اعمال میشود. در برخی از درگاهها، اعمال این تغییرات دوسویه است؛ یعنی ولوم آهنگهای بیشازحد بلند کاهش داده شده و ولوم آهنگهای بیشازحد آرام افزایش مییابد. برخی از درگاهها همچنین از لیمیتر استفاده میکنند تا مطمئن باشند که یکسانسازی بلندای صدا منجر به کلیپ کردن نمیشود.
برخلاف فرمتهای یکسانسازی قلههای صدا مانند CD که در آنها میتوان با استفاده شدید از لیمیتر موسیقی را بلندتر و برجستهتر نشان داد، استفاده شدید از لیمیتر در فضای استریمینگ به ضرر آهنگ خواهد بود. شما میتوانید این مسئله را با استفاده از یک سرویس استریمینگ که اجازه میدهد یکسانسازی بلندای صدا را خاموش و روشن کنید، امتحان کرده و تأثیر آن را درک کنید.
دینامیک مهم است
پیام مهم بخش قبل این است که دلیلی ندارد با از بین بردن دامنه دینامیک موسیقی، صدای آن را تا حدی بلند کنید که درگاههای استریمینگ آن را بهطور خودکار کاهش دهند؛ مگر آنکه دلیل زیباییشناختی برای این کار داشته باشید. مرز فعال شدن کاهش بلندای صدا برای هر یک از سرویسهای استریمینگ متفاوت است. در گذشته، اسپاتیفای بالاترین حد فعال شدن کاهش صدا را داشت که ۱۱LUFS- بود. اما امروزه اسپاتیفای این عدد را به ۱۴LUFS- کاهش داده است؛ پس منطقی است که همین عدد را بهعنوان حد نهایی صدای خود در نظر بگیرید. فراتر رفتن از این حد، فایدهای در محیط استریمینگ نداشته و حتی به کیفیت شنیداری موسیقی شما لطمه وارد میکند. به یاد داشته باشید که برای اطمینان خاطر از عدم تجاوز میکس از این حد، نمیتوانید از ابزارهای سنتی اندازهگیری VU و یا Peak استفاده کنید؛ بلکه باید از ابزاری استفاده کنید که مجهز به اندازهگیری واحد بلندی صدا (LU) باشد.
البته دست یافتن به این مهم از راههای مختلفی میسر است. یکسانسازی بلندای صدا بر مبنای معدل بلندای صدای کلی یک آهنگ صورت میگیرد و یک عدد معدل ثابت را میتوان از راههای مختلفی به دست آورد. ممکن است یک آهنگ از ابتدا تا انتهای خود نزدیک به حد معدل مورد نیاز باشد و آهنگ دیگری دارای قسمتهایی بسیار بلندتر و آرامتر از حد معدل باشد و با این وجود، معدل صدای هر دو آهنگ یکسان باشد. از نقطه نظر تولید موسیقی این بدان معناست که با در نظر گرفتن قسمتهایی بسیار آرامتر از نظر ولوم، شما قادر خواهید بود بخشهای دیگری از موسیقی را از حد میانگین، بالاتر ببرید. در فضای استریمینگ این آهنگهای بلندتر نیستند که جلب توجه میکنند؛ بلکه آهنگهایی که نسبت به معدل بلندای صدای خود دینامیک بالاتری داشته باشند بیشترین جلب توجه را خواهند داشت.
میتوانید سرویسهای آنلاین موسیقی را مانند یک صندوق پست تصور کنید که فایلهای آدیو از طریق آنها پست میشوند. با انتخابهای درست در مرحله میکس و مسترینگ، میتوانید اطمینان حاصل کنید که موسیقی شما بدون هیچ دخل و تصرفی از شیار موجود بر روی صندوق پست عبور خواهد کرد. کلید دستیابی به میکسی خوشصدا بر روی درگاههای استریمینگ این است که بهینهترین PLR یا نسبت قله به بلندای صدا را داشته باشید. در این عبارت، بلندای صدا به معنای سقف بلندایی است که سرویس استریمینگ برای یکسانسازی بلندا در نظر گرفته است و قله به معنای بلندترین قله سمپل ممکن، بدون ایجاد دیستورشن توسط کدک است.
البته کماکان گاهی مجبوریم از برخی از مؤلفهها چشمپوشی کنیم. درگاههای مختلف استریمینگ دارای پنجرههای PLR متفاوتی بوده و اگرچه یکسانسازی بلندای صدا مرسوم است، اما تمام درگاهها از آن استفاده نمیکنند. همچنین حتی اگر دردسر حاضر کردن چند مستر مختلف برای سرویسهای متفاوت را قبول کنید، شرکتهای واسطه درگاههای پخش آنلاین، معمولاً بیش از یک فایل برای هر آهنگ را نمیپذیرند؛ پس رساندن مسترهای اختصاصی به دست هر درگاه پخش، کار سادهای نیست.
مسئله آخر این است که دانش مشتریها معمولاً از پیشرفتهای فناوری مانند یکسانسازی عقبتر است. اگر مستری ارائه کنید که کاملاً برای اسپاتیفای بهینهسازی شده باشد، ممکن است صاحب اثر همچنان از بابت اینکه بلندای موسیقی از سایر آهنگهای موجود بر روی کامپیوتر شخصیاش و یا آهنگهای موجود بر روی سیدی کمتر است، شکایت داشته باشد. اگر زمان کافی داشته باشید، میتوانید موسیقی را بر روی یک اکانت شخصی یوتیوب بارگذاری کنید تا مشتری شما متوجه شود که اعمال کمپرسور بیشازحد بیفایده است؛ اما همانطور که پیشتر اشاره کردیم، یکسانسازی بلندای صدا بر روی یوتیوب بلافاصله صورت نمیگیرد. بهجای این کار میتوانید با استفاده از یک پلاگین مانند Nugen Audio MasterCheck Pro برای شبیهسازی تأثیر یکسانسازی بلندای صدا استفاده کنید. این نرمافزار با فشار دادن دکمه Offset to Match، ولوم پخش را مانند یک درگاه استریمینگ آنلاین کاهش میدهد.
آینده روشن است
هنوز مشکلات زیادی بر سر راه پخش موسیقی با بلنداهای یکسان وجود دارند که باید برطرف شوند. از طرفی هم دلسردکننده است که امروزه اغلب موسیقیها با فشردهسازی داده به گوش مخاطب میرسند. اما مطمئنا این حالت بهتر از گردابی است که بازار CD به آن دچار شده بود و باعث میشد ترکها روز به روز بلندتر و دیستورتشدهتر به گوش مخاطب برسند. با توسعه پهنای باند اینترنت ثابت و همراه، میتوان اطمینان داشت که فشردهسازی دادهها نهایتاً از فضای استریمینگ رخت برخواهد بست. مهمتر از همه اینکه بالاخره پس از مدتها، مهندسین مسترینگ میتوانند تمرکز خود را بر روی زیبایی موسیقی گذاشته و بیشازحد نگران رقابت بر سر ولوم نباشند.
منبع: Sound on Sound
نویسندگان: Jon Schorah و Sam Inglis
مترجم: کیان ایرجی