Розділ 9 Звукові карти

                        1. Ціль роботи:

-         Закріплення теоретичних знань з питань будови звукових карт;

-         Опрацювання структури функціональних блоків  звукових карт;

-         Вивчення та аналіз інтерфейсів звукових карт;

-         Вивчення структури дискретних систем перетворення даних;

-         Виконання  налаштувань  звукових карт;

-         Виконання діагностики несправностей звукових карт та ремонту;

 

                       2. Апаратура, прилади, матеріально-технічне оснащення:

       - Персональний комп’ютер,  периферійні пристрої ПК, аудіо система ПК: мінімальні ресурси-операційна система Windows XP.

        - Програмні середовища: Мінімальний набір звукового ПЗ, що входить до складу ОС Windows - найбільш поширені драйвери звукових плат, кодеки, CD-плейєр, універсальний програвач (Media Player), найпростіша програма запису, програвання і редагування звуку в WAV-форматі (Sound Recorder), програма-мікшер, що забезпечує управління вхідним і вихідним мікшерами звукової плати під час відтворення і, відповідно, запису звуку.

  

                    3. Теоретичні відомості.

                           3.1. Дискретні системи.

       Структура типової дискретної системи цифрової обробки сигналу (ЦОС) представлена на Рис.1. Зазвичай, перш ніж піддатися реальному аналого-цифровому перетворенню, аналоговий сигнал проходить через ланцюги нормалізації, які виконують такі функції, як підсилення, аттенюація (ослаблення) і фільтрація. Для придушення небажаних сигналів поза смугою пропускання і запобігання накладенню спектрів (aliasing) необхідний фільтр низької частоти або смуговий фільтр.

 

Рис.1.  Структура типової дискретної системи цифрової обробки сигналу

На Рис.1 представлена система, що працює в реальному масштабі часу. У ній АЦП безперервно виконує дискретизацію сигналу з частотою, рівною fs, і видає новий відлік процесору ЦОС (DSP) з такою ж частотою. Для забезпечення роботи в реальному масштабі часу DSP повинен закінчити всі обчислення в межах інтервалу дискретизації 1/fs і передати вихідний відлік на ЦАП до надходження наступного відліку з АЦП. Як приклад типовій функції DSP може виступати цифровий фільтр.

У разі використання алгоритму БПФ, блок даних завантажується в пам'ять DSP. Поки працює алгоритм БПФ, тим часом новий блок даних завантажується в пам'ять для забезпечення роботи в реальному масштабі часу. DSP повинен обчислити БПФ протягом інтервалу передачі даних, щоб бути готовим до процесу обробки наступного блоку даних.

Цифро-аналоговий перетворювач (ЦАП) є необхідним у  випадку, коли дані необхідно перетворити в аналоговий сигнал (наприклад, у разі голосового або звукового додатку). У багатьох додатках після первинного аналого-цифрового перетворення сигнал залишається в цифровому форматі. Крім того, існують пристрої подібні до CD-програвача, в яких DSP відповідає виключно за формування сигналу на ЦАП. У разі використання ЦАП, на його виході для придушення небажаних гармонік необхідно застосовувати фільтр (anti-imaging filter).

У реальних процесах аналого-цифрового і цифро-аналогового перетворення є два ключові етапи: дискретизація за часом і квантування по амплітуді, які визначають роздільну здатність даних операцій. Розуміння цих моментів є основоположним чинником в оцінці додатків ЦОС. 

Концепції дискретизації за часом і квантування по амплітуді аналогового сигналу ілюструються на Рис.2. Вибірка безперервних аналогових даних повинна здійснюватися через інтервал дискретизації ts = 1/fs, який необхідно ретельно обирати для точного представлення первинного аналогового сигналу. Ясно, що чим більше число відліків (вищі частоти дискретизації), тим більш точним буде представлення сигналу в цифровому вигляді, тоді як у разі малого числа відліків (низькі частоти дискретизації) може бути досягнуте критичне значення частоти дискретизації, при якому втрачається інформація про сигнал. Це витікає з відомого критерію Найквіста, сформульованого нижче. Відповідно до наведеного критерію:

· Частота дискретизації fs сигналу з шириною смуги fa повинна задовольняти умові fs > 2fa, інакше інформація про сигнал буде втрачена;

· Ефект накладення спектрів виникає, коли fs < 2fa;

· Ефект накладення спектрів широко використовуються в таких  завданнях, як пряме перетворення частотного сигналу в цифрову форму.

Отже, критерій Найквіста вимагає, щоб частота дискретизації була принаймні удвічі більше смуги сигналу, інакше інформація про сигнал буде втрачена. Якщо частота дискретизації менше подвоєної смуги аналогового сигналу, виникає ефект, відомий як накладення спектрів (aliasing).

Для розуміння сенсу накладення спектрів як в тональній, так і в частотній областях спочатку розглянемо випадок уявлення в тональній області вибірки одного тонального сигналу синусоїдальної форми, показаний на Рис.2. В даному прикладі частота дискретизації fs незначно більша частоти аналогового вхідного сигналу fa, що не задовольняє критерію Найквіста. Наведена вибірка відповідає сигналу, частота якого рівна різниці частот дискретизації і частоти початкового сигналу fs–fa. Відповідне представлення цього прикладу в частотній області показане на рис.3.

Далі наведено випадок вибірки з частотою fs одночастотного сигналу синусоїдальної форми частоти fa, здійсненою ідеальним імпульсним дискретизатором (див. рис.2.4, A). Як і у попередньому випадку, приймемо, що fs > 2fa. У частотному спектрі на виході дискретизатора видно гармоніки (aliases або images) початкового сигналу, що повторюються з частотою fs, тобто на частотах, рівних | ± Kfs ± fa |, де K = 1, 2, 3, 4 .....

Рис.2. Ефект накладення спектрів у тональній області.

Отже: частота fa небагато нижча, ніж fs, аналоговий сигнал з частотою fa, дискретизований  ідеальним АЦП з частотою fs, має складові на частотах |±kfs±fa|, k = 1,2,3.

Частотна зона Найквіста визначається як смуга спектру від 0 до fs/2. Частотний спектр роздільний на нескінченне число зон Найквіста, кожна по 0,5 fs. На практиці ідеальний дискретизатор замінюється на АЦП, використовуваний спільно з процесором БПФ. БПФ-процесор забезпечує присутність на виході тільки компонент сигналів, частоти яких потрапляють в першу зону Найквіста, тобто, в смугу від 0 до fs/2.

Рис.3.

Тепер розглянемо випадок, коли частота сигналу виходить за межі першої зони Найквіста (Рис.3 B). Частота сигналу трохи менше частоти дискретизації, що відповідає умові, представленій в тональній області на рис.2. Отже, навіть у випадку, що сигнал знаходиться поза першою зоною Найквіста, його складова fs-fa потрапляє всередину зони. Повертаючись до рис.3 A, пояснимо, якщо небажаний сигнал з'являється в області будь-якої з гармонік частоти fa, він також виникає і на частоті fa, приводячи, таким чином, до появи побічного частотного компоненту в першій зоні Найквіста.

Такий процес подібний до роботи змішувача, використовуваного для детектування аналогових сигналів. При цьому розуміється, що перед дискретизатором (або АЦП) здійснюється фільтрація, що пригнічує компоненти, частоти яких знаходяться поза смугою Найквіста і після дискретизації потрапляють в її межі. Робоча характеристика фільтру залежатиме від того, як близько частота поза смугового сигналу відстоїть від fs/2, а також визначатиметься величина необхідного придушення.

 

3.2. Звукові плати. Основні поняття і характеристики.

Звукова карта здійснює перетворення звуку з аналогової форми в цифрову. Для введення звукової інформації використовується мікрофон, який підключається до входу звукової карти. Звукова карта має також можливість синтезувати звук (у її пам'яті зберігаються звуки різних музичних інструментів, які вона може відтворювати).

       Аудіоадаптер (Sound Blaster або звукова плата) - це спеціальна електронна плата, яка надає можливість записувати звук, відтворювати його з застосуванням апаратних та програмних засобів ПК. Аудіоадаптер містить у собі два або декілька перетворювачів інформації:
• аналого-цифровий, який перетворює безперервні (аналогові) звукові сигнали (мову, музику, шум) у цифровий двійковий код і записує його на магнітний носій;
• цифро-аналоговий, що виконує зворотнє перетворення збереженого в цифровому вигляді звуку в аналоговий сигнал, який потім відтворюється за допомогою акустичної системи, синтезатора звуку або навушників.

Професійні звукові плати дозволяють виконувати складну обробку звуку, забезпечують стереозвук, мають власне ПЗП, де зберігаються  масиви  тембрів звучань різних музичних інструментів. Звукові файли зазвичай мають дуже великі розміри. Так, трихвилинний звуковий файл зі стереозвуком займає приблизно 30 Мбайт пам'яті. Тому плати Sound Blaster, крім своїх основних функцій, забезпечують автоматичне стиснення файлів. Область застосування звукових плат - комп'ютерні ігри (на багатьох звукових платах є спеціальний Game-порт, до якого підключаються ігрові маніпулятори), навчальні програмні системи, рекламні презентації, "голосова пошта" (voice mail) між комп'ютерами, озвучування різних процесів, що відбуваються в комп'ютерному обладнанні. Але головна, і часто використовувана можливість сучасної звукової карти - це здатність відтворювати аудіо і відео-файли, що зберігаються на комп'ютері.

       У сучасних комп'ютерах апаратна підтримка звуку може бути реалізована в одній з таких форм:

звукова плата, що встановлюється в роз'єм шини PCI, PCIe або підключається до порту USB чи IEEE 1394 (FireWire);

мікросхема АС'97 або HD Audio на системній платі.

       Незалежно від місця розташування, звукові пристрої мають роз'єми для підключення мікрофона і акустичних систем, а також можуть оснащуватися і роз'ємами для підключення MIDI-пристроїв (старі моделі також були обладнані ігровим портом). З програмної точки зору звукові адаптери вимагають підтримки  драйверів, або містяться в конкретних програмах, або вбудовуються в операційну систему. [Мюллер Скотт,Розділ 13,Аудіопристрої  ст.727].

       Природа звуку. Звук - це коливання (хвилі), що поширюються в повітрі або іншому середовищі від джерела коливань у всіх напрямках. Коли хвилі досягають вуха, розташовані у ньому чутливі елементи сприймають цю вібрацію і ми чуємо звук.

Кожен звук характеризується частотою та інтенсивністю (гучністю).
         Частота - це кількість звукових коливань у секунду; вона вимірюється в герцах (Гц). Чим вище частота, тим вище тон.

Людське вухо сприймає лише невеликий діапазон частот. Дуже небагато  людей чують звуки нижче 16 Гц і вище 20000Гц. Частота звуку найнижчої ноти на роялі дорівнює 27 Гц, а найвищої - трохи більше 4000Гц. Найвища звукова частота, яку можуть передати радіомовні FM-станції, - складає 15 кГц.

Гучність звуку визначається амплітудою коливань. Амплітуда звукових коливань залежить в першу чергу від потужності джерела звуку. Наприклад, струна піаніно при слабкому ударі по клавіші звучить тихо, оскільки діапазон її коливань невеликий. Якщо ж вдарити по клавіші сильніше, то амплітуда коливань струни збільшиться. Гучність звуку вимірюється в децибелах (дБ). Шелест листя, наприклад, має гучність близько 20 дБ, звичайний вуличний шум - близько 70 дБ, а близький удар грому - 120 дБ.

Оцінка якості звукового адаптера.

Для оцінки якості звукового адаптера використовується три параметри:

• діапазон частот;

• коефіцієнт нелінійних спотворень;

• відношення сигнал / шум.

Частотна характеристика визначає той діапазон частот, в якому рівень записуваних і відтворюваних амплітуд залишається постійним. Для більшості звукових плат цей діапазон становить від 30 Гц до 20 кГц.

Коефіцієнт нелінійних спотворень характеризує нелінійність звукової плати, або, простіше кажучи, коефіцієнт характеризує чистоту відтворення звуку. Кожен нелінійний елемент є причиною спотворення. Чим менше цей коефіцієнт, тим вища якість звуку. Цей коефіцієнт може відрізнятися для аудіоадаптерів з однаковим набором мікросхем. Моделі з дешевими компонентами часто мають значні спотворення, що погіршує якість звуку.

Відношення сигнал / шум характеризує силу звукового сигналу по відношенню до фонового шуму (шипіння). Чим більше показник (в децибелах), тим краще якість відтворення звуку. Наприклад, аудіоадаптер Sound Blaster Audigy має відношення 100 дБ, в той час як більш стара звукова плата характеризується відношенням 90дБ. Перераховані фактори мають важливе значення для всіх сфер застосування аудіоадаптерів - від відтворення файлу WAV до розпізнавання мови.

       Дискретизація. Якщо в комп'ютері встановлена ​​звукова плата, то він може записувати звук у цифровій (дискретній) формі, в цьому випадку комп'ютер використовується в якості записуючого пристрою. До складу звукової плати входить мікросхема - аналого-цифровий перетворювач, або АЦП (Analog-to-Digital Converter - ADC), який під час запису перетворює аналоговий сигнал в цифрову форму, зрозумілу комп'ютеру. Аналогічно при відтворенні цифро аналоговий перетворювач (Digital-to-Analog Converter - DAC) перетворить аудіо запис в звук, який здатні сприймати вуха людини.

         Дискретизацією називається процес перетворення початкового звукового сигналу в цифрову форму, в якій він і зберігається для наступного відтворення. При цьому зберігаються миттєві значення звукового сигналу в певні моменти часу, звані вибірками. Чим частіше беруться вибірки, тим точніше цифрова копія звуку відповідає оригіналу. 

Першим стандартом MPC передбачався "8-розрядний" звук. Це не означає, що звукові плати повинні були вставлятися у 8-розрядний роз'єм розширення. Розрядність звуку характеризує кількість біт, що використовуються для цифрового представлення кожної вибірки. При восьми розрядах кількість дискретних рівнів звукового сигналу становить 256, а якщо використовувати 16 біт, то їх кількість сягає 65 536. Сучасні високоякісні аудіо адаптери підтримують 24-бітову дискретизацію, причому кількість дискретних рівнів звукового сигналу становить більш ніж 16,8 млн.

Різновиди звукових плат.

-У наш час звукові карти бувають вбудованими в материнську плату

(інтегровані звукові карти), як окремі плати розширення і як зовнішні пристрої. Інтегровані плати вбудовуються в материнську плату комп’ютера, при цьому усі входи і виходи і кодеки припаяні до материнської плати, а обробку бере на себе центральний процесор.

-Плати розширення встановлюються у роз'єм шини PCI, як правило

вони відтворюють звук якісніше ніж інтегровані, проте для професійної роботи їх можливості обмежені.

-Зовнішні звукові плати виникли з потребою надійного екранування

сигналу від сторонніх перешкод, до того ж професійні плати мають велику кількість роз’ємів, розрахованих на підключення професійних студійних пристроїв. Зовнішні плати підключають через інтерфейси USB або Fire Wire, причому останній більшої пропускної здатності інтерфейсу.    

 

Будова та функціонування звукових плат 

       Типова звукова карта (Рис. 4) включає звукову мікросхему, що містить цифро-аналоговий перетворювач, який конвертує записаний або згенерований цифровий звук в аналоговий формат. Вихідний сигнал подається на підсилювач, навушники або зовнішній пристрій, використовуючи стандартні роз'єми, звичайно TRS або RCA. Якщо кількість чи розміри роз'ємів завеликі для задньої панелі комп'ютера, вони можуть бути винесені окремо. Більш сучасні звукові карти містять декілька мікросхем для досягнення вищої якості або поліпшення виконання різних операцій одночасно, наприклад для запису музики в реальному часі важливо, щоб синтез звуків відбувався з мінімальною затримкою процесора.

Відтворення звуку звичайно здійснюється за допомогою багатоканальних ЦАП, що підтримують одночасне відтворення звуків різної висоти й гучності, а також звукові ефекти в реальному часі. Багатоканальне відтворення звуку також використовується для синтезу звуку за допомогою цифрових банків інструментів (англ. Wavetable), що займає невелику кількість постійної або флеш-пам'яті і містить звукові семпли MIDI-інструментів. Інший шлях синтезу звуків полягає у використанні "аудіо-кодеків", цей шлях вимагає відповідного програмного забезпечення, сумісності з MIDI, та багатоканальної емуляції.

Рис. 4 – Блок-схема  типової звукової карти

      

   Звукова карта "розпочинається" із входів (Рис.4.), що розташовані на металічній панели, яка виходить на задню стінку системного блока. До входів під’єднуються зовнішні  аудіо пристрої - мікрофони, магнітофони, електронні інструменти і т.і.  На Рис.4 наведені 4 входи.  Line In та Mic In - лінійні і мікрофонні входи. Окремий вхід Mic In передбачений через низький рівень сигналу у мікрофонів, який необхідно підсилювати до нормального рівня (0 дБ), перед тим як подавати на перетворювач. Отже, на мікрофонних входах звукової карти завжди встановлюється попередній підсилювач, що підвищує рівень сигналу до нормального (лінійного) рівня. На деяких типах звукових плат встановлюється додатковий вхід Aux In. Сигнал з цього входа подається безпосередньо на вихідний мікшер, а з мікшера-  на вихід. Цей вхід надає можливість спростити комутацію зовнішніх пристроїв та використати внутрішній мікшер звукової плати для змішування  сигналів із зовнішнього та внутрішніх джерел. Наприклад, підключення автономного синтезатора до Aux In надає можливість виводити звукову інформацію на колонки.

Вхід програвача компакт-дисків, зазвичай розташований безпосередньо  на звуковій платі. При наявності  приводу CD-ROM, його вихід можливо безпосередньо зв’язати з наведеним вище входом звукової карти. Таке зєднання  надає можливість прослуховувати аудіо компакт-диски та оцифровувати звук безпосередньо з приводу.

Додатково на задній панелі звукової карти зазвичай є 15-піновий роз’єм MIDI/джойстик порта, який призначений для підключення будь-яких зовнішніх MIDI-пристроїв (синтезаторів, MIDI-клавіатур, тощо) або джойстика, якщо карта використовується для ігор. На спеціалізованих звукових картах MIDI-порт може мати не стандартний 15-піновий разєм, а будь-який інший. У таких випадках прикладається завжди  спеціальний  перехідник. А для подключения зовнішніх MIDI-пристроїв до стандартного порту необхідна комплектація стандартним перехідником.

Усі сигнали з зовнішніх аудіо пристроїв подаються на вхідний мікшер звукової плати (Рис. 4). Вхідний мікшер працює як звичайні пульти, з тією різницею, що управління відбувається програмно. В комплект службових програм будь-якої звукової карти входить програма мікшера. Вона є і в стандартних комплектах поставки операційної системи Windows.

Вхідний мікшер призначений для встановлення оптимального рівня запису. Через чутливість цифрової техніки до перевищення рівня 0 дБ та зменшення динамічного діапазону будь-який запис "живого" звуку починається з регулювання рівня сигналу за допомогою вхідного мікшера звукової карти.

Блок цифpового запису/відтворення (цифровий канал або тракт карти) здійснює перетворення аналог->цифpа та цифpа->аналог у pежимі пpогpамної пеpедачі або по DMA. Блок складається із вузла, що безпосередньо здійснює аналогово-цифpові перетворення - АЦП/ЦАП (coder/decoder, codec), та вузла керування. АЦП/ЦАП або інтегpується в склад однієї з мікpосхем каpти, або застосовується  окрема мікpосхема (AD1848, CS4231, CT1703 тощо). Від якості застосованого АЦП/ЦАП у багатьох випадках залежить якість оцифровування та відтворення  звуку, але не менш вона залежить від  вхідних та  вихідних підсилювачів. Аналого-цифровий перетворювач через певні терміни часу вимірює амплітуду аналогового сигналу, що поступає від мікрофона або магнітофона  та кодує   співвідношення коливань поcлідовністю бітів.

Після аналого-цифрового перетворення (через АЦП), дані подаються до сигнального процесору (DSP - Digital Signal Processor). DSP керує обміном даними з іншими пристроями компютера через шину ISA, PCI, PCIе.

Якщо центральний процесор виконує програму запису звуку, то цифрові дані подаються або на жорсткий диск, або в оперативну память компютера (це залежить від програми, що виконується). Отже, формується звуковий файл. Звукове устаткування прогресує дуже швидко. Сьогодні звукова карта з підтримкою 24-бітного звуку із частотою дискретизації 192 кГц є достатньо поширеною. Крім того, вже з'явилися материнські плати з вбудованим звуковим ядром, що підтримує звук четвертого покоління. Якщо говорити про сучасні повно дуплексні звукові карти, з підтримкою звуку класу 24/192, то нам потрібний інтерфейс, з гарантованою потоковою передачею даних, тобто IEEE-1394 або PCI, PCIе, що виключає гальмування шини даних.

 

 Вимоги до звукових карт.

Підтримка тривимірного звуку, реалізована в наборі мікросхем. Вираз тривимірний звук означає, що звуки, відповідні відбувається на екрані, лунають далі або ближче, за спиною або десь осторонь. Microsoft DirectX 8/9.x включає в себе підтримку тривимірного звуку, однак для цього краще використовувати аудіо адаптер з апаратно вбудованою підтримкою  тривимірного звуку.

DirectX 8/9.x може використовуватися поряд з іншими API тривимірного звуку, до яких належать, наприклад, EAX і EAX 2.0 компанії Creative, 3D Positional Audio компанії Sensaura і технологія A3D нині не існуючої компанії Aureal.

D-звукове прискорення. Звукові плати з наборами мікросхем, що підтримують цю можливість, мають досить низький коефіцієнт завантаження процесора, що призводить до загального збільшення швидкості ігор. Для отримання найкращих результатів необхідно скористатись наборами мікросхем, що підтримують прискорення найбільшого числа 3D-потоків; в іншому випадку при обробці тривимірного звуку центральний процесор може зіткнутися з певними труднощами, що в кінцевому рахунку позначиться на швидкості гри. Це особливо важливо для систем з частотою процесора менше 1 ГГц або при роботі з високим дозволом і глибиною кольору (від 1024*768/32 біт).

 

Зовнішній інтерфейс.

Більшість звукових карт мають роз'єми для вхідних (input) та вихідних (output) сигналів. Нерідко звукові карти оснащуються двома вхідними роз'ємами. Один з них, line-in, призначений для підключення пристроїв високого рівню сигналу, таких як, наприклад магнітофон. Цифрова карта оцифровує цей сигнал і зберігає на жорсткому диску комп'ютера (пізніше збережений сигнал можна обробляти). Інший вхідний роз'єм, microphone, призначений для підключення мікрофону або подібного пристрою низького рівня сигналу. Професійні звукові плати оснащуються кількома вхідними роз'ємами, що дозволяє здійснювати багатоканальний запис звуку.

Окрім того, звукові карти містять так званий "ігровий порт", початково призначений для підключення джойстиків, проте пізніше він знайшов своє призначення для підключення MIDI-клавіатур, цифровий вихід S/PDIF та інші роз'єми. При цьому кожне з гнізд роз'ємів маркують певним кольором згідно наступної таблиці:

Цифровий формат DVD-Audio.

DVD-Audio - формат, спеціально створений для високоякісного відтворення звуку. DVD-Audio забезпечує відтворення LPCM аудіо даних, що зберігаються на диску й записаних із застосуванням одного із двох типів дискретизації:

     1. DVD-Audio с частотами, кратними 44,1 кГц (88,2/176,4 кГц);

2.     DVD-Audio с частотами, кратними 48 кГц (96/192 кГц).

У кожному із цих типів може бути використана 16-ти, 20-ти й 24-бітна роздільна здатність.

Специфікація DVD-Audio має обмеження у швидкості передачі даних (9,6 Мб/с), що вплинуло на реалізацію багато канальних записів на DVD-Audio з високими частотами дискретизації. На найбільших частотах дискретизації (176,4 192 кГц) на DVD-Audio підтримується тільки монофонічне або 2-канальне відтворення: на всіх інших частотах забезпечується відтворення до 6 каналів.

Кількість каналів DVD-Audio, відтворювані частоти (Рис. 5):

Рис. 5 – Відповідність між кількістю каналів та відтворюваними частотами DVD-Audio

При 74 хвилинах звучання шести звуковим каналам якості 24 bit/96 kHz, DVD-Audio диску, що має обмеження, як у швидкості передачі даних, так і в ємності (4,7 ГБ для однобічного одношарового диска), потрібна смуга пропускання 13,8 Мб/с і ємність 7,67 ГБ. Для вирішення поставленого завдання в DVD-Audio використовується система компресії даних MLP (Meridian Lossless Packing) або PPCM (Packed PCM, Packed Pulse Code Modulation), розроблена фірмою Meridian Audio. Суть цієї системи полягає в тім, що розпакований MLP потік даних абсолютно ідентичний потоку до компресії. Ступінь стиску в MLP залежить від змісту й роздільної здатності матеріалу - обсяг даних зменшується до 55%. Цього досить для відтворення пропущеного потоку в реальному масштабі часу.

Відмінністю DVD-Audio від CD є:

·  висока якість DVD-Audio;

·  багато канальність DVD-Audio;

·  універсальність DVD-Audio: на диску DVD-Audio може зберігатися кілька варіантів запису в різних форматах;

·  наявність (в разі необхідності) на DVD-Audio відео матеріалу, фотографій, текстів;

·  інтерактивність DVD-Audio;

·  графічний інтерфейс DVD-Audio.

Відмінністю DVD-Audio від DVD: є запис звуку без стиску з великою роздільною здатністю. Цей запис читається тільки програвачами, що підтримують DVD-Audio.

DVD-Audio диски читаються на будь-яких DVD програвачах за рахунок дублювання доріжок у форматах PCM/Dolby Digital/DTS. Бувають двосторонні DVD-Audio диски, на одній стороні яких записаний шар високого дозволу для DVD-Audio програвачів, на іншій стороні - просто DVD. Коробки для DVD-Audio зазвичай трохи більшого розміру, чим для CD і витягнуті вгору. Диски DVD-Audio можуть програватися на програвачах DVD-Video-Audio. Крім аудіо, DVD-Audio диск може містити довільний текст, меню й зображення. Можливий також комбінований варіант, коли з DVD-Audio носія відтворюється аудіо з DVD-Video фрагментами.

Для аудіо даних у логічній структурі DVD-Audio зарезервований каталог з назвою AUDIO_TS. На дисках з відео він порожній, але в ньому можуть розміщуватися файли, записані за допомогою кодування PCM (Pulse Code Modulation). Крім звукових доріжок, передбачене розміщення на дисках DVD-Audio додаткового контенту, відеозаписів або фотографій. Специфікація DVD-Audio дозволяє записувати на диск не тільки звук, але супроводжувати його відео-фрагментами або зображеннями, які демонструються під час прослуховування.

Більшість DVD-Audio дисків є "гібридними", тобто, крім основного DVD-Audio формату, на диску присутній і DVD-Video. Це дозволяє програвати DVD-Audio і на звичайних DVD програвачах, але тільки звукову інформацію з відео-частини (папка VIDEO_TS) у вигляді PCM, DTS, DD. При завантаженні DVD-Audio програвачі читають спочатку аудіо розділ, що закладений на диску. Якщо він порожній або не відповідає прочитанню для звичайних DVD програвачів, плеєр переходить до читання відео-розділу, з якого й буде витягнута вся необхідна інформація. Універсальні DVD-програвачі читають спочатку аудіо розділ, із вмістом DVD-Audio, а при необхідності можна перемкнути режим для звичайного DVD-Video формату.

 

                     Цифровий інтерфейс музичних інструментів

Musical Instrument Digital Interface (MIDI).

       MIDI-форма звуку була розроблена для електронних музичних інструментів ще в 1982 році і призначалася для передачі цифрових сигналів - так званих MIDI-послідовностей або MIDI-посилок від одних інструментів до інших, наприклад, від клавіатури до синтезатора. Слово MIDI-Musical Instruments Digital Interface, тобто цифровий інтерфейс музичних інструментів.

       По суті, MIDI-послідовність складається з цифрових команд, які надсилаються музичним інструментом. Вони повідомляють про події, що відбулися - натисканні чи відпусканні клавіші або педалі, перемиканні регістру або інструменту і т.п. У цьому сенсі MIDI-послідовність те саме нотного запису. Пристрій, який за цими командами може відтворити звук, називається MIDI-синтезатором. На звуковий платі комп'ютера є такий синтезатор, але можна підключити ще і зовнішній синтезатор.

       Апаратні синтезатори розрізняються за методом синтезу. В даний час використовуються методи FM-і WT-синтези. FM-синтез (від англ. Frequency Modulation - частотна модуляція) заснований на використанні декількох генераторів сигналу (операторів), зазвичай синусоїдального, із взаємною модуляцією. Тембр звуку виходить штучний. WT-синтез (від англ. Wave Table - таблиця хвиль) заснований на відтворенні семплів - заздалегідь записаних в WAVE-формі зразків звучання реальних інструментів (зазвичай однієї ноти), які перед відтворенням належним чином перетворюються. Цим досягається велика реалістичність звучання класичних інструментів, але потрібна пам'ять для зберігання семплів. Крім того, комп'ютер може по MIDI-послідовності синтезувати аналоговий аудіосигнал програмою-синтезатором (але для його відтворення все одно потрібна звукова плата).

       Звукова плата дозволяє також вводити MIDI-послідовність від будь-якого підключеного до неї музичного інструменту і записувати її у вигляді MIDI-файлу (розширення. Mid,. Rmi), який потім можна програвати вже без всяких зовнішніх інструментів і включати в будь-які мультимедіа-програми. MIDI-файли в сотні разів компактніше, ніж аналогічні WAVE-файли, тому їх часто використовують для створення музичного фону в мультимедіа-програмах і Web-сторінках.

       Будь-який MIDI-синтезатор може відтворювати звучання більш 150 різних музичних інструментів, що мають свої номери (по англ. Patch) і назви.

Програвання йде одночасно на 16 каналах (треках) - 16 інструментах (або, точніше, в 16 оркестрових групах, що складаються з однакових інструментів). На кожному каналі одночасно може звучати дещо голосів - нот, одержуваних на цьому інструменті (їх може бути до 32). Виходить цілий оркестр, в якому одночасно може звучати 512 голосів. Число голосів на одному каналі характеризує поліфонію синтезатора. На рис. 5 показано «пульт управління» однієї з простих MIDI-програм, на якому видно всі 16 каналів, призначені на них інструменти і їх номери, а також кнопки і регулятори, за допомогою яких можна змінити звучання записаного MIDI-файлу, записати новий файл.

Рис. 5. Інтерфейс програми MIDI Orchestrator фірми Voyetra.

       Створення MIDI-музики на комп'ютері дуже популярно серед музикантів-професіоналів і аматорів. Вони використовують спеціальні програми - музичні редактори (або програми-секвенсори), які досягли високої досконалості. У цих програмах зазвичай нотний запис перетвориться в MIDI-послідовність (по англ. - Sequence) і навпаки, чим і пояснюється назва програм.В даний час плати, що випускаються - є стереофонічними, що підтримують стандарт MIDI. Стереофонічні звукові плати одночасно відтворюють (і записують) декілька сигналів від двох різних джерел. Сигнал - це один звук, вироблений аудіо адаптером. У струнному квартеті використовується чотири сигнали - по одному на кожен інструмент. З іншого боку, такий поліфонічний музичний інструмент, як піаніно, вимагає для кожної ноти акорду окремого сигналу. Отже, для точного відтворення гри піаніста знадобиться 10 сигналів. Чим більше сигналів передбачено в адаптері, тим натуральніше виявляється його звучання. Найкращі на сьогоднішній день аудіо адаптери здатні одночасно відтворювати до 1024 сигналів. Популярні раніше мікросхеми синтезатора, розташовані на системній платі до 20 сигналів і стереофонічний звук. Тим не менш для підтримки MIDI в більшості сучасних звукових систем використовуються записані заздалегідь звукові схеми: подібні системи називаються таблично-хвильовими синтезаторами. У таблично-хвильових звукових платах замість синтезованих звуків, що генеруються мікросхемою частотної модуляції, використовуються цифрові записи реальних інструментів і звукових ефектів. Наприклад, при відтворенні таким аудіо адаптером звуку труби ви дійсно чуєте безпосередньо звук труби, а не його імітацію.

       Перші звукові плати, що підтримували цю функцію, містили до 1 Мбайт звукових фрагментів, що зберігались у мікросхемах пам'яті адаптера. Але в результаті появи високошвидкісних шин PCI, PCIе і збільшення обсягу оперативної пам'яті комп'ютерів у більшості звукових плат в даний час використовується так званий програмований таблично-хвильовий метод, що дозволяє завантажувати в оперативну пам'ять комп'ютера 2-8 Мбайт коротких звукових фрагментів різних музичних інструментів. У даний час звукові системи в повній мірі підтримують таблично-хвильовий синтез, а поліпшені звукові функції DirectX 8.x і вище зробили можливим використання MIDI для запису ігрових фонограм. Найважливішим фактором популярності MIDI є кількість апаратно реалізованих сигналів. Навіть у сучасних звукових адаптерах (Sound Blaster Audigy) апаратно підтримується тільки 64 сигнали: всі інші звуки, необхідні для відтворення MIDI-фонограм, реалізуються програмно.

 

                                    DirectX і звукові адаптери.

       Microsoft DirectX являє собою цілу серію програмованих інтерфейсів додатки (Application Program Interfaces - API), які впроваджуються між мультимедійними додатками і апаратними засобами. На відміну від програм MS DOS, розробникам яких доводилося забезпечувати апаратну підтримку з численними моделями і марками звукових плат, відеоадаптерів та ігрових контролерів, в Windows використовується інтерфейс DirectX, взаємодіє безпосередньо з пристроями апаратного забезпечення. Це підвищує ефективність програм і звільняє розробників від необхідності змінювати параметри додатків при роботі з різними пристроями, так як можна використовувати різні підпрограми універсального інтерфейсу. DirectX є гарантією того, що нові звукові плати та набори мікросхем системної логіки будуть належним чином працювати з різними версіями Windows. 

        Програми роботи зі звуком.

       Мінімальний набір звукового ПО входить до складу ОС Windows - найбільш поширені драйвери звукових плат, кодеки, CD-плейер і Універсальний програвач (Media Player), найпростіша програма запису, програвання і редагування звуку в WAV-форматі (Фонограф або Sound Recorder), а також програма-мікшер, що забезпечує управління вхідним і вихідним мікшерами звукової плати під час відтворення і, відповідно, запису звуку. Ці програми використовують драйвери, встановлені для звукової плати.

Рис. 6. Windows Media Player

 

       Разом зі звуковими платами поставляється більш розвинений набір звукового ПЗ. Це також драйвери, кодеки, мікшери та більш досконалі програми запису, програвання і редагування звуку в WAVE-та MIDI-формах (часто ці програми не встановлюються на машинах з іншими звуковими платами). Крім того, поставляється прикладне ПЗ - програми розпізнавання мовних команд, створення простих музичних композицій і т.п. Методи роботи з усіма цими програмами достатньо прості й очевидні.

       Часто доводиться використовувати кілька звукових програм одночасно. Так, під час запису WAV-файлу з аудіо диска необхідні CD-плейєр, програма-мікшер (а то й два - для відтворення і для запису) і програма звукозапису, що дозволяє задати всі потрібні параметри оцифровування звуку і відредагувати результат.

       Професійне звукове та музичне ПЗ досить дороге і призначене для більш складної обробки цифрового звуку в обох формах. У такому ПЗ часто використовуються складні методи штучного інтелекту. Робота з ним вимагає спеціальної професійної підготовки (музиканта, інженера-акустика).                       

 Канали звуку.

       Звичайні звукові плати дозволяють використовувати 1 або 2 звукових каналів (доріжок) WAVE-звуку - "моно" і "стерео". Обидва канали обробляються окремо за однаковими алгоритмами, хоча й одночасно. Тому немає принципових обмежень на кількість каналів. Збільшення числа каналів веде до пропорційного збільшення обсягу пам'яті, займаної звуковою інформацією.

                    Компресія звуку.

 Позначимо

·                   W - обсяг пам'яті в байтах для зберігання 1 секунди звуку в WAVE-формі,

·                   w - швидкість потоку звукових даних в WAVE-формі в біт / сек,

·                   H - частоту дискретизації (число вибірок в секунду),

·                   B - розрядність квантування (число розрядів на вибірку),

·                   C - кількість каналів.

Тоді очевидно, що w = HBC і, якщо B кратне 8, W = w / 8. Отже,

·                   швидкість потоку даних CD-якості (H = 44100, B = 16, C = 2) становить 1411200 біт/с або 1378,125 Кб/с (така швидкість забезпечується тільки CD-дисководом з не менш, ніж 2-кратною швидкістю ),

·                   1година звуку з якістю CD-DA зажадає 605,6 Мбайт (тому на аудіо диску розміщується близько 70 хвилин звуку без компресії),

·                   швидкість потоку даних телефонного каналу (H = 8000, B = 8,     C = 1) складає 64 000 біт/с або 62,5 Кб/с (така швидкість забезпечується далеко не кожним модемом), отже такий звук не може використовуватися в Інтернет- телефонії).

       З метою зменшення обсягу й потоку звукових даних в WAVE-формі використовуються різні спеціальні алгоритми компресії/декомпресії (кодеки), тому що звичайні алгоритми стиснення інформації тут не ефективні. Стиснення аудіо даних можливе лише з деякою втратою інформації, але через  особливості сприйняття звуку людиною ці втрати практично не є непомітними. Найбільш відомими є кодеки, що використовуються в мультимедіа під Windows:

·                   PCM (Pulse Code Modulation) - імпульсно-кодова модуляція (ІКМ) - стиснення може досягатися тільки за рахунок вибору менших значень величин H, B і C; квантування відбувається за рівномірною шкалою з 2B значень;

·                   DPCM (Differential PCM) - диференціальна ІКМ (ДІКМ) - вибірка представляється своєї різницею від попередньої, що вимагає менше B бітів; стискає в кілька разів;

·                   ADPCM (Adaptive DPCM) - адаптивна ДІКМ (АДІКМ) - те ж, що ДІКМ, тільки квантування відбувається не за рівномірною шкалою, а з урахуванням динаміки змін амплітуди; стискає в кілька разів;

·                   MPEG (Motion Picture Experts Group) - стандарти Групи експертів у галузі кіно; для стиснення звукової інформації використовуються стандарти MP2;

·                   MP3 - застосовується психо акустична компресія, при якій віддаляються звуки, які не сприймаються людським вухом, стискає в кілька десятків разів при досить високій якості;

·                   ReаlAudio - метод, розроблений фірмою RealNetworks, стискає в кілька десятків разів, але з невисокою якістю; використовується в Інтернеті для відтворення звукових файлів в реальному часі. Для цифрової телефонії використовуються, як правило, інші кодеки.
 Формати WAVE-файлів.

  Часто кодек визначає і формат аудіо файлу, і, відповідно, його розширення:

·                   MPEG - ". Mpa", ". Mp3",

·                   RealAudio - ". Ra", ". Rm".

         Більш гнучким є WAV-формат для Windows (файли з розширенням       ". Wav"). У його основі лежить формат RIFF (Resourse Interchange File Format), що дозволяє зберігати довільні дані у структурованому вигляді. Для запису звуку в цьому форматі можуть бути використані різні кодеки.
         У форматі RIFF файли діляться на блоки даних (Chunks), що містять число байтів, кратне 4. Кожен блок починається з 4-байтового ідентифікатора, за яким слідує 4 байти з довжиною блоку або файлу. При необхідності блок доповнюється нульовими байтами, але розмір вказується без урахування цих байтів.

       WAV-файл складається з трьох блоків - двох заголовних та одного блоку звукових даних. Перший блок має ідентифікатор "RIFF", за яким в 4-х байтах слідує розмір файлу (без урахування перших 8 байтів). У наступних 4-х байтах варто ідентифікатор "WAVE", який вказує тип RIFF-файлу.
         Наступний заголовний блок містить байтів в наступному порядку:

4 байти - ідентифікатор "fmt_"
4 байти - число 16 (розмір даних блоку)
2 байти - інформація про кодеку (1 для PCM)
2 байти - число каналів (1 - моно, 2 - стерео)
4 байти - частота дискретизації (при 44100 Гц - AC44H)
4 байти - число байтів в секунду, рівне W, якщо B кратне 8
2 байти - число байтів на один відлік, рівне BC / 8, якщо B кратне 8
2 байти - число бітів на вибірку B (якщо B не кратне 8, то вибірки доповнюються нулями до цілого числа байтів).

Останній блок - дані відліків - починається ідентифікатором "data", за яким розташовано 4 байти - розмір блоку, а потім самі дані. У разі стерео відліку дані для обох каналів слідують один за одним: спочатку вибірка для лівого каналу, потім вибірка для правого і т.і.

Comments