Робота зі звуком з як

Товстий Лорри. Два тижні капають гугл, яндекс. Були які приклади але в основному це просто програми для відтворення або запису. Особливо на qt.
І так шановний у мене до вас питання як загугли то про що не знаєш. Т.к потрібно чітке побудова свого питання в гуглі або Яндексі. але через те, що я не знаю що таке звук я не можу такий скласти.
За запитами С ++ робота зі звуком видає порожні форуми без відповідей. за запитом qt робота зі звуком видає темряву плеєрів для прослуховування музики.
Якщо ви такий гугл майстер допоможіть мені скласти запит, в який input його вставити я сам здогадаюся.

Товстий Лорри. І так ви походу не в курсі як працюють пошукові роботи гугла, що таке пошук і від куди там беруться сайти і інформація або неуважно прочитали моє запитання. При всіх цих "але" які написані в моєму питанні не можливо отримати потрібну інформацію з пошуку.

Якщо вас не утруднить напишіть програму пара рядків не більше!
ifstream file ( "C: \\ ok.wav", ios :: beg | ios :: in | ios :: binary); // наприклад .
Відкриття звукового файлу (не знаю який формат краще для початку у зображень це bmp з ним найпростіше працювати) на ваш вибір. Висновок вмісту в консоль і збереження. Обробки помилок ти по файл відсутній не треба.
Можете послати мене розумію це нахабно =)

"А що з себе представляє звук"

В "математичному" сенсі? Функція виду amplitude (t) = f (t) :-)

"Стандартне" уявлення?
- Беремо відрізок цього нашого t (наприклад - 1 хвилину)
- ділимо на кінцеве число моментів. t_i = (1 / f) * i, де t_i - i-й момент часу, i - номер, f - частота дискретизації
- зберігаємо значення амплітуд в ці моменти (amplitude_i = amplitude (t_i))
- ну і зрозуміло - представляємо ці значення як n-Бітон число (напрнімер - 24 біта).

"Перетворити звукову доріжку в графік"
А дивлячись який. Якщо мова про осцілограмме - то просто юзаем значення амплітуд (ну, може - може застосовуватись якусь просту функцію до них. Від лінійного значення до логарифмическому, наприклад, перейдемо). Як мінімум - можна ще представити як спектрограму (які часто застосовують). Якщо коротко - поділити на інтервали, кожен з яких - описується окремою функцією, і уявити її, наприклад, як суму синусоїд (man перетворення Фур'є).

"Чистити його"
Знову ж - ЕМНІП, в основному працюємо з амплітудами (умовно - вичіаем з багатого на перешкоди сигналу amplitude (t) + noise (t) компонент noise (t)) або спектром (так, умовно - порахували спектр, потім занизили / завищили частину частот (т . Е. Коофициент у відповідних синусоид)) і знову згенерували звук. Але - це вже тягне на цілу предметну область, так що я б спершу подужав першу частину повідомлення.

"Спробувати навчити нейронну мережу розпізнавати деякі слова"
Знову ж - ціла окрема область. Я не знаю, які зараз юзают підходи - але без попереднього пошуку я б зробив подібне (втім, такий мережі явно буде потрібно дохера даних для навчання, я ж майже не використовую специфічних знань про проблему):
- представив запис як набір спектрограм
- поділив їх на відповідні окремим звукам
- згодував марковані дані сітці

"RGB"
Не завжди, до речі. Є ж всякі CMYK та інше. Але, наскільки я знаю - значення в одній схемі можна привести до іншої, так.

Схожі статті