Порадьте програму для побудови спектрограми мови навколонауковий софт

Сьогодні запитав у фахівця. Каже, програми добре виділяти фонеми не вміють. omg!

Фонеми ж залежать від мови.


По-моєму, не зовсім. Від мови залежить те, які фонеми в ньому присутні - у всіх мовах різні набори фонем.
У той же час фонеми часто повторюються, тобто в різних мовах часто можна зустрічати однакові фонеми. Існує Міжнародний Фонетичний Алфавіт. У ньому кінцеве (невелике) число фонем, все що тільки могли трапитися в природних мовах. Тому, якби по спектрограмі можна було б виділяти фонеми в принципі, то не було б проблеми і з конкретними мовами.

Та й погляди на фонематичний інвертарь отдешльного мови можуть відрізнятися: напр. для російського 5 голосних фонем від МФШ і 6 від ЛФШ.


Що таке "МФШ" і "ЛФШ"?

Зелененька крива схожа на осциллограмму, по горизонталі час по вертикалі сигнал мікрофона (тиск звуку).

Нижче напевно спектрограмма, по горизонталі час, по вертикалі частоти присутні в звуці в даний момент часу.


А колір що саме вказує? Начебто інтенсивність, але я не розумію що це означає в точності і навіщо потрібно для виділення фонем (і чи потрібно).

arseniiv. порадьте підручник з фонетики.

Сьогодні запитав у фахівця. Каже, програми добре виділяти фонеми не вміють. omg!


А чому за формою спектрограм не вдається визначати фонеми? Ви говорите, що потрібно мати додаткову інформацію про мову. Але, наскільки я зрозумів відповідь фахівця, у якого запитував, програми, досить добре виділяє фонеми немає і для конкретних мов.

Гугл. Виявилося, що неможливо однозначно відтворити спектрограму (тобто по даній спектрограмі відновити звучання). omg, це чому ще?

Та й не потрібні вам саме фонеми, швидше за все.

Не потрібні. Мені просто цікаво стало. Читав підручник Реформатського, зустрів, захотів відповідні сучасні програми подивитися (підручником років 50).

ці символи не варто розуміти більш ніж абстракцію - він використовується і для запису варіантів фонем - аллофонов, і один і той же аллофон може бути реалізацією різних фонем


Тобто, фонем самих по собі в мові немає, це абстрактне поняття? Тільки їх варіанти, різні реалізації є безпосередньо?

arseniiv, порадьте підручник з фонетики.

А чому за формою спектрограм не вдається визначати фонеми? Ви говорите, що потрібно мати додаткову інформацію про мову. Але, наскільки я зрозумів відповідь фахівця, у якого запитував, програми, досить добре виділяє фонеми немає і для конкретних мов.

Щоб виділити фонеми, якщо виділені Алофон, треба знати, в яких місцях даними аллофон що може реалізуватися, а що ні (це залежить від мови), а для визначення аллофонов потрібно знати, які звуки в мові вважаються за різні Алофон, а які за один . Наприклад, не вивчала російську англієць майже напевно сприйме реалізації [л] і [л '] як рівноцінні, хоча і помітить, природно, деяку різницю - але вона йому буде не важлива. Якщо можна досить добре розділити запис мови на окремі звуки (органи мови беруть нове положення за кінцевий час - тому деякий час між двома сусідніми звуками вимовляється щось середнє), то, мені здається, хороший результат для поділу на Алофон повинні дати алгоритми розпізнавання образів.

Гугл. Виявилося, що неможливо однозначно відтворити спектрограму (тобто по даній спектрограмі відновити звучання). omg, це чому ще?

Дивно. Ось це повинно бути можливим.

Тобто, фонем самих по собі в мові немає, це абстрактне поняття? Тільки їх варіанти, різні реалізації є безпосередньо?

Це дивлячись де. У потоці мовлення є тільки звук. А що там в голові ... (і в мові - це ж річ нематеріальна) Загалом, ця модель з фонемами і аллофонами досить добре застосовна.

Деталізація області частот - напевно, в першу чергу. І іншого: деталізація часу і гучності - але тут, напевно, людям зазвичай вистачає.


Гучність в мові не грає великої ролі.
Що таке деталізація часу? Там по одній з шкал якраз час відкладається, а спектрограмма представляється класично з підписами значень по осі часу і по осі частот. Так що час є.
Що таке деталізація частот? Частоти можна визначити з спектрограми. Саму спектрограму можна розтягнути по горизонталі-вертикалі, отримуючи подробиці. Тобто саме спектрограму дають (я так думаю), а не картинку спектрограми.

Ну і ще впливає не-дуже-то-і-зручність подання інформації в такому вигляді і те, що для роботи треба порівнювати частоти з якими-небудь довідковими. Людина це не швидко зробить.


Комп'ютера порівнювати частоти з довідковими - не проблема. Ми ж про комп'ютерні програми говоримо.