Формантный синтез

Формантный синтез (Formant Shaping Synthesis) — синтез, в основе которого лежит воссоздание в спектре звука акустических резонансов, формирующихся из групп обертонов и называемых формантами (подробнее обертонах здесь).

Предпосылки

Изначально формантный синтез ассоциировался с синтезом речи. Речевой аппарат человека устроен таким образом, что нос и глотка являются, по сути, природными фильтрами. В процессе формирования звука эти фильтры чисто механически принимают определенные формы, исходя из которых в звуковом потоке образуются группы акустических резонансов, «сгустки» обертонов. В зависимости от частот, на которых появляются резонансы, и от структуры взаимодействия частот и амплитуд резонансов в спектре, наше ухо различает те или иные фонемы, то есть звуковое выражение букв. На картинке изображены формы резонаторов для воссоздания звуков разных гласных букв. Таким образом, имея возможность проанализировать спектры всевозможных фонем, мы получаем возможность их воссоздать средствами синтеза, или, проще говоря, синтезировать.

Форманты

Польза этого метода была очевидна для передачи сигналов, несущих речевую информацию, на большие расстояния посредством кодирования их в пункте передачи и раскодирования по обратному алгоритму в пункте приема. На этом построен принцип работы вокодера, который при анализе речи разбивает спектр на полосы, выявляет в них резонансы, а затем преобразует обратно в звуковой сигнал. Конечно, полного сходства с источником сигнала получить невозможно, но добиться доступности для понимания передаваемой информации вполне реально.

Каждая фонема содержит в себе несколько формант. Чем больше формант воссоздает вокодер, тем яснее и доступнее передаваемая информация. Гласные звуки становятся разборчивыми при воссоздании уже первых трех групп резонансов. А при воспроизведении четырех уже можно говорить о довольно точной передаче речи. Пока человек произносит одно слово, резонансы его голоса постоянно перемещаются по всему частотному спектру в зависимости от фонемного состава этого слова.

Важной особенностью формант является неизменность их частот для каждой конкретной фонемы вне зависимости от высоты извлекаемой ноты. Например, форманты гласной «о» появляются на частотах 275, 850, 2400 герц, форманты «а» — на частотах 575, 900, 2450 герц, и так далее.

Зная это, совершенно очевидным становится факт, что для формирования фонем совершенно необязательно иметь источник речи в виде человека. Можно просто создать резонансы на нужных частотах для придания звуку соответствующей фонемной окраски. Функция выделения резонансов возлагается на специальные формантные фильтры, работающие по тому же принципу, что и человеческая носоглотка, однако уже не механическим способом, а электронным.

Примеры инструментов

Одним из ярких примеров устройств, работающих на основе воспроизведения в спектре акустических резонансов, является Yamaha FS1R, объединившая в себе два вида синтеза — формантный и частотную модуляцию. Другим примером можно назвать синтезатор Kawai K5000 в различных его модификациях, который, генерируя сигнал аддитивным методом, оснащен формантными фильтрами для создания звуков по описанному выше принципу. Звуки, получаемые на этих инструментах, могут быть близки своей окраской к человеческому голосу или хору голосов.

 

24.04.2009
Алексей Данилов
При перепечатывании ссылка на источник обязательна
© SynthMusic

Похожие статьи