|
09.09.2017 | Когнитивный слуховой аппарат фильтрует шум
У людей с нарушением слуха есть определенные трудности во время разговора в шумной среде, например, в ресторане или на вечеринке. В то время как современные слуховые аппараты могут подавлять фоновый шум, они не помогают человеку прослушивать один разговор среди многих, не зная, к какому динамику он относится. Когнитивная слуховая аппаратура, которая постоянно контролирует мозговую активность субъекта, определяет, разговаривает ли пользователь с конкретным человеком в окружающей его среде.
Разработка системы
Используя модели глубоких нейронных сетей, исследователи из Columbia Engineering сделали прорыв в методах декодирования слухового внимания и приближаются к тому, чтобы сделать когнитивноконтролируемые слуховые аппараты реальностью. Исследование, проведенное Месгарани, профессором электротехники, недавно опубликовано в одном из научных журналов. Работа выполнялась в сотрудничестве с нейрохирургическим отделом медицинского центра университета Колумбия. Таким образом, общественность узнала, что появился аппарат, который фильтрует шум. Команда Месгарани разработала сквозную систему, которая получает один звуковой канал, содержащий смесь громкоговорителей слушателем вместе с нервными сигналами слушателя, автоматически разделяет отдельные колонки в смеси звуков, определяет, какой из них прослушивается, а затем усиливает голос присутствующего диктора, чтобы помочь слушателю - все менее чем за десять секунд. Эта работа сочетает в себе современное состояние из двух дисциплин: речевой инженерии и декодирования слухового внимания. Ученые смогли развить эту систему после того, как совершили прорыв в изучении глубоких моделей нейронных сетей для разделения речи.
Как работает аппарат?
Команда Месгарани придумала идею когнитивноконтролируемого слухового аппарата, который фильтрует шум, после того, как ученые поняли, что можно расшифровать посещаемую цель слушателя, используя нервные реакции в его мозге, используя инвазивные нейронные записи у людей. Два года спустя они показали, что могут расшифровать внимание неинвазивными методами. Перевод этих данных на реальные приложения представляет собой много проблем. В типичной реализации декодирования слухового внимания исследователи сравнивают нервные реакции, записанные из мозга субъекта, с чистой речью, произнесенной разными ораторами. Оратор, который производит максимальное сходство с нейронными данными, определяется как цель и впоследствии усиливается. Однако в реальном мире исследователи имеют доступ только к смеси звуков, а не к отдельным ораторам.
Исследование делает важный шаг в направлении автоматического отделения присутствующего спикера от смеси звуков. Для этого построена модель нейронных сетей с глубокими нейронными сетями, которые могут автоматически отделять конкретные динамики от смеси. Затем сравнивается каждый из этих разделенных громкоговорителей с нейронными сигналами, чтобы определить, какой голос прослушивает субъект, и усиливается этот конкретный голос для слушателя.
|