Удалённый сотрудник заходит в Zoom. На том конце четверо коллег вокруг стола, в центре стола ноутбук. Первые пятнадцать минут совещания уходят на одну фразу: «Подождите, повторите, вас не слышно». Кто-то наклоняется к ноутбуку, кто-то двигает его ближе, кто-то говорит громче, и звук становится хуже: динамики ноутбука начинают «возвращаться» в его же микрофон. Совещание превращается в борьбу с техникой.
Это не редкий случай и не вопрос «дорогого» ноутбука. Это физика. Микрофон, встроенный в корпус ноутбука, спроектирован для одного говорящего на расстоянии 30–50 см — для видеозвонка из дома или кафе. Переговорная — другая акустическая среда: больше людей, больше расстояние, больше отражений от стен и стола, больше шумов. Задача спикерфона — закрыть эту разницу.
В этой статье разбираем пять типовых сценариев, в которых встроенный микрофон ноутбука даёт заведомо плохой результат, и показываем, какие технические решения отвечают за каждый сценарий. Без маркетингового тумана: только физика, инженерные требования и подбор оборудования VoiceXpert под задачу.
Чтобы понять, где встроенный микрофон проигрывает, полезно вспомнить три величины, на которых строится разборчивость речи: расстояние до источника, отношение сигнал/шум и обработка эха.
Расстояние до источника. Громкость звука падает обратно пропорционально квадрату расстояния. Это значит, что если микрофон находится в 30 см от говорящего, и тот же человек отодвигается на 1,2 метра, до микрофона доходит примерно в 16 раз меньше энергии. Микрофон в ноутбуке проектируется под расстояние 30–50 см. На 2–3 метрах он уже работает на пределе чувствительности, и любой посторонний звук (шуршание бумаги, кондиционер, стук пальцев по столу) оказывается сравним по громкости с голосом говорящего. На стороне удалённого участника это слышно как «глухой», «дальний» голос с фоном.
Сигнал/шум и направленность. Микрофон ноутбука почти всегда всенаправленный (омнидиректный): он одинаково ловит звук со всех сторон. В переговорной это означает, что вместе с голосом он подбирает вентиляцию, разговор за стеной, отражение от пластиковой столешницы. Специализированный спикерфон собирает несколько микрофонных капсюлей в массив (array) и применяет алгоритм beamforming: программа в реальном времени анализирует разницу во времени прихода звука на разные капсюли и формирует «направленный луч» в сторону говорящего, подавляя сигнал из других направлений. Это даёт прибавку к разборчивости, которую микрофоном-одиночкой получить нельзя.
Акустическое эхо и AEC. Когда динамик и микрофон находятся рядом, голос удалённого собеседника, воспроизведённый динамиком, тут же попадает в микрофон и уезжает обратно. Удалённый слышит сам себя с задержкой: это и есть эхо. Алгоритм AEC (Acoustic Echo Cancellation) вычисляет, что именно сейчас играет динамик, и вычитает этот сигнал из того, что слышит микрофон. AEC в ноутбуке рассчитан на узкий «домашний» сценарий с одним динамиком и одним микрофоном на коротком расстоянии. В переговорной с большим столом, отражениями и более громким воспроизведением такой алгоритм быстро перестаёт справляться.
Дальше идут пять сценариев, в каждом из которых одна или несколько этих величин выходят за пределы того, на что рассчитан ноутбук.
Типичная картина. Четыре–шесть человек сидят за столом длиной 2–3 метра. Ноутбук стоит в центре или ближе к одному из участников. Тот, кто рядом, слышим хорошо. Сидящий на дальнем углу стола еле различим. Если он начинает говорить громче, остальные в комнате жалуются: «не кричи». Если тише, удалённый просит повторить.
Что происходит технически. Микрофон ноутбука улавливает прямой звук с радиуса до 1–1,2 метра. Дальше начинает доминировать не голос, а отражённый сигнал от стола и стен. Отражённый сигнал имеет «размытую» атаку: слоги склеиваются, согласные пропадают. На стороне удалённого это слышно как речь «из коридора».
Решение. Спикерфон с круговой диаграммой направленности и массивом микрофонов, рассчитанный на групповую переговорку.
Базовая рабочая лошадка для такого помещения VXA-210-UBE. Это спикерфон с 4-микрофонным массивом, встроенным алгоритмом AEC и радиусом захвата речи до 8 метров. К нему можно подключить два дополнительных проводных микрофона, если стол вытянутый и нужно «дотянуться» до дальних мест. Подключение по USB или Bluetooth: спикерфон опознаётся системой как стандартное аудиоустройство, никакой отдельной настройки в Zoom, Teams или TrueConf не требуется. Встроенный аккумулятор на 3000 мАч даёт около 10 часов автономной работы. Устройство не привязано к розетке, его можно перенести в соседнюю переговорку.
Когда этого мало. Если переговорка длиннее 6 метров или участников 8 и больше, массива из 4 капсюлей недостаточно. Тогда переходим к сценарию 5.
Типичная картина. Звонок идёт через ноутбук, динамики ноутбука включены, чтобы слышали все в переговорке. Удалённый говорит «я слышу сам себя с задержкой». Чем громче ставят звук, тем сильнее эхо. В какой-то момент звонок начинает «гудеть»: это уже не эхо, а самовозбуждение цепи микрофон-динамик-микрофон.
Что происходит технически. Микрофон и динамики ноутбука разнесены на 10–15 см. Алгоритм AEC должен в реальном времени вычесть из микрофонного сигнала то, что играет динамик, с учётом задержки, частотной характеристики и отражений. В тихом помещении на одной паре «микрофон+динамик» это работает. Как только громкость воспроизведения растёт (например, чтобы услышал дальний угол стола), а в комнате появляются отражения от стен и стекла, модель эха для алгоритма становится слишком сложной. Алгоритм «отстаёт», часть отражений в вычитание не попадает и уходит обратно в звонок.
Решение. Разнести микрофон и динамик в одно устройство с AEC, рассчитанным именно на переговорный сценарий, и физически отключить динамики ноутбука.
Здесь снова базовая рекомендация: VXA-210-UBE или VXA-212-UBE для переговорных побольше. Оба используют согласованную пару «массив микрофонов + динамик» в одном корпусе. Модель эха в таком устройстве известна заранее, AEC калибруется под конкретные капсюли и динамик, а не под произвольный ноутбук. В результате эхо подавляется устойчиво даже на высокой громкости.
Если переговорка делится на сектора и нужны выносные микрофонные точки, VXA-212-UBE поддерживает проводное каскадирование: два устройства соединяются в одну акустическую систему с общим эхоподавлением. Это важно, потому что наивное «поставим два независимых спикерфона» обычно ухудшает ситуацию, а не улучшает (два независимых AEC начинают «спорить» друг с другом).
Подробнее про эхо и его причины: в материале «Эхо на видеозвонках без ремонта переговорной».
Типичная картина. В переговорной четыре человека плюс один-два удалённых в Teams или Zoom. Те, кто в комнате, обсуждают вопрос между собой, не глядя в камеру. Удалённый слышит фрагменты: того, кто ближе к ноутбуку, разборчиво, остальных едва. Через 10 минут он перестаёт включаться в обсуждение. Решения принимают те, кто в комнате, а удалённый получает их по факту.
Что происходит технически. Это не только акустическая проблема, но и поведенческая, причём поведение растёт из акустики. Если микрофон ловит только ближнего, остальные участники подсознательно «не считают» удалённого частью разговора. Чтобы вернуть удалённому голос, надо физически выровнять зону захвата по всей комнате: это называют meeting equity, «равенством участников». В коротком обсуждении переговорных, где переговорки сравнивают с боулингом из-за длинного стола и одного микрофона на конце, показано ровно это: геометрия комнаты диктует поведение людей.
Решение. Спикерфон, у которого микрофоны охватывают всю плоскость стола, либо спикерфон с выносными беспроводными микрофонами для тех мест, куда основной массив «не дотягивается».
Под длинный стол с распределёнными участниками подходит VXA-211-W: спикерфон с Hi-Fi динамиком и двумя беспроводными микрофонами. Базовый блок ставится в центре стола, два микрофона разносятся по краям. Каждый из удалённых микрофонов опознаётся системой как часть одного устройства, AEC работает целостно.
Для переговорных бо́льшего объёма, где важна и автономность, и качество воспроизведения, базовая рекомендация VXA-213-UBE. Это спикерфон с 8-микрофонным массивом, поддержкой беспроводного каскадирования (несколько устройств объединяются в одну акустическую систему без проводов между ними), Hi-Fi-динамиком и аккумулятором на 6000 мАч (около 10 часов работы). Зона покрытия до 50 м², что закрывает большинство «средних» переговорных.
Выбор между «портативной» и «стационарной» логикой подробнее разобран в материале «Портативный или стационарный спикерфон: что выбрать для гибридного формата».
Типичная картина. Половина участников ведёт заметки на ноутбуке. Каждый удар по клавише, каждое переворачивание листа и сдвиг бумаги по столу попадает в микрофон громче, чем голос говорящего на другом конце стола. Кто-то ставит чашку, удалённый дёргается от удара. Кто-то опирается на стол, микрофон ловит низкочастотный гул.
Что происходит технически. Микрофон ноутбука механически связан с корпусом, корпус стоит на столе, а стол — резонатор. Любая вибрация со стола передаётся в микрофон по короткому жёсткому пути, без затухания. К этому добавляется ограниченная по эффективности шумоподавляющая модель в ноутбуке: она обучена на «домашних» шумах (вентилятор, улица, фон комнаты). Импульсные шумы (клавиша, стук, шорох бумаги) она часто пропускает или отрабатывает с задержкой.
Решение. Корпусная развязка спикерфона от стола (резиновые опоры, антивибрационный корпус) плюс шумоподавляющая обработка, рассчитанная на офисные импульсные шумы.
Здесь снова рабочая рекомендация: VXA-210-UBE или VXA-212-UBE. У обоих устройств обработка построена на двух стадиях: сначала статичный шум (вентиляция, кондиционер) гасится спектральным шумоподавлением, потом импульсные щелчки и стуки отрабатываются отдельным алгоритмом. На стороне удалённого это слышно как «чистый» звук без характерных «постукиваний» по столу.
Дополнительно: спикерфон с массивом микрофонов и beamforming сам по себе ослабляет шумы, идущие из-за пределов «луча» на говорящего. Если клавиатура соседа находится сбоку, beamforming её слышит хуже, чем голос. Микрофон ноутбука такой возможности не имеет в принципе.
Типичная картина. Зал на 12–20 человек, два-три ряда кресел, длинный стол или П-образная рассадка. Ноутбук стоит у ведущего, остальные участники находятся на 4–6 метрах от него. Когда говорит ведущий, всё в порядке. Когда задаёт вопрос человек из второго ряда, удалённый слышит шёпот. Голосовая активация в платформе видеоконференцсвязи переключает «активного говорящего» на ведущего, потому что только его микрофон-ноутбук слышит достаточно громко, и удалённый теряет визуальный контекст вопроса.
Что происходит технически. При радиусе 4–6 метров до микрофона ноутбука его SNR (отношение сигнал/шум) уже отрицательное: шум комнаты громче полезного сигнала. Никакая программная обработка такой сигнал не восстановит, потому что речи в нём в чистом виде нет. Здесь нужен другой класс решений: распределённые микрофоны или потолочный массив.
Зарубежные интегрированные решения для переговорных идут по пути «всё в одном корпусе с матричной обработкой и видеотрассингом». Это удобно для премиум-сегмента, но привязывает заказчика к одной экосистеме и одному платформенному решению. Альтернативный путь, модульная система: распределённые микрофоны или потолочный массив плюс отдельный кодек ВКС, который заказчик подбирает под платформу.
Решение от VoiceXpert.
Для зала, который ещё помещается в формат «один распределённый спикерфон», базовый выбор: VXA-213-UBE в режиме беспроводного каскадирования. Два-три устройства объединяются в одну акустическую систему, общим эхоподавлением и общей логикой выбора активного микрофона. Покрытие до 50 м² без проводных трасс по столу.
Для зала-аудитории, где люди не сидят за общим столом, а распределены по площади (обучение, презентация, town hall), точечное размещение микрофонов на столе уже не работает. Здесь рабочее решение: потолочный массив VXA-MIC-Cell, где собраны 40 микрофонных капсюлей в одном потолочном модуле, формирование зон захвата программно (beamforming по 40 каналам позволяет программно направлять «лучи» в нужные точки помещения и переключаться между активными зонами), захват речи на расстояниях до 10 метров. Микрофоны не занимают стол, не требуют от участников «говорить в коробочку» и не зависят от того, где конкретно сидит человек.
Базовая логика подбора по размеру помещения подробнее разобрана в материале «Спикерфон по размеру переговорной».
Чтобы не возвращаться к каждой модели отдельно, соберём логику в одном месте: от персонального устройства до решения для большого зала.
VXA-120-UB. Персональный спикерфон на 1–3 человек. Подключение USB и Bluetooth, радиус захвата речи до 4 метров. Это не «переговорный» класс, но если у сотрудника индивидуальный кабинет с короткими встречами «один на один», устройство закрывает задачу без избыточного функционала.
VXA-210-UBE — базовое решение для групповой переговорки на 4–8 человек. 4-микрофонный массив с AEC, радиус 8 метров, USB и Bluetooth, два дополнительных проводных входа под выносные микрофоны, аккумулятор 3000 мАч (около 10 часов работы). Покрывает сценарии 1, 2, 4 для «средней» переговорной.
VXA-211-W. Спикерфон с Hi-Fi-динамиком и двумя беспроводными микрофонами для переговорной на 4–6 человек с распределённой посадкой. Беспроводные микрофоны решают проблему длинного стола без проводов по столешнице.
VXA-212-UBE. Переговорная до 14 человек. 8-элементный массив, проводное каскадирование двух устройств в одну систему, радиус захвата 8 метров. Подходит, когда нужна стационарная инсталляция с постоянным питанием и проводной развязкой.
VXA-213-UBE — переговорная до 14 человек и площадью до 50 м². 8-микрофонный массив, беспроводное каскадирование, Hi-Fi-динамик, аккумулятор 6000 мАч (около 10 часов работы). Подходит, когда инсталляция должна быть «без проводов на столе» и при этом покрывать гибридные сценарии с meeting equity.
VXA-MIC-Cell — потолочный массив на 40 капсюлей с захватом до 10 метров. Для больших залов, аудиторий, помещений с переменной рассадкой. Используется в связке с кодеком ВКС или платформой UC.
Подробное руководство по выбору с примерами расчёта зон: «Как выбрать спикерфон для конференций».
| Сценарий | Кол-во чел | Площадь | Базовая модель | Альтернатива |
|---|---|---|---|---|
| 1. Группа за столом | 4–8 | до 25 м² | VXA-210-UBE | VXA-212-UBE |
| 2. Эхо от близких динамиков | 4–8 | до 25 м² | VXA-210-UBE | VXA-212-UBE |
| 3. Гибридная встреча, meeting equity | 4–8 | до 25 м² | VXA-211-W | VXA-213-UBE |
| 4. Шум клавиатуры и движений | 4–8 | до 25 м² | VXA-210-UBE | VXA-212-UBE |
| 5. Большой зал | 10+ | 30–50 м² | VXA-213-UBE (каскад) | VXA-MIC-Cell |
| Персональный кабинет | 1–3 | до 10 м² | VXA-120-UB | не требуется |
Таблица не заменяет акустический расчёт, но в 80% случаев правильный кандидат на первый тест выбирается именно по ней.
Bluetooth-наушники решают задачу одного говорящего: тот, на ком наушники, слышит звонок и его слышат на другой стороне. Если в переговорной собралось четыре человека, и говорить будут все четверо, наушники одного из них не помогут остальным. Для группового сценария нужен спикерфон, который воспроизводит звук на всех и собирает звук со всех.
Один спикерфон закрывает помещение, в котором максимальное расстояние от любого говорящего до устройства не превышает заявленного радиуса захвата. Для VXA-210-UBE и VXA-212-UBE это 8 метров. Если переговорная длиннее или вытянутая, нужно либо переходить на модель с большим радиусом (VXA-213-UBE), либо каскадировать два устройства. Важно: каскадирование должно быть штатным режимом устройства с общей логикой AEC, а не «поставим рядом два независимых». Два независимых устройства в одной комнате создают конкуренцию двух AEC-алгоритмов и обычно ухудшают звук.
USB даёт стабильное соединение, питание устройства от ноутбука и единый аудиоканал в обе стороны. Bluetooth удобен, когда устройство стоит «не у того» ноутбука и его надо быстро переключить. Базовая рекомендация для стационарной переговорной: USB как основной режим, Bluetooth как резервный для гостевых ноутбуков. Все упомянутые модели поддерживают оба интерфейса.
Большинство сценариев из этой статьи не требуют ручной калибровки: алгоритмы AEC и шумоподавления настраиваются автоматически за первые 10–30 секунд работы. Что действительно влияет на качество, так это расположение устройства. Спикерфон ставится в геометрическом центре стола, на расстоянии не ближе 50 см от стен и окон, на горизонтальной устойчивой поверхности. Подробный разбор расположения: «Оптимальное расположение спикерфона».
Спикерфоны VoiceXpert опознаются операционной системой как стандартное USB- или Bluetooth-аудиоустройство. Это значит, что они работают с Zoom, Microsoft Teams, Google Meet, TrueConf, VideoMost, IVA MCU, Webex и любой другой платформой, которая использует системные аудиоустройства. Отдельных драйверов для каждой платформы устанавливать не нужно.
Для «гибрида сценариев» базовая логика такая: выбирать по самому требовательному. Если максимум, это группа 6–8 человек, ставится VXA-210-UBE или VXA-211-W: они избыточны для встречи «один на один», но не мешают ей. Обратный путь (поставить персональный спикерфон и надеяться, что «как-нибудь дотянет» до восьми участников) обычно заканчивается возвратом к ноутбучному микрофону и сценариям из этой статьи.
Спикерфон — это «всё в одном»: микрофоны, динамик, обработка и подключение к ВКС-платформе в одном устройстве. Подходит для переговорных до 50 м². Микрофонная система конференц-зала — это раздельные компоненты (потолочные или настольные микрофоны, отдельный DSP-процессор, отдельные акустические системы, отдельный кодек ВКС), которые собираются под конкретный зал. Граница проходит примерно по площади 50 м² и по требованиям к индивидуальной настройке. Потолочный массив VXA-MIC-Cell относится к пограничным решениям: он используется и в составе спикерфонных систем, и в составе модульных конференц-зальных инсталляций.
Чтение статьи не заменяет тест в реальной комнате. Акустика конкретного помещения, материалы отделки, расположение окон и стола, особенности видеоплатформы — всё это влияет на итоговый результат.
VoiceXpert предоставляет демо-оборудование на 7 дней для тестирования в вашей переговорной. Подбор модели идёт от сценария: укажите число участников, площадь, формат встреч (групповые/гибридные/презентации) и используемую ВКС-платформу. Менеджер предложит конкретную модель и приедет для установки и калибровки.
Запросить тест на 7 дней: voicexpert.ru → раздел «Тестирование оборудования».
Подбор по сценарию: опишите задачу в форме обратной связи на сайте, пришлём список из 1–2 моделей с обоснованием и сравнительной таблицей под ваше помещение.