
Смарт аудиоплатформа ESP32-LyraTD-MSC
ESP32-LyraTD-MSC – одна из аппаратных платформ компании Expressif для аудиоприложений (Рис. 1). Она представляет собой решение для акустического эхоподавления (AEC), поддерживающее распознавание голоса, пробуждение от голоса в ближней и дальней зоне. Аудиофайлы в формате AAC, FLAC, OPUS и OGG могут быть декодированы и выведены без потери качества. Изделие также поддерживает подключение к Baidu DuerOS и Amazon AVS (Alexa Voice Service - Голосовой сервис Alexa). Платформа разработана для приложений искусственного интеллекта и пр.
ESP32-LyraTD-MSC основана на ESP32-WROVER-B, комбинированном BT/BLE/Wi-Fi модуле и цифровом сигнальном процессоре (DSP). Для снижения шума, эхоподавления и прочего используется DSP совместно с матрицей, состоящей из трех микрофонов. Изделие ESP32-LyraTD-MSC интегрировано с периферийными устройствами и состоит из двух отладочных плат (Рис. 2). Верхняя плата в основном состоит из матрицы микрофонов, функциональных кнопок и светодиодных индикаторов. Нижняя плата интегрирована с модулями управления питанием, Wi-Fi и аудио.
Аппаратное обеспечение платформы включает в себя (Рис. 3, Рис. 4):
- Модуль ESP32-WROVER-B;
- Микросхему цифрового сигнального процессора (DSP);
- Три цифровых микрофона, которые поддерживают передачу голоса в дальней зоне;
- 2 х 3 Вт выхода для динамиков;
- Выход на наушники;
- Слот для карты MicroSD (1 линия или 4 линии);
- Двенадцать светодиодов с индивидуальным управлением, которые распределены по краю круглой платы;
- Шесть функциональных кнопок, функции которых могут быть назначены пользователем;
- Несколько интерфейсных портов: I2S, I2C, SPI и JTAG;
- Микросхему USB-UART моста;
- Схему управления зарядом Li-ion батареи.
Структурная схема изделия ESP32-LyraTD-MSC представлена на Рис. 5.
Краткое описание ключевых компонентов изделия ESP32-LyraTD-MSC
- Модуль ESP32-WROVER-B – Модуль ESP32-WROVER-B содержит микросхему ESP32-D0WD для обеспечения Wi-Fi /BT/BLE подключений и эффективной обработки данных. Он также интегрирует 32 Мбит SPI флэш-памяти и 64 Мбит PSRAM для гибкого хранения данных. Это мощный микроконтроллерный Wi-Fi + BT + BLE модуль, предназначенный для широкого спектра приложений - от маломощных сенсорных сетей до самых сложных задач, таких как кодирование голоса, потоковая передача музыки и декодирование MP3.
- Микросхема DSP – Микросхема цифрового сигнального процессора ZL38063 используется для приложений автоматического распознавания речи (ASR). Чип захватывает аудиоданные от внешней матрицы микрофонов и выходов аудиосигналов через порт цифро-аналогового преобразователя (ЦАП).
- Выход для наушников – Выходное гнездо для подключения наушников с разъемом стерео 3.5 мм.
Примечание: Разъем может использоваться с гарнитурами мобильных телефонов, и совместим только со стандартными гарнитурами OMPT. Он работает с гарнитурами CTIA. Пожалуйста, см. аудиоразъемы телефонов в Википедии. - Выход левого динамика – Выходной разъем для подключения 4 Ом динамика. Выводы разъема имеют стандартный шаг 2.54 мм.
- Выход правого динамика – Выходной разъем для подключения 4 Ом динамика. Выводы разъема имеют стандартный шаг 2.54 мм.
- Порт USB-UART (CP2102N) – Функционирует как коммуникационный интерфейс между ПК и модулем ESP32-WROVER-B.
- USB порт питания – Обеспечивает плату питанием.
- Светодиоды режимов Ожидания/ Зарядки – Зеленый светодиод режима Ожидания индицирует, что питание было приложено к порту Micro USB. Красный светодиод зарядки индицирует, что батарея, подключенная к разъему аккумулятора, заряжается.
- Выключатель питания – Перевод рычажка выключателя питания в правое положение включает плату, в левое положение - выключает.
- Светодиод питания – Красный светодиод индицирует, что питание включено.
- Кнопки Загрузки/Сброса – Загрузка: удерживание кнопки Загрузки (Boot) и мгновенное нажатие кнопки Cброса (Reset) инициирует режим загрузки прошивки. После этого пользователь может загрузить прошивку через последовательный порт.
- Сброс: нажатие только этой кнопки сбрасывает систему.
Дополнительно:
- Порт I2S – Шина I2S передает аудиоданные между ESP32 и DSP.
- Порт I2C/SPI:
- ESP32, в качестве мастера I2C, может получать доступ к ведомым устройствам через шину I2C.
- ESP32, в качестве мастера SPI, может обращаться к DSP для чтения / записи данных через шину SPI.
- Порт JTAG – Стандартный интерфейс JTAG. Он совместим с платой программирования ESP32 и поддерживает функции отладки.
- Аудио драйвер – аудиоусилитель мощности, который передает аудиосигналы от DSP к внешним громкоговорителям.
- DC-DC повышающий преобразователь – Работает на фиксированной частоте преобразования. Питает аудио драйвер.
- Порт программирования – Интерфейс программирования и отладки ESP32, совместимый с платой программирования ESP32.
Для работы с ESP32-LyraTD-MSC необходимо подготовить программное обеспечение.
Так, например, для настройки работы с DuerOS необходимо:
- Для загрузки прошивки в плату скачать Flash Download Tool
- Чтобы использовать функциональность SmartConfig и настроить сеть для ESP32-LyraTD-MSC, необходимо загрузить либо IOT Espressif для Android APK, либо ESP-TOUCH для iOS IPA с Espressif Apps
- Используйте инструмент отладки, который подходит для вашей среды разработки, такой как Xshell, ССКОМ и др.
Дополнительно к ESP32-LyraTD-MSC понадобится ПК с ОС Windows (рекомендуемая ОС), два Micro USB кабеля (один для питания через USB), громкоговоритель.
Приведем пример работы интерактивной функции распознавание голоса.
Когда ESP32-LyraTD-MSC подключен к DuerOS, ESP32 поддерживает в качестве пробуждающей фразы слово «Alexa». Если произнести слово «Alexa», то это вызовет следующий ответ со стороны платы на китайском: «nin hao you shen me fen fu» (что означает: «Привет! Чем я могу помочь?»). Пользователи могут общаться с платой и управлять ею для воспроизведения песен и новостей или выполнять другие подобные голосовые взаимодействия.
Задайте следующий вопрос на китайском языке: «tian qi zen me yang» (что означает «как погода?»). Плата ответит по-китайски: «Цзинь тянь инь чжуань дуо юнь» (что означает «сегодня пасмурно, облачно»).
Подробные инструкции по работе с изделием изложены в соответствующих документах на сайте Espressif.
![]() | ![]() |
Рис. 1. Отладочная платформа ESP32-LyraTD-MSC | Рис. 2. Изделие ESP32-LyraTD-MSC состоит из двух отладочных плат |
![]() | ![]() |
Рис. 3. Компоненты нижней платы (A) платформы ESP32-LyraTD-MSC Ver. 2.2 | Рис. 4. Компоненты верхней платы (B) платформы ESP32-LyraTD-MSC Ver. 2.2 |
Рис. 5. Структурная схема изделия ESP32-LyraTD-MSC
Отличительные особенности:
- Wi-Fi/BT/BLE микроконтроллерный модуль ESP32-WROVER-B:
- Двухъядерный микропроцессор Xtensa® 32-bit LX6;
- 11 b/g/n (802.11n до 150 Mbps);
- 4 GHz - 2.5 GHz;
- Bluetooth v2 BR/EDR и BLE спецификации;
- Интерфейсы SD card, UART, SPI, SDIO, I2C, LED PWM, Motor PWM, I 2S, IR, счетчик импульсов, GPIO, емкостной сенсорный датчик, ADC, DAC;
- Встроенный датчик Холла;
- Интегрированная внешняя SPI Flash память 4 МБ;
- Интегрированная внешняя PSRAM 8 МБ;
- Цифровой сигнальный процессор (DSP);
- Три цифровых микрофона;
- 2 выхода для громкоговорителей до 3 Вт каждый;
- Выход для наушников;
- Слот для micro SD карты;
- 12 индивидуально управляемых светодиодов, расположенных по краю круглой платы;
- 6 пользовательских кнопок;
- Порты I2S, I2C, SPIи JTAG;
- USB-UART мост CP2102N;
- Схема управления зарядом Li-Ion батареи;
- Акустическое эхоподавление;
- Поддержка распознавания голоса;
- Пробуждение от голоса в ближней и дальней зоне;
- Аудиофайлы в формате AAC, FLAC, OPUS и OGG могут быть декодированы и выведены без потери качества;
- Поддержка подключения к Baidu DuerOS и Amazon AVS (Alexa Voice Service);
- Конструктивно изделие состоит из двух отладочных плат;
- Напряжение питания 5 В через micro USB Power Port (либо от Li-Ion аккумулятора).
Страница изделия на сайте производителя.
Производители: ESPRES
Разделы: Приемо-передатчики
Опубликовано: 22.05.2019