Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Industrial Internet of Things >> Tecnologia da Internet das Coisas

Os kits de desenvolvimento aceleram a integração do Alexa


Os engenheiros de projeto podem empregar módulos de hardware e serviços de software para integrar o Alexa Voice Service (AVS) em dispositivos domésticos inteligentes, automotivos e vestíveis; que traz as experiências Alexa baseadas na nuvem para produtos que variam de alto-falantes portáteis a aparelhos inteligentes e entretenimento informativo em veículos. Os desenvolvedores podem integrar Alexa em produtos baseados em voz e escrever um aplicativo complementar para transformar um produto em um conectado.

Desde que a Amazon trouxe o dispositivo Alexa original ao mercado em 2014, a Amazon Web Services (AWS), bem como vários fabricantes de chips, revelaram designs de referência que ajudam os engenheiros a integrar a tecnologia de reconhecimento de voz da Amazon e a interface AVS, fornecendo designs pré-construídos e pré-testados.

Portanto, se a sua empresa não tem muitos engenheiros para trabalhar no desenvolvimento de hardware e software, os projetos de referência facilitam o desenvolvimento de uma interface de voz e compreensão de linguagem natural simples e econômica para projetos baseados em Alexa. Caso contrário, a integração de processamento de áudio de alta qualidade torna o desenvolvimento de dispositivos habilitados para voz demorado e complicado.


Figura 1. Projetos de referência para aplicativos de voz baseados em AVS são construídos para integrar perfeitamente a tecnologia de reconhecimento de voz da Amazon em dispositivos controlados por voz. Fonte:STMicroelectronics

Detecção de Wake word

Tudo começa com um robusto mecanismo de wake-word (WWE) que ouve a palavra-chave “Alexa” antes de o sistema realizar qualquer ação. Há uma verificação de wake word baseada em nuvem que valida o contexto e garante que o usuário realmente deseja Alexa. Aqui, a parte de captura de voz do design de referência aprimora a detecção de wake-word “Alexa” ao realizar a captura de áudio em condições do mundo real. Para que os designers possam interromper ambientes barulhentos, mesmo a distâncias moderadas.

Veja o exemplo do Kit de Desenvolvimento de Captura de Voz da Cirrus Logic para aplicativos Amazon AVS; ele fornece ajuste acústico com componentes de hardware e software comprovados. O kit melhora a detecção de wake-word “Alexa” em ambientes silenciosos e barulhentos, mesmo com o usuário a vários metros de distância do dispositivo. Ele faz isso suprimindo ruídos e outras interferências do mundo real para interações de voz mais precisas e confiáveis.


Figura 2. O design de referência AVS de campo distante é voltado para alto-falantes inteligentes e outros dispositivos domésticos inteligentes controlados por voz. Fonte:Cirrus Logic

Conforme mostrado acima, o kit inclui uma placa de captura de voz com o conjunto de dois microfones, Raspberry Pi 3 (RPi3), alto-falante e um cartão microSD pré-carregado com o firmware necessário para produtividade instantânea. Um console de controle simplifica a operação de vários aplicativos RPi3 e fornece uma interface amigável para realizar o ajuste acústico e funções de diagnóstico.

A placa de captura de voz apresenta o codec inteligente CS47L24 da Cirrus Logic, microfones MEMS digitais CS7250B e algoritmos SoundClear para controle de voz, supressão de ruído e cancelamento de eco. Aqui, o codec inteligente integra DACs de alta fidelidade, um amplificador de fone de ouvido estéreo e um amplificador de alto-falante mono para reduzir o espaço da placa e a lista de materiais (BOM).

Em seguida, os microfones MEMS com piso de ruído ultrabaixo e ampla faixa dinâmica de 103 dB garantem captura de voz precisa em condições de ruído desafiadoras. Por fim, os algoritmos SoundClear bloqueiam o ruído que, de outra forma, interferiria na palavra de ativação do Alexa.

Isso permite que o kit execute com eficiência a detecção de wake-word “Alexa” e a captura de áudio em condições do mundo real, mesmo de distâncias moderadas em ambientes barulhentos, permitindo que os usuários interrompam de forma confiável música alta ou reprodução de resposta de Alexa.

Interface de áudio

O hardware básico em um design baseado em AVS compreende vários microfones e um front end de áudio (AFE) que garante a detecção de wake word “Alexa” em ambientes silenciosos e barulhentos. Isso torna o front-end de áudio um bloco de construção crítico de qualquer projeto de referência AVS.

O front-end de áudio capta a voz do usuário, amplifica-a, reduz o ruído de fundo e a envia para a nuvem. É difícil de fazer e, portanto, usar um kit de desenvolvimento é uma ótima maneira de criar um front-end de áudio.

Veja o caso do TalkTo, front-end de áudio da DSP Concepts com processamento de voz integrado qualificado de AVS; foi lançado para o design de referência AWS IoT Core da STMicroelectronics com base nos MCUs STM32 do fabricante de chips. O front-end de áudio TalkTo apresenta redução de ruído, cancelamento de eco e processamento de sinal baseado em beamforming avançado para detecção de áudio em campo distante. É fornecido por meio do Audio Weaver, uma ferramenta gratuita que ajuda os desenvolvedores a ajustar os designs AVS.


Figura 3. Uma solução de chip único compreendendo processamento front-end de áudio, detecção de wake-word local, interfaces de comunicação e conteúdo de memória incluindo RAM e flash reduz os custos de BOM e simplifica o layout. Fonte:STMicroelectronic

A placa de 36 × 65 mm do ST combina um módulo Wi-Fi com um STM32H743 MCU que integra processamento front-end de áudio, detecção de wake word local, interfaces de comunicação e memória em um único chip. O hardware de design de referência também inclui uma placa-filha de áudio como um módulo separado para simplificar ainda mais o desenvolvimento e a prototipagem.

A placa-filha compreende o codec de áudio FDA903D, LEDs e botões do usuário e dois microfones MP23DB01HP MEMS com espaçamento de 36 mm para designs de tamanho limitado. Isso também permite que os desenvolvedores incorporem um modo de privacidade que desliga os microfones, para que um LED vermelho possa informar aos usuários que Alexa não pode ouvir comandos de voz.

Reconhecimento de voz de campo distante

Outros fabricantes de chips também contribuíram com designs de referência que integram a tecnologia de reconhecimento de voz de campo distante da Amazon. A NXP, por exemplo, revelou uma plataforma de referência que afirma reconhecer a solicitação de um usuário do outro lado da sala, mesmo quando há música alta.

A plataforma de referência da NXP para Amazon Alexa compreende um design de conjunto de 7 microfones, algoritmos de processamento de áudio e tecnologia de formação de feixes. Ele integra a tecnologia de reconhecimento de voz de campo distante da Amazon com os processadores de aplicativos i.MX da NXP, ao mesmo tempo que visa simplificar a criação de dispositivos controlados por voz.

Os designs habilitados para voz, como o Alexa, transformam a maneira como os usuários interagem com coisas inteligentes, desde torradeiras a fogões e termostatos a persianas. Aqui, as placas de referência e os kits de captura de voz fornecem a rota mais rápida para o mercado de vários produtos habilitados para Alexa, ao mesmo tempo que garantem o acionamento de wake word e interpretação de comandos altamente precisos, mesmo em ambientes barulhentos.

Estamos no início da revolução dos dispositivos habilitados para voz, e a diversidade desses aplicativos significa que placas e kits de referência pré-projetados e testados provavelmente desempenharão um papel importante. Seu papel será crucial para levar os produtos habilitados para voz mais rapidamente ao mercado e contornar sua complexidade de design.


>> Este artigo foi publicado originalmente em nosso site irmão, EDN.



Tecnologia da Internet das Coisas

  1. Velocímetro
  2. A solução biométrica de voz visa a autenticação
  3. Kits de desenvolvimento de baixo custo para acelerar o desenvolvimento LoRaWAN
  4. O kit Dev ajuda a acelerar o design de ECUs automotivos
  5. Os kits Dev usam sensor de imagem 1 x 1 mm
  6. MajorTom:Alexa Voice Controlled ARDrone 2.0
  7. Visão geral dos HARTING MICA® Starter Kits
  8. Visão geral dos Starter Kits HARTING MICA®
  9. Facebook desenvolve IA capaz de copiar a voz de qualquer pessoa com precisão sem precedentes
  10. Integração 5G em sistemas IIoT aceleram a adoção da indústria 4.0