Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Industrial Internet of Things >> Integrado

Chip AI fica online através do serviço em nuvem


O silício do processador de streaming tensor (TSP) da Groq agora está disponível para acelerar as cargas de trabalho de IA dos clientes na nuvem. O provedor de serviços de nuvem Nimbix agora oferece aceleração de aprendizado de máquina em hardware Groq como um serviço sob demanda apenas para “clientes selecionados”.

Embora existam várias startups construindo silício de IA para o data center, a Groq agora se junta à Graphcore como a única com aceleradores disponíveis comercialmente para os clientes usarem como parte de um serviço em nuvem. A Graphcore anunciou anteriormente que seus aceleradores estão disponíveis como parte do Microsoft Azure.

“A arquitetura de processamento simplificada do Groq é única, fornecendo desempenho determinístico sem precedentes para cargas de trabalho de computação intensiva e é uma adição empolgante à nossa IA baseada em nuvem e plataforma de Deep Learning”, disse Steve Hebert, CEO da Nimbix.


Groq é apenas a segunda inicialização do acelerador de IA a disponibilizar seu hardware na nuvem (Imagem:Groq)

O chip TSP da Groq, lançado no outono passado, é capaz de enormes 1.000 TOPS (operações de 1 peta por segundo). Resultados recentes publicados pela empresa mostram que o chip pode atingir 21.700 inferências por segundo para inferência ResNet-50 v2, o que de acordo com Groq mais do que dobra o desempenho dos sistemas atuais baseados em GPU. Esses resultados sugerem que a arquitetura do Groq é um dos mais rápidos, senão o mais rápido, processador de rede neural disponível comercialmente.

“Esses resultados do ResNet-50 são uma validação de que a arquitetura exclusiva da Groq e a abordagem de aceleração de aprendizado de máquina oferecem um desempenho de inferência substancialmente mais rápido do que nossos concorrentes”, disse Jonathan Ross, cofundador e CEO da Groq. “Esses pontos de prova do mundo real, com base em benchmarks padrão da indústria e não em simulações ou emulação de hardware, confirmam os ganhos de desempenho mensuráveis ​​para aplicativos de aprendizagem de máquina e inteligência artificial possibilitados pelas tecnologias da Groq.”

Groq diz que sua arquitetura pode atingir o paralelismo massivo necessário para aceleração de aprendizagem profunda sem a sobrecarga de sincronização das arquiteturas tradicionais de CPU e GPU. Os recursos de controle foram removidos do silício e fornecidos ao compilador, como parte da abordagem baseada em software da Groq. Isso leva a uma operação determinística e completamente previsível orquestrada pelo compilador, permitindo que o desempenho seja totalmente compreendido no momento da compilação.

Outro recurso importante a ser observado é que a vantagem de desempenho do Groq não depende de lote - uma técnica comum no data center onde várias amostras de dados são processadas ao mesmo tempo, para melhorar o rendimento. De acordo com o Groq, sua arquitetura pode atingir o desempenho máximo mesmo em lote =1, um requisito comum para aplicativos de inferência que podem estar trabalhando em um fluxo de dados que chega em tempo real. Embora o chip TSP da Groq ofereça uma vantagem de latência moderada de 2,5x sobre as GPUs em lotes grandes, em lotes =1 a vantagem está próxima de 17x, disse a empresa.





Integrado

  1. O que entra em um SLA de serviços em nuvem?
  2. Como melhorar o gerenciamento da nuvem por meio de uma política de marcação de recursos da nuvem?
  3. Como se destacar em migrações seguras para a nuvem por meio da responsabilidade compartilhada
  4. IaaS vs SaaS vs PaaS:um guia para tipos de serviço de nuvem do Azure
  5. Projetando com Bluetooth Mesh:Chip ou módulo?
  6. Semáforos:introdução e serviços básicos
  7. Cadence anuncia o programa Cloud Passport Partner
  8. Módulo Tiny Bluetooth 5.0 integra antena de chip
  9. Os pesquisadores criam uma pequena etiqueta de identificação de autenticação
  10. GE apresenta serviço em nuvem para dados industriais, Analytics