Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Industrial Internet of Things >> Integrado

Xilinx dobra Alveo HBM, adiciona clustering para HPC e cargas de trabalho de big data


Na conferência de supercomputação SC21 esta semana, a Xilinx apresentou sua placa aceleradora de data center Alveo U55C e uma nova solução de cluster baseada em padrões e baseada em API para implantar FPGAs em grande escala. A empresa disse que ao habilitar o cluster de centenas de cartões Alveo e permitir a programação de alto nível do aplicativo e do cluster, este novo cartão torna o dimensionamento dos recursos de computação do Alveo para cargas de trabalho de computação de alto desempenho (HPC) mais fácil e mais eficiente do que antes.

Xilinx disse que o cartão Alveo U55C foi desenvolvido especificamente para HPC e cargas de trabalho de big data, oferecendo a maior densidade de computação e capacidade de HBM (memória de alta largura de banda) no portfólio do acelerador Alveo. Junto com a nova solução de cluster baseada em Xilinx RoCE v2, um amplo espectro de clientes com cargas de trabalho de computação em grande escala agora podem implementar clustering HPC baseado em FPGA usando sua infraestrutura e rede de data center existentes. Arquitetonicamente, o acelerador baseado em FPGA afirma fornecer o mais alto desempenho com o menor custo para muitas cargas de trabalho de computação intensiva. Ele está apresentando uma metodologia baseada em padrões que permite a criação de clusters Alveo HPC usando a infraestrutura e a rede existentes de um cliente.

A empresa disse que este é um grande salto para a adoção mais ampla do Alveo e da computação adaptativa em todo o data center.

Em uma entrevista para a embedded.com, Nathan Chang, gerente de produto HPC para data centers da Xilinx, disse:“Estamos começando a ver que a computação nem sempre é o gargalo. Na verdade, na maioria das vezes, tende a ser a largura de banda da memória. Mais e mais problemas de computação estão se tornando limitados pela largura de banda da memória. Portanto, reduzimos nosso cartão a um único slot e também dobramos o HBM desse cartão. Mas, mais importante, fornecemos a capacidade de escalar horizontalmente esses cartões, com a capacidade de criar grandes clusters com centenas de cartões e direcionar todo o HBM nesses cartões. ”

Ele continuou, “Desbloquear a largura de banda entre clusters de cartões Alveo sempre foi um grande esforço para nossa comunidade. Os desenvolvedores tiveram que criar equipes e, em seguida, criar seus próprios designs de cluster para atender às suas necessidades. Agora estamos apresentando um pacote de cluster baseado em padrões abertos - o que significa que iremos alavancar RoCE v2 e ponte de data center, tudo sobre Ethernet com largura de banda de 200 Gbps em cada placa ”.

“Isso significa que na infraestrutura existente em data centers, você poderá colocar esses cartões em servidores existentes, ser capaz de aproveitá-los em redes Ethernet existentes e competir com o InfiniBand em desempenho e latência.”

“Outro ponto importante é que não apenas estamos criando espaço para cargas de trabalho maiores, mas também garantindo que Vitis seja mais acessível para a comunidade de desenvolvimento. Você não precisa mais entender RTL ou Verilog. Você é capaz de programar placas Alveo e direcionar placas Alveo com linguagens de alto nível existentes, como C, C ++ e Python. ”

Recursos do Alveo U55C para HPC e big data

A placa Alveo U55C combina muitos recursos importantes que as cargas de trabalho HPC de hoje exigem. Ele oferece mais paralelismo de pipelines de dados, gerenciamento de memória superior, movimentação de dados otimizada em todo o pipeline e o mais alto desempenho por watt do portfólio Alveo, de acordo com Xilinx. O cartão é um formato FHHL (altura total e meio comprimento) de slot único com uma potência máxima de 150W baixa. Ele oferece densidade de computação superior e dobra o HBM2 para 16 GB em comparação com seu antecessor, o cartão Alveo U280 de dois slots. Conseqüentemente, o novo U55C oferece mais computação em um formato menor para a criação de clusters densos baseados no acelerador Alveo. Isso visa dados de streaming de alta densidade, matemática de alta ES e grandes problemas de computação que exigem escalabilidade horizontal como análises de big data e aplicativos de IA.

Aproveitando a RoCE v2 e a ponte de data center, juntamente com largura de banda de 200 Gbps, a solução de clustering orientada por API permite uma rede Alveo que compete com as redes InfiniBand em desempenho e latência, sem dependência de fornecedor. A integração MPI permite que os desenvolvedores de HPC escalem o pipelining de dados do Alveo a partir da plataforma de software unificada Xilinx Vitis. Utilizando padrões e estruturas abertas existentes, a empresa disse que agora é possível dimensionar centenas de placas Alveo, independentemente das plataformas de servidor e infraestrutura de rede e com cargas de trabalho e memória compartilhadas.

Os desenvolvedores de software e cientistas de dados podem obter os benefícios do Alveo e da computação adaptativa por meio da programação de alto nível do aplicativo e do cluster utilizando a plataforma Vitis. A Xilinx disse que investiu pesadamente na plataforma de desenvolvimento da Vitis e no fluxo de ferramentas para tornar a computação adaptativa mais acessível a desenvolvedores de software e cientistas de dados sem experiência em hardware. As principais estruturas de IA, como Pytorch e Tensorflow, são suportadas, bem como linguagens de programação de alto nível como C, C ++ e Python, permitindo que os desenvolvedores criem soluções de domínio usando APIs e bibliotecas específicas ou utilizem kits de desenvolvimento de software Xilinx para acelerar facilmente o HPC principal cargas de trabalho em um data center existente.

Quem está usando os cartões?

Chang disse que a empresa tem trabalhado com várias organizações em projetos de prova de conceito usando os cartões U55C.

Uma delas é a CSIRO, a organização de pesquisa nacional da Austrália junto com o maior conjunto de antenas de radioastronomia do mundo, que usou o U55C em vez de GPUs, porque a placa Alveo permite uma placa de slot único e não requer um NIC (placa de interface de rede). A CSIRO está utilizando cartões Alveo U55C para processamento de sinal no radiotelescópio de quilômetro quadrado. Implementar as placas Alveo como aceleradores conectados à rede com HBM permite um rendimento massivo em escala em todo o cluster de processamento de sinal HPC. O cluster baseado no acelerador Alveo permite que a CSIRO lide com a enorme tarefa de computação de agregar, filtrar, preparar e processar dados de 131.000 antenas em tempo real. Os 460 Gbps de largura de banda HBM2 em todo o cluster de processamento de sinal são servidos por 420 placas Alveo U55C totalmente conectadas em rede em switches de 100 Gbps habilitados para P4. O cluster Alveo U55C oferece desempenho de processamento com rendimento geral de 15 TB / s em uma potência compacta e pegada econômica. A CSIRO está agora concluindo um projeto de referência de exemplo do Alveo para ajudar outra radioastronomia ou indústrias adjacentes a obter o mesmo sucesso.

Outro exemplo de caso de uso é o software de simulação de acidentes Ansys LS-DYNA, que é usado por quase todas as empresas automotivas do mundo. O projeto de sistemas estruturais e de segurança depende do desempenho dos modelos, pois eles mitigam os custos dos testes de colisão física com simulações do método de elementos finitos (FEM) de projeto auxiliado por computador. Solucionadores FEM são os algoritmos primários que conduzem simulações com centenas de milhões de graus de liberdade. Esses algoritmos enormes podem ser divididos em solucionadores mais rudimentares como PCG, matrizes esparsas, ICCG. Ao expandir em muitas placas Alveo com pipelining de dados hiperparalelo, o LS-DYNA pode acelerar o desempenho em mais de 5 vezes em comparação com CPUs x86. Isso resulta em mais trabalho por ciclo de clock em um pipeline de Alveo com clientes LS-DYNA que se beneficiam dos tempos de simulação de mudança de jogo. “No espírito de inovação implacável, estamos entusiasmados em colaborar com a Xilinx para acelerar significativamente os solucionadores de elementos finitos, que podem representar 90% da carga de trabalho de computação para a mecânica implícita, em nosso aplicativo de simulação LS-DYNA”, disse Wim Slagter , diretor de parcerias estratégicas da Ansys. “Esperamos que a aceleração do Xilinx nos ajude em nossa missão de apoiar os inovadores na engenharia do que está por vir.”

Xilinx citou um terceiro exemplo, o da TigerGraph, fornecedora de uma plataforma de análise gráfica líder. A empresa está usando vários cartões Alveo U55C para agrupar e acelerar os dois algoritmos mais prolíficos que conduzem a recomendação baseada em gráficos e motores de agrupamento. Os bancos de dados gráficos são uma plataforma inovadora para cientistas de dados. Os gráficos obtêm dados de silos e focalizam as relações entre os dados. A próxima fronteira do gráfico é encontrar essas respostas em tempo real. Alveo U55C acelera os tempos de consulta e previsões para mecanismos de recomendação de minutos para milissegundos. Ao utilizar vários cartões U55C para aumentar a análise, o poder computacional superior e a largura de banda da memória aceleram as velocidades de consulta do gráfico em até 45 vezes mais rápido em comparação com clusters baseados em CPU. A qualidade das pontuações também aumenta em até 35 por cento, resultando em maior confiança, reduzindo drasticamente os falsos positivos para poucos dígitos.

O cartão Alveo U55C está atualmente disponível no site da Xilinx e por meio de distribuidores autorizados da Xilinx. Ele também está disponível para avaliação por meio de provedores de FPGA como serviço baseados em nuvem pública, bem como centros de dados de colocation selecionados para visualizações privadas. O clustering já está disponível para pré-visualizações privadas, com disponibilidade geral prevista para o segundo trimestre do próximo ano.

Integrado

  1. Siemens adiciona ao Veloce para verificação assistida por hardware perfeita
  2. TI:A tecnologia de ressonador BAW abre caminho para comunicações de próxima geração
  3. MÓDULO DE DADOS:nova tecnologia de ligação para projetos de alto volume
  4. Cervoz:SSD robusto de nível militar para aplicativos de missão crítica
  5. CEVA:processador AI de segunda geração para cargas de trabalho de rede neural profunda
  6. Kontron:novo padrão de computação incorporado COM HPC
  7. acceed:Módulos de E / S para comunicação de dados escalonáveis ​​
  8. Quatro grandes desafios para a Internet das Coisas industrial
  9. O Big Data fornecerá uma cura para tudo para orçamentos de saúde enfermos?
  10. Big Data x Inteligência Artificial