Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Industrial Internet of Things >> Sensor

Recuperando dados:o modelo de rede neural do NIST encontra pequenos objetos em imagens densas


Nos esforços para capturar automaticamente dados importantes de artigos científicos, os cientistas da computação do Instituto Nacional de Padrões e Tecnologia (NIST) desenvolveram um método para detectar com precisão pequenos objetos geométricos, como triângulos, em gráficos densos e de baixa qualidade contidos em dados de imagem. Empregando uma abordagem de rede neural projetada para detectar padrões, o modelo NIST tem muitas aplicações possíveis na vida moderna.

O modelo de rede neural do NIST capturou 97% dos objetos em um conjunto definido de imagens de teste, localizando os centros dos objetos dentro de alguns pixels de locais selecionados manualmente. Os pesquisadores coletaram os dados de artigos de revistas que datam do início de 1900 em um banco de dados de propriedades metálicas no Thermodynamics Research Center (TRC) do NIST. Muitas vezes os resultados eram apresentados apenas em formato gráfico, às vezes desenhados à mão e degradados por digitalização ou fotocópia. Os pesquisadores queriam extrair os locais dos pontos de dados para recuperar os dados originais e brutos para análise adicional. Até agora, esses dados foram extraídos manualmente.

As imagens apresentam pontos de dados com uma variedade de marcadores diferentes, principalmente círculos, triângulos e quadrados, preenchidos e abertos, de tamanho e clareza variados. Esses marcadores geométricos são frequentemente usados ​​para rotular dados em um gráfico científico. Texto, números e outros símbolos, que podem falsamente parecer pontos de dados, foram removidos manualmente de um subconjunto das figuras com software de edição de gráficos antes de treinar as redes neurais.

Detectar e localizar com precisão os marcadores de dados foi um desafio por vários motivos. Os marcadores são inconsistentes em clareza e forma exata; eles podem estar abertos ou preenchidos e às vezes são difusos ou distorcidos. Alguns círculos parecem extremamente circulares, por exemplo, enquanto outros não têm pixels suficientes para definir completamente sua forma. Além disso, muitas imagens contêm manchas muito densas de círculos, quadrados e triângulos sobrepostos.

Os pesquisadores procuraram criar um modelo de rede que identificasse pontos de plotagem com pelo menos a mesma precisão da detecção manual – dentro de 5 pixels da localização real em uma plotagem do tamanho de vários milhares de pixels por lado.

Os pesquisadores do NIST adotaram uma arquitetura de rede originalmente desenvolvida por pesquisadores alemães para análise de imagens biomédicas, chamada U-Net. Primeiro, as dimensões da imagem são contraídas para reduzir as informações espaciais e, em seguida, camadas de informações de recursos e contexto são adicionadas para criar resultados precisos e de alta resolução.

Para ajudar a treinar a rede para classificar as formas dos marcadores e localizar seus centros, os pesquisadores experimentaram quatro maneiras de marcar os dados de treinamento com máscaras, usando marcações centrais e contornos de tamanhos diferentes para cada objeto geométrico.

Os pesquisadores descobriram que adicionar mais informações às máscaras, como contornos mais grossos, aumentou a precisão da classificação das formas dos objetos, mas reduziu a precisão de identificar suas localizações nos gráficos. No final, os pesquisadores combinaram os melhores aspectos de vários modelos para obter a melhor classificação e os menores erros de localização. Alterar as máscaras acabou sendo a melhor maneira de melhorar o desempenho da rede, mais eficaz do que outras abordagens, como pequenas alterações no final da rede.

O melhor desempenho da rede - uma precisão de 97% na localização de centros de objetos - só foi possível para um subconjunto de imagens em que os pontos de plotagem eram originalmente representados por círculos, triângulos e quadrados muito claros. O desempenho é bom o suficiente para o TRC usar a rede neural para recuperar dados de gráficos em jornais mais recentes.

Sensor

  1. CEVA:processador AI de segunda geração para cargas de trabalho de rede neural profunda
  2. Aceito:switch gigabit de 12 portas com 4 portas SFP
  3. A monetização de dados da rede móvel aumenta a eficiência
  4. Como o ecossistema de rede está mudando o futuro da fazenda
  5. Plataformas de rede digital:o modelo de maturidade em cinco estágios
  6. Uma rede Wi-Fi otimizada é crucial para o sucesso do Edge
  7. 5 dicas básicas de segurança de rede para pequenas empresas
  8. Câmera captura imagens do interior de objetos sólidos
  9. Imagens de sinais de rádio objetos ocultos e em alta velocidade
  10. Uso de redes neurais para imagens de raios-X mais rápidas