IA do Google gera código que supera programadores humanos

Em maio de 2017, a equipe do Google Brain anunciou uma nova abordagem chamada AutoML. É uma rede neural controladora para desenvolver arquitetura de modelo infantil, que pode ser treinada para executar uma tarefa específica. Em termos simples, é uma IA capaz de gerar a sua própria IA.

O conjunto de dados usado

Os pesquisadores do Google testaram o AutoML em pequenos conjuntos de dados acadêmicos, como Penn Treebank e CIFAR-10. Mais tarde, eles decidiram apresentar ao AutoML seu desafio mais difícil até o momento. Desta vez, eles testaram conjuntos de dados maiores, como detecção de objetos COCO e classificação de imagens ImageNet, e o resultado obtido foi surpreendente.

Várias arquiteturas de aprendizado de máquina de última geração foram desenvolvidas por humanos para trabalhar em conjuntos de dados maiores em competições acadêmicas. Em Learning Transferable Architectures for Scalable Image Recognition, os pesquisadores do Google aplicaram o AutoML a dois dos conjuntos de dados acadêmicos mais populares – COCO e ImageNet. Se você aplicar o AutoML nativamente a esses enormes conjuntos de dados, seriam necessários vários meses de treinamento para produzir o resultado desejável.

Como funciona?

O AutoML é baseado em algoritmos de aprendizado por reforço e algoritmos evolutivos. No entanto, para aplicá-lo ao ImageNet, os pesquisadores o modificaram para ser mais tratável em conjuntos de dados de grande escala –

Reprojetamos o espaço de pesquisa para encontrar a melhor camada, que pode ser empilhada de forma flexível diversas vezes para construir uma rede final
A pesquisa de arquitetura é realizada no CIFAR-10 e a melhor arquitetura aprendida é transmitida para detecção de objetos COCO e arquitetura de imagem ImageNet.

Após essas alterações, o AutoML foi capaz de encontrar as melhores camadas não apenas para CIFAR-10, mas também para detecção de objetos COCO e classificação ImageNet. Essas duas camadas são mescladas para construir uma nova arquitetura, chamada NASNet .

Conforme mostrado na figura, a arquitetura NASNet (desenvolvida pela AutoML) contém 2 tipos de camadas – camada normal e camada de redução

Fonte:Blog de pesquisa do Google

Resultados

NASNet alcançou 82,7% de precisão de previsão na classificação de imagens ImageNet, o que é muito melhor do que os modelos iniciais anteriores criados pela equipe do Google Brain. Além disso, teve um desempenho 1,2% melhor do que resultados anteriores publicados e não publicados.

NASNet também pode ser redimensionado para gerar um conjunto de modelos que alcançam taxas de precisão decentes, mantendo baixos custos computacionais. Por exemplo, uma versão pequena do NASNet produz uma precisão de 74% (ao mesmo tempo que reduz o custo computacional para metade), o que é mais de 3% melhor do que vários modelos de última geração do mesmo tamanho, concebidos para plataformas móveis.

Como você pode ver nas figuras, as precisões do NASNet são maiores do que os modelos inventados por humanos em vários tamanhos de modelo, envolvendo diferentes números (em milhões) de operações e parâmetros, para classificação de imagens ImageNet.

Esta tabela mostra o desempenho da pesquisa de arquitetura e outros modelos desenvolvidos por humanos na classificação ImageNet. Mult-Adds refere-se ao número de operações compostas de multiplicação e acumulação para uma imagem.

Detecção de objetos usando Faster-RCNN com NASNet

Os pesquisadores do Google transferiram os recursos aprendidos do ImageNet para a detecção de objetos COCO. Nos testes, a integração dos recursos aprendidos do ImageNet com a estrutura Faster RCNN ofuscou o desempenho preditivo anterior no COCO. O maior modelo alcançou 43,1% de mAP, o que é cerca de 4% melhor que os resultados anteriores de modelos de última geração.

Referência: arxiv.org

O código fonte do NASNet para inferência sobre classificação de imagens e detecção de objetos está disponível no Github.

O que vem a seguir?

Os recursos aprendidos pela NASNet no COCO e ImageNet podem ser reutilizados para vários aplicativos de visão. Além disso, esta abordagem pode nos ensinar algo sobre por que tipos específicos de redes neurais funcionam tão bem.

O AutoML poderia abrir o campo do aprendizado de máquina para não especialistas e poderia ser usado para desenvolver máquinas/robôs sofisticados com tecnologia de IA. De acordo com uma pesquisa, a IA neste nível de inteligência pode ajudar pessoas com deficiência visual a recuperar a visão.

Obviamente, esta arquitetura pode ser usada em carros autônomos. Você também pode imaginar o sistema ajudando a identificar trânsito, perigos nas estradas e pedestres. Também poderia ser usado em Realidade Aumentada para fazer com que os aplicativos interajam melhor com o ambiente. Mas talvez as aplicações mais intrigantes desta IA ainda não tenham sido descobertas.

Leia:15 projetos avançados de inteligência artificial

No futuro, a equipe de pesquisa do Google trabalhará na análise e teste de tais tipos de arquiteturas geradas por computador para refiná-las e compreendê-las melhor. Se tiverem sucesso, poderão inspirar um tipo totalmente novo de redes neurais, que teria um impacto maior em todos.

Japão lança protótipo de computador quântico 100× mais rápido que os supercomputadores atuais Baterias de estado sólido de íon de magnésio:mais seguras e eficientes que o lítio

Tecnologia industrial

Processo de manufatura

impressao 3D

Sistema de controle de automação

Tecnologia industrial