Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Industrial Internet of Things >> Tecnologia da Internet das Coisas

IA bem-sucedida depende do gerenciamento de dados

Dave Smith
A inteligência artificial (IA) está em toda parte hoje em dia, seja na realidade ou apenas como um rótulo badalado para algumas decisões simples baseadas em regras, e isso levou a alguns problemas interessantes, diz David Smith, chefe de Tecnologia GDPR, SAS Reino Unido e Irlanda .

A primeira delas é a desconfiança, conforme observado pelo próximo presidente da British Science Association, Professor Jim Al-Khalili:“Há um perigo real de uma reação pública contra a IA, potencialmente semelhante à que tivemos com a GM [modificação genética] nos primeiros dias do milênio”. Al-Khalili destaca que para a IA atingir seu potencial máximo, é necessário mais transparência e envolvimento público.

A segunda questão potencial é a do controle; se os modelos realmente forem executados sem monitoramento e controle, haverá uma chance de decisões erradas. Um exemplo disso poderia ser o “Flash Crash” em 2010, quando o mercado de ações dos EUA caiu cerca de 9% por 36 minutos. Embora os reguladores culpassem um único corretor de falsificar o mercado, os sistemas de negociação algorítmicos foram, pelo menos em parte, os culpados pela profundidade do crash.

Aproveitando a IA para o bem

Dito isso, a IA tem um enorme potencial para o bem, seja fornecendo melhores diagnósticos de câncer por meio de uma triagem mais eficiente de imagens de tumor ou protegendo espécies em extinção por meio da interpretação de imagens de pegadas de animais na natureza. O desafio é garantir que esses benefícios sejam realizados, e é aqui que entra a estrutura FATE (Equidade, Responsabilidade, Transparência e Explicação), que é projetada para garantir que a IA seja usada de maneira adequada. Vou me concentrar nos aspectos de transparência, onde o gerenciamento de dados tem o maior impacto.

A IA só pode ser tão boa quanto os dados que a alimentam, e para construir e usar um aplicativo de IA requer uma série de fases específicas de dados:

Cada um deles agregará valor, mas também alterará potencialmente os resultados do processo de IA. Por exemplo, se o processo de qualidade de dados remove outliers, pode ter impactos muito diferentes. Se a remoção do outlier for apropriada, o resultado será um modelo que reflete muito bem a maioria dos dados. Por outro lado, pode ignorar uma circunstância rara, mas crítica, e perder a oportunidade de trazer um benefício real.

Isso foi mostrado na descoberta de Dame Jocelyn Bell Burnell dos Pulsares, um tipo de estrela de nêutrons em rotação. Ela estava examinando quilômetros de dados impressos de um radiotelescópio e notou um pequeno sinal em um em cada 100.000 pontos de dados. Apesar de seu supervisor dizer que era interferência humana, ela persistiu e provou sua existência procurando sinais semelhantes em outros lugares. Se os outliers tivessem sido removidos, ela não teria feito a descoberta.

A jornada de dados

A qualidade dos dados também deve ser aplicada para evitar decisões embaraçosas. Se Bank of America tivessem verificado a validade dos dados do nome, eles podem não ter enviado uma oferta de cartão de crédito para "Lisa Is A Slut McXxxxxx" ( o nome dela foi editado. Ed.) em 2014. Eles haviam adquirido os dados da Golden Key International Honor Society , que reconhece o desempenho acadêmico. Uma pessoa desconhecida havia editado seu nome no registro de membros.

O processo então continua com transformações para preparar os dados para modelagem; os sistemas de origem são normalmente altamente normalizados e têm informações armazenadas em várias tabelas, enquanto os cientistas de dados gostam de analisar uma única tabela quadrada. Freqüentemente, eles precisarão adicionar variáveis ​​derivadas para ajudar em suas análises. Geralmente, eles são definidos inicialmente em um ambiente de preparação de dados ad-hoc pelo cientista de dados, mas precisam ser movidos para um ambiente mais controlado para fins de produção.

O impacto desse estágio de transformação de dados pode ser enorme. Em primeiro lugar, é importante entender quais fontes de dados estão sendo usadas na análise. Isso pode ser em relação a questões regulatórias, como o uso de dados pessoais ou simplesmente para garantir que a fonte de dados correta esteja sendo acessada. Em segundo lugar, é importante entender se a transformação foi apropriada e implementada corretamente; erros na implementação podem ser tão prejudiciais quanto dados de baixa qualidade.

O último processo de dados que impacta diretamente na IA é a implantação, garantindo que os dados corretos sejam inseridos no modelo e usando os resultados para tomar decisões que impactam diretamente no desempenho das organizações. Os modelos têm uma vida útil definida, durante a qual prevêem com precisão o mundo real, portanto, se demorar muito para implantar os modelos na produção, eles não fornecerão seu valor total.

Um processo de implantação organizado também é um componente necessário para atender aos requisitos do Artigo 22 do RGPD. Este artigo impede o uso de perfis analíticos em dados pessoais, a menos que condições estritas sejam cumpridas (por exemplo, consentimento total). A implantação controlada permite uma visão geral de quais dados foram usados ​​no processo de IA e quais modelos analíticos foram aplicados aos dados a qualquer momento. Isso é fundamental para determinar se o regulamento foi comprometido.

No geral, o gerenciamento de dados é fundamental para que a IA seja capaz de atingir seu verdadeiro potencial. Ser capaz de entender como o processamento de dados é realizado é uma parte crucial para manter a transparência, um dos principais pilares de uma IA justa, confiável e eficaz.

O autor deste blog é David Smith, chefe de Tecnologia GDPR, SAS UK &Ireland.

Tecnologia da Internet das Coisas

  1. Gerenciamento de dados IoT em testes de inverno
  2. Como a Internet Industrial está mudando o gerenciamento de ativos
  3. Começar a trabalhar com IoT
  4. Seis fundamentos para aplicativos bem-sucedidos informados por sensores
  5. Principais desafios no gerenciamento de privacidade de dados para empresas de 2021-23
  6. Como Criar uma Estratégia de Business Intelligence de Sucesso
  7. Ferramenta Ascend Previews para simplificar o gerenciamento de pipeline de dados
  8. Pesquisa descobre taxas de crescimento de dados que superam as habilidades de gerenciamento
  9. Habilitando a IA pervasiva em todas as áreas operacionais de telecomunicações
  10. Líderes de negócios devem tornar os Data Fabrics uma prioridade em 2022