Manufaturação industrial
Internet das coisas industrial | Materiais industriais | Manutenção e reparo de equipamentos | Programação industrial |
home  MfgRobots >> Manufaturação industrial >  >> Industrial Internet of Things >> Tecnologia da Internet das Coisas

Por que os data warehouses tradicionais ficam aquém da análise em tempo real


As organizações orientadas por dados têm sucesso ou fracassam com base na sua capacidade de tomar decisões com base nas informações mais recentes e atualizadas. Esteja você otimizando cadeias de suprimentos, detectando fraudes em transações financeiras ou personalizando a experiência do cliente em tempo real, a atualização dos dados é fundamental.

No entanto, para muitas organizações, este Santo Graal do “imediatismo dos dados” permanece ilusório. Eles continuam a contar com armazéns de dados tradicionais ou outros armazenamentos de dados legados – ferramentas poderosas construídas para processamento em lote e análise histórica – mas estão mal equipados para lidar com as demandas de análises em tempo real. O resultado? Decisões comerciais críticas estão sendo tomadas com base em dados que não são mais recentes, levando à perda de oportunidades, a resultados abaixo do ideal e à incapacidade de acompanhar o ritmo da concorrência.

Se você estiver em uma situação em que a atualização dos dados é essencial para seu caso de uso e ainda estiver usando um data warehouse como seu principal armazenamento de análise, provavelmente não estará aproveitando todos os benefícios dos insights em tempo real. Na verdade, você provavelmente está incorrendo em latências de dados e custos operacionais significativos que tornam suas iniciativas de dados em tempo real insustentáveis ​​no longo prazo.


O data warehouse nunca foi projetado para funcionar em tempo real


Para entender por que os data warehouses são insuficientes para análises em tempo real, precisamos observar as principais diferenças arquitetônicas entre esses sistemas legados e os bancos de dados modernos de análise em tempo real.

Os data warehouses são otimizados para processamento em lote e análise histórica. Eles se destacam na agregação de grandes volumes de dados de diversas fontes, transformando e limpando os dados e, em seguida, carregando-os em um repositório centralizado para geração de relatórios e inteligência de negócios. Essa abordagem orientada a lote funciona bem para casos de uso em que a pontualidade não é um fator crítico, como relatórios mensais de vendas ou análises financeiras trimestrais.

No entanto, o design inerente de um data warehouse introduz uma latência de dados significativa. Os dados normalmente são carregados no warehouse periodicamente – de hora em hora, diariamente, semanalmente ou mensalmente. Isso significa que, no momento em que os dados estão disponíveis para análise, eles já estão desatualizados, às vezes por horas ou até dias. Num ambiente de negócios acelerado, onde cada segundo conta, este atraso pode ser a diferença entre aproveitar uma oportunidade e perdê-la completamente.

Além disso, os data warehouses não foram projetados para lidar com fluxos de dados de alta velocidade ou suportar consultas de baixa latência. À medida que os volumes de dados e a simultaneidade de usuários aumentam, os data warehouses lutam para fornecer os tempos de resposta de menos de um segundo necessários para a tomada de decisões em tempo real. As estruturas subjacentes de armazenamento e indexação de um data warehouse são otimizadas para carregamento e agregação de dados em massa, e não para a rápida ingestão e consulta de dados granulares em tempo real.

O custo dos dados obsoletos


As consequências de depender de um data warehouse para análises em tempo real podem ser graves. Considere os seguintes cenários -

Em cada um destes exemplos, o custo dos dados obsoletos pode ser medido não apenas pela perda de receitas e pela insatisfação dos clientes, mas também pelo custo de oportunidade das vantagens estratégicas perdidas. As organizações que não conseguem agir com base nas informações mais recentes ficarão sempre atrás dos seus concorrentes mais ágeis.

Além disso, os custos operacionais associados à manutenção de uma infraestrutura de análise em tempo real baseada em data warehouse podem ser proibitivos. A necessidade de processos ETL adicionais, replicação de dados e mecanismos complexos de sincronização de dados cria uma carga administrativa significativa e aumenta o custo total de propriedade (TCO).

Bancos de dados analíticos em tempo real


Para superar as limitações dos data warehouses para casos de uso em tempo real, as organizações estão cada vez mais recorrendo a bancos de dados analíticos especializados em tempo real, como o Apache Pinot. Essas soluções desenvolvidas especificamente são projetadas desde o início para lidar com os requisitos exclusivos de análises de baixa latência e alta simultaneidade em dados de movimentação rápida.

Ao contrário dos data warehouses, os bancos de dados analíticos em tempo real, como o Pinot, são otimizados para ingestão contínua de dados e consultas em tempo real. Eles podem ingerir e indexar fluxos de dados em milissegundos, permitindo tempos de resposta de consulta inferiores a um segundo, mesmo com bilhões de registros. Isto permite que as organizações tomem decisões com base nos dados mais recentes possíveis, revelando o verdadeiro potencial da análise em tempo real.

Além disso, os bancos de dados analíticos em tempo real são projetados para escalar horizontalmente, lidando com volumes crescentes de dados e simultaneidade de usuários sem sacrificar o desempenho. Essa escalabilidade é crucial para aplicativos de missão crítica voltados para o usuário, onde milhares de usuários podem consultar o sistema simultaneamente.

Mas as vantagens dos bancos de dados analíticos em tempo real vão além das capacidades técnicas. Eles também oferecem benefícios operacionais e de custo significativos –


Quando escolher um banco de dados analítico em tempo real em vez de um data warehouse


A decisão de usar um banco de dados analítico em tempo real como o Apache Pinot em vez de um data warehouse tradicional deve ser baseada em uma avaliação cuidadosa dos casos de uso e requisitos específicos da sua organização. Como regra geral, se a atualização dos dados for crítica para os resultados do seu negócio e você estiver lidando com fluxos de dados de alta velocidade, um banco de dados analítico em tempo real é provavelmente a melhor escolha.

Aqui estão alguns cenários comuns onde um banco de dados analítico em tempo real se destaca:

Por outro lado, os data warehouses ainda podem ser a melhor escolha para casos de uso em que a atualização dos dados é menos crítica, como relatórios históricos, business intelligence ou cargas de trabalho de ciência de dados.

Em última análise, a chave é compreender os seus requisitos específicos e escolher a ferramenta certa para o trabalho. Tentar forçar o ajuste de um data warehouse a um caso de uso de análise em tempo real levará inevitavelmente a um desempenho abaixo do ideal, aumento de custos e oportunidades perdidas.

Próximas etapas


À medida que o ritmo dos negócios continua a acelerar, a necessidade de insights de dados em tempo real nunca foi tão premente. As organizações que conseguirem aproveitar o poder do agora – a capacidade de transformar dados em ações à velocidade do pensamento – serão as que prosperarão na era digital.

Para ajudá-lo a se aprofundar neste tópico e obter mais clareza, elaboramos um e-book para você – “Adapte-se ou seja superado:a vantagem competitiva dos dados em tempo real”. Baixe-o hoje e defenda em sua organização a adoção de um banco de dados analítico em tempo real como o Apache Pinot como a ferramenta certa para todas as suas necessidades analíticas em tempo real voltadas para o usuário.

Tecnologia da Internet das Coisas

  1. Introdução à terminologia de código aberto
  2. Transformação digital orientada por dados impulsiona o Airbus a novas alturas
  3. Transformando dados em informações:IoT no transporte
  4. Realidade mista aclamada como uma virada de jogo quando o guru 'louco' da Microsoft surfa uma estrela do rock bem-vinda em Boston
  5. XLE:A próxima geração de Bluetooth de baixa energia para rastreamento de ativos
  6. Conheça melhor sua carga com IoT:uma solução de monitoramento de carga
  7. Honeywell adquire empresa de soluções de monitoramento inteligente
  8. A revolução da máquina precisa de VOCÊ!
  9. Conheça os desafios de ETL de dados de IoT e maximize o ROI
  10. A startup russa imprime casas em 3D em 24 horas, levanta $ 6 milhões para expansão