10 coisas que você deve ou não fazer com Big Data

Por que confiar em nós
Conclusão

Big data é um domínio novo e emergente para a maioria das empresas. Fazer com que funcione exige um ajuste cuidadoso e o uso das melhores práticas.

O Big Data é usado e aplicado em vários domínios de negócios à medida que a análise de dados, a inteligência artificial e o aprendizado de máquina continuam a se tornar parte do mainstream.

A análise de Big Data pode extrair o valor real dessa riqueza de dados, que podem ser estruturados, não estruturados ou semiestruturados.

O surgimento da mídia social deu origem a muitas novas oportunidades de coletar dados sobre o comportamento do cliente. Aqui estão alguns exemplos:

  • Os dados de fluxo de cliques são provenientes de interações no site, como cliques do mouse e rolagem da página da Web.
  • Sites de negócios sociais são comunidades on-line de clientes que estão dispostos a compartilhar informações sobre seu comportamento de compra.
  • Os sensores fornecem dados sobre os ambientes físicos dos clientes, como temperatura, umidade e padrões de tráfego.

Os insights obtidos com a análise de dados podem ajudar as organizações em seu processo de tomada de decisões.

Contudo, o benefício real do big data só é alcançado se ele for gerenciado de maneira adequada. 7

As organizações podem evitar se perder no espaço do Big Data, garantindo que identifiquem o ponto de partida com casos de uso simples e o implementem para verificar o resultado rapidamente.

O primeiro passo antes de iniciar qualquer iniciativa de Big Data é o planejamento adequado.

A organização deve conhecer claramente o objetivo do projeto.

Ela também deve identificar o valor que deseja extrair e como isso afetará as decisões de negócios. Deve-se escolher a área mais promissora para começar.

Neste artigo, exploraremos algumas das vantagens e desvantagens das iniciativas de Big Data.

1. Conhecer o objetivo e o ponto de partida

A finalidade da coleta de dados e a identificação do ponto de partida são fundamentais para o sucesso de qualquer projeto de Big Data.

Para começar, o objetivo deve ser identificar os casos de uso mais promissores para a empresa. Isso ajudará a organização a identificar os componentes para esses casos de uso.

Depois disso, deve ser feito um planejamento adequado para aplicar as técnicas de Big Data a esses casos de uso e extrair insights valiosos para o crescimento dos negócios.

A prioridade de execução deve depender de fatores como:

  • Custo de implementação.
  • Impacto previsto nos negócios.
  • Duração do tempo necessário para o lançamento.
  • Velocidade de implementação.

As organizações devem sempre começar com um aplicativo simples e fácil de implementar como um projeto piloto.

(Leia também: Por que você deve trocar sua ferramenta de gerenciamento de projetos por um sistema operacional de trabalho).

2. Avaliar adequadamente as licenças de dados

Os dados são o combustível para qualquer projeto de Big Data e análise.

Portanto, é muito importante proteger seus dados contra o uso indevido.

Os termos e condições de licenciamento adequados devem estar em vigor antes de conceder acesso aos dados a qualquer fornecedor ou usuário terceirizado.

A licença de dados deve mencionar claramente os seguintes pontos básicos.

Haverá muitos outros parâmetros críticos também no contrato de licença.

  • Quem usará os dados?
  • Quais dados estarão acessíveis?
  • Como os dados serão usados?

Se houver alguma falha no licenciamento, a perda de dados e o uso indevido resultantes terão um impacto negativo inegável nos negócios.

3. Permitir a democratização dos dados

A democratização dos dados pode ser definida como um processo contínuo, no qual todos em uma organização podem acessar os dados.

As pessoas em uma organização devem se sentir à vontade para trabalhar com os dados e expressar suas opiniões com confiança.

A democratização dos dados ajuda as organizações a se tornarem mais ágeis e a tomarem decisões de negócios baseadas em dados.

Isso pode ser alcançado com o estabelecimento de um processo adequado.

Primeiro, os dados devem estar acessíveis a todas as camadas, independentemente da estrutura organizacional.

Em segundo lugar, uma única fonte de verdade (conhecida como “a Fonte Dourada”) deve ser estabelecida após a validação dos dados.

Terceiro, todos devem ter permissão para verificar os dados e dar suas opiniões.

Quarto, as novas ideias podem ser testadas assumindo riscos calculados. Se a nova ideia for bem-sucedida, a organização poderá seguir em frente; caso contrário, poderá ser considerada uma lição aprendida.

4. Criar uma cultura de colaboração

No jogo do Big Data, a colaboração mútua entre diferentes departamentos e grupos em uma organização é muito importante.

Uma iniciativa de Big Data só pode ser bem-sucedida quando uma cultura organizacional adequada é construída em todas as camadas, independentemente de suas funções e responsabilidades.

A gerência de uma organização deve ter uma visão clara do futuro e deve incentivar novas ideias.

Todos os funcionários e seus departamentos devem ter permissão para encontrar oportunidades e criar provas de conceitos para validá-las.

Não deve haver nenhuma política para culpar e parar o jogo. É sempre um processo de aprendizado, que deve ser aceito igualmente tanto para o sucesso quanto para o fracasso.

5. Avaliar a infraestrutura de Big Data

A parte da infraestrutura de qualquer projeto de Big Data é igualmente importante.

O volume de dados é medido em petabytes, que são processados para extrair insights.

Por isso, tanto a infraestrutura de armazenamento quanto a de processamento precisam ser avaliadas adequadamente.

Os data centers são usados para fins de armazenamento e, portanto, devem ser avaliados em termos de componentes de custo, gerenciamento, backup, confiabilidade, segurança, escalabilidade e muitos outros fatores.

(Leia também: 6 principais riscos da nuvem pública).

Da mesma forma, o processamento de big data e a infraestrutura tecnológica relacionada devem ser verificados cuidadosamente antes de finalizar o negócio.

Os serviços em nuvem geralmente são muito flexíveis em termos de uso e custo.

Entre os fornecedores de nuvem estabelecidos estão empresas de peso como AWS, Azure e GCP, mas também há muitas outras no mercado.

6. Não se perca no mar de dados

Uma boa governança de dados é muito importante para o sucesso dos projetos de Big Data.

Uma estratégia adequada de coleta de dados deve ser planejada antes da implementação.

Em geral, há uma tendência comum de coletar todos os dados legados de uma empresa.

Porém, todos esses dados podem não ser adequados para os cenários comerciais atuais.

Portanto, é importante identificar primeiro os casos de uso dos negócios e determinar onde os dados serão aplicados.

Quando a estratégia de dados estiver bem definida e diretamente conectada ao aplicativo de negócios de destino, a próxima etapa da implementação poderá ser planejada.

Depois disso, novos dados podem ser aumentados para melhorar o modelo e sua eficiência.

7. Não se esqueça do código-fonte aberto

A utilidade da tecnologia que você está considerando deve ser avaliada com base no tamanho do projeto e no orçamento da organização.

Muitas plataformas de código aberto estão disponíveis gratuitamente para a execução de projetos-piloto.

Organizações de pequeno e médio porte podem explorar essas soluções de código aberto para iniciar sua jornada de Big Data.

Portanto, o foco da organização deve ser o resultado e o ROI.

O Hadoop é uma estrutura de software de código aberto que usa o HDFS (Sistema de Arquivos Distribuídos do Hadoop) e o MapReduce para analisar big data em clusters de hardware de commodity, ou seja, em um ambiente de computação distribuída.

(Leia: Como posso usar o Hadoop para analisar Big Data?)

O movimento de Big Data amadureceu até o ponto em que o Hadoop se tornou o padrão de fato para o processamento de Big Data.

O MapReduce é um modelo de programação para distribuir dados e processá-los em paralelo em um cluster de computadores usando modelos de programação simples.

Ele foi desenvolvido pelo Google para processar com eficiência grandes quantidades de dados em grandes clusters de computadores.

8. Não comece sem um planejamento adequado

É uma tendência muito perigosa iniciar todos os seus projetos de Big Data de uma só vez.

Essa abordagem provavelmente levará apenas a um sucesso parcial ou ao fracasso total.

As organizações devem se planejar adequadamente antes de iniciar suas iniciativas de Big Data, em vez de apostar tudo ou dar um salto de fé.

É sempre recomendável começar com um aplicativo simples, pequeno e mensurável.

Quando o piloto for bem-sucedido, ele poderá ser implementado em aplicativos de grande escala.

É fundamental dedicar tempo para desenvolver um plano e selecionar cuidadosamente o projeto piloto.

9. Não negligencie a segurança

A segurança dos dados é outro aspecto importante dos projetos de Big Data.

Em qualquer cenário de Big Data, petabytes de dados são extraídos de diferentes sistemas de origem e, em seguida, são processados. Os dados processados são a entrada para o modelo analítico.

O resultado da análise é o insight valioso para os negócios.

Uma vez que os dados brutos tenham sido refinados e informações significativas tenham sido extraídas desses dados brutos, a confidencialidade, a integridade e a disponibilidade (CIA) dessas informações tornam-se essenciais.

Quando os dados contêm informações comerciais críticas, eles se tornam valiosos para a organização.

Portanto, esses dados devem ser protegidos contra ameaças externas.

A segurança dos dados deve ser planejada como parte do ciclo de vida da implementação do Big Data.

(Leia também: Segurança na nuvem: 5 riscos cibernéticos comuns).

10. Não se concentre em unidades de negócios isoladas

No complexo cenário de negócios atual, concentrar-se em uma única unidade de negócios não vai ajudar.

As organizações devem ter uma visão de alto nível do negócio como um todo e pensar em termos de perspectiva global.

A melhor abordagem deve ser dar pequenos passos de cada vez e manter uma visão global.

O foco deve ser holístico em termos de unidades de negócios. Isso terá um impacto positivo e um melhor ROI.

Conclusão

Não existe um caminho específico para o sucesso da implementação do Big Data.

No entanto, é uma combinação de planejamento, estratégia, abordagem e vários outros fatores que levam ao sucesso.

Cada organização tem uma meta específica a ser alcançada, portanto, a estratégia deve ser planejada de acordo, o projeto piloto deve ser escolhido com cuidado e as informações resultantes devem ser protegidas e tratadas adequadamente.

Kaushik Pal
Technology Specialist
Kaushik Pal
Especialista em Tecnologia

Kaushik é arquiteto técnico e consultor de software com mais de 23 anos de experiência em análise, desenvolvimento, arquitetura, design, teste e treinamento de software. Ele tem interesse em novas tecnologias e áreas de inovação. Ele se concentra em arquitetura web, tecnologias web, Java/J2EE, software de código aberto, WebRTC, big data e tecnologias semânticas. Ele demonstrou experiência em análise de requisitos, projeto e implementação de arquitetura, casos de uso técnico e desenvolvimento de software. Sua experiência abrangeu vários setores, como seguros, bancos, companhias aéreas, transporte marítimo, gerenciamento de documentos e desenvolvimento de produtos, etc. Ele trabalhou em uma ampla gama…