Definição de estratégias, aumento da produtividade, redução de custos, melhorias de operação: estas são apenas algumas das funções que o Big Data nos permite realizar de forma mais prática e rápida. E todas essas facilidades são feitas por meio da quantidade exponencial de dados que é produzida todos os dias, em todo o mundo.
O volume de informações geradas cotidianamente é acumulado ao longo dos anos – o que vem sendo potencializado, principalmente, com o avanço da internet e das novas tecnologias. A partir do Big Data, este volume é entendido como uma fonte certeira de insights e, não apenas como um mero apanhado de informações.
Ok, mas o que é o Big Data? O termo vem do inglês, mas a compreensão é simples: é o conjunto de informações presentes em bancos de dados de empresas, corporações e servidores. São dados que podem ser acessados e que apresentam interligações entre si.
O conceito também pode ser entendido como todo e qualquer dado que pode ser coletado sobre um assunto ou uma empresa. Se estrutura, basicamente, como uma coleção de informações que representam uma fonte constante de descoberta e análise.
Por isso, o Big Data está cada vez mais presente em nossas vidas. Um exemplo bem simples é o Youtube. A plataforma disponibiliza um universo de vídeos presentes em um banco de dados disponível para acesso dos usuários. Ainda mais constante que o próprio Big Data, está a análise de dados (ou analytics, em inglês) – todos os dias, a análise de dados é utilizada com muita intensidade e em diferentes segmentos do mercado.
No episódio 22 do Corpup Talks, nosso podcast dedicado a tratar assuntos do universo da inovação, a conversa é, justamente, sobre o Big Data! Buscamos explorar algumas vertentes, aplicações e o papel deste conceito em estratégias de inovação corporativa.
Para nos ajudar a desbravar o assunto, conversamos com Geanderson Lenz, CEO na Iris Data Driven e especialista em projetos de inovação tecnológica.
Neste artigo trazemos os principais pontos expostos e você pode ouvir o episódio completo a seguir:
Big Data
Até aqui você já deve ter entendido o que é o Big Data. No episódio, Geanderson Lenz explica que o termo está presente na grande temática da Inteligência Artificial, junto de outros conceitos importantes, como Aprendizagem de Máquinas, Data Science e Análise de Dados.
A Inteligência Artificial, inclusive, é um ramo da ciência que a partir de 1956, ganhou aplicação empresarial e vem se atualizando até os dias de hoje. À época, a proposta do campo era entender como as máquinas iriam simular a inteligência humana e, para isso, foram utilizados os conhecimentos da Ciência da Computação (processamento das máquinas) e o matemático.
“Essas duas questões, conjugadas com a expansão do nível de dados acessíveis, que nos últimos dois, três anos, foram produzidos 90% de todos os dados da história da humanidade, temos o contexto perfeito para um ambiente de Big Data. Quando falamos sobre isso, estamos nos referindo ao conhecimento científico, ao poder de processamento computacional e também a questão da disponibilidade dos dados para serem usados em diferentes áreas”, explica Lenz.
Os Vs do Big Data
Os principais aspectos do Big Data são os Vs que envolvem o conceito. Isso porque os dados chegam com grande variedade, volume e velocidade, e esses aspectos dizem respeito à grande quantidade de dados não estruturados que precisam ser analisados pelas estratégias de Big Data.
Estudos mais recentes apresentam algumas complementações nesses Vs, como veracidade e valor dos dados. Lenz explica que quando falamos dos Vs que, inicialmente, eram apenas três, e bibliografias atuais já dizem existir cinco e até sete Vs, também estamos diferenciando o Big Data das demais áreas de dados.
“A questão de volume diz respeito à volumetria. Ou seja, como estes dados crescem de forma horizontal e de forma vertical. Muitas vezes pensamos apenas no dado final: na quantidade de GB ou de MB. Entretanto, hoje já estamos indo para a casa de análise de petabytes (PB) e de zettabytes (ZB). A constatação é: o nosso volume de dados vem crescendo de forma exponencial”, afirma.
O outro V explicado por Lenz é a variedade. Atualmente, existem múltiplas fontes de criação e produção de dados. Temos CRM ‘s, sistemas de produção e logística, sistemas de marketing (que não param de crescer!), e os sistemas baseados nas redes sociais: e-commerce e marketplace, por exemplo. Ou seja, estamos criando um cenário de Big Data que vem acontecendo em praticamente todas as áreas. O volume de dados vem crescendo na horizontal e vertical, com uma grande variedade de fontes e em uma velocidade exorbitante.
Dados estruturados e não-estruturados
O Big Data auxilia as empresas a encontrarem oportunidades, não apenas nos ambientes em que os dados estão nítidos mas, principalmente, nas relações e cruzamentos de dados complexos. E quando falamos de dados, existem diversos formatos que podem dificultar ou direcionar as análises das empresas. Por isso, Geanderson explica a diferença entre os estruturados e não-estruturados:
“Os estruturados são os dados que temos afinidade de trabalhar como tabelas ou planilhas de Excel. É o tipo de dados que encontramos uma rotulagem, no qual conseguimos entender o que o dado diz: nome, idade, renda, local de trabalho, cidade, etc. É também possível estruturá-lo em linhas e em bancos de dados melhor organizados, como uma SQL, por exemplo”.
Por outro lado, o que nem todo mundo percebe é que a grande parte dos dados que encontramos no cotidiano são os não-estruturados, aqueles que não têm rotulagem. Um exemplo é o áudio, que pode virar qualquer outro dado. Geralmente o áudio se transforma em um texto construído em um mesmo idioma. Esse dado apresenta diferentes formas de estruturação e, por isso, não tem um arranjo formal e se configura como não-estruturado. Outro exemplo são os vídeos, que apresentam som e imagem, e que podemos ter uma outra complexidade para trabalhar com esses outros tipos de formatos.
“Hoje, se formos pensar temporalmente, principalmente nas organizações e empresas, recém estamos começando a pegar a ponta do iceberg, que é trabalhar com os dados estruturados. Mas existe uma grande complexidade, que é a parte que não vemos no iceberg, do trabalhar com áudio, vídeo, texto… Muita coisa está armazenada nesses dados e ainda não começamos a trabalhar. E este é um cenário super ideal e relevante para trabalhar com Big Data”, comenta Lenz.
Big Data Analytics: como trabalhar com dados?
E depois de entender melhor sobre o que é o Big Data e as diferentes formas que o termo se apresenta, como ocorrem as principais transformações por meio dos dados? Em qualquer trabalho com dados, precisamos pensar no valor da análise, que é justamente o outro V que envolve o Big Data.
Lenz explica que o valor pode ser um aumento de receita, uma redução de custo ou uma melhoria de algum processo. Não importa qual a proposta, é possível criar uma trilha de analytics para conseguir gerar esse valor e para que haja uma consistência, para que valha a pena o esforço do Big Data.
“E a trilha de analytics funciona a partir de processos. A primeira parte é descritiva, no qual buscamos entender como os dados são formados e a distribuição ao longo do tempo em busca de padrões. Depois, partimos para o momento de predições, que é o uso dos algoritmos para nos ajudar a melhorar insights. Aí sim é possível tomar decisões baseadas nos dados. Por fim, é hora do terceiro momento, em que consigo fazer prescrições, para o campo de tomada de decisão melhor que o humano.”
Ou seja, o analytics do Big Data permite que dados do passado sejam analisados no presente e, ao processá-los, conseguimos obter insights melhores para decisões futuras!
Para descobrir as principais aplicações práticas do Big Data e entender como diferentes mercados alçam mão deste conceito para melhorias de processos e serviços, escute o episódio 22 do CorpupTalks!