Entenda melhor sobre o NOSql e Big Data

21/08/2015 17:51

Na maioria das empresas, NoSQL e Big Data ainda são mal-entendidos, na melhor das hipóteses, ou na pior das hipóteses, é um "hype"!

Essa é uma entrevista com o criador do SQL, Michael "Monty" Widenius.
Conduzido por Dmitry Sotnikov, COO da Jelastic.
Vencedor da Oracle Duque Choice Award para Java e PHP Platform-as-a-Service.
Na semana passada, tivemos a oportunidade de conversar com Michael "Monty" Widenius, autor da versão original do banco de dados de código aberto MySQL, e atualmente trabalha no ramo de comunidade desenvolvida do banco de dados MySQL, MariaDB.

Como vocês sabem, Big Data é tão grande que é difícil processar usando bancos de dados e técnicas tradicionais de software. Claro, o modelo relacional e SQL dominam o cenário atual de banco de dados.
Mas do outro lado há os bancos de dados construídos sem relações, feito para maior escalabilidade.
Então, conversamos com o especialista na área de banco de dados, Monty, sobre o estado atual e futuro do SQL, NoSQL e Big Data.
E suas respostas foram um tanto surpreendentes:

Poderia dizer-nos um pouco sobre a história de NoSQL e Big Data? Quais são as principais razões que isto se tornou um assunto de interesse?

A coisa toda com o "novo movimento NoSQL" começou com um post no blog de um funcionário do Twitter que disse que o MySQL não era bom o suficiente e eles precisavam de "algo melhor", como Cassandra.
A principal razão foi que o Twitter teve problemas com o MySQL na época. O estranho é que a solução que sugeriu para resolver seus problemas poderia ser feito facilmente no MySQL como o Cassandra.

Não consigo encontrar o artigo original, mas eu achei um acompanhamento um pouco mais tarde, onde foi dito que o MySQL seria retirado do Cassandra.

O estado atual é que agora, 3 anos depois, o Twitter ainda está usando o MySQL como seu armazenamento principal para tweets. Cassandra , no fim, não foi capaz de substituir o MySQL.

A principal razão do NoSQL se torar popular é que, em contraste com SQL, você pode começar a usá-lo sem ter que projetar qualquer coisa.
Isto torna mais fácil começar com NoSQL, mas você vai pagar por isso mais tarde, quando achar que você não tem controle de seus dados (se você não tiver muito cuidado).

Assim, os principais benefícios (pelo menos antes do MariaDB) da maioria das soluções NoSQL são:

• Acesso rápido a dados (desde que você possa manter tudo na memória);
• Rápida replicação de dados / distribuídos por vários nós;
• Esquema flexível (você pode adicionar novas colunas instantaneamente);

Que problemas podem ser resolvidos (ou as pessoas acham que podem resolver) com a ajuda de Big Data?

Mais desempenho e mais esquemas flexíveis são os dois maiores condutores de NoSQL.

NoSQL - Websolute

O que você, pessoalmente, acha sobre o futuro do Big Data? Quais são suas previsões?

Eu acho que a maioria das pessoas que estão à procura de NoSQL estão fazendo isso principalmente porque ainda é 'hype' .
A maioria das empresas não têm grandes quantidades de dados, como o Facebook e o Google, e eles não serão capazes de pagar para ter especialistas para ajustar e desenvolver constantemente o banco de dados.

SQL não está indo embora. NoSQL não pode substituí-lo.
Quase todo mundo vai precisar de relações (ou seja, se juntar) para utilizar seus dados.

Ainda assim, há lugares onde NoSQL faz sentido.
Eu acho que, no futuro, você vai ver SQL mais combinado com o uso NoSQL.
É por isso que estamos ampliando o MariaDB para ser capaz de acessar bancos de dados NoSQL, como o Cassandra e LevelDB.

Por que as pessoas ainda usam NoSQL? Quais são as principais razões?

Porque é mais fácil começar com um banco de dados NoSQL.
Você não tem que aprender SQL e definir o esquema de banco de dados antes de começar a usá-lo.
Alguns estão usando-o porque acreditam que pode escalar melhor do que o SQL.


SQL pode superar NoSQL? Quais são algumas vantagens únicas que tornam o SQL melhor do que NoSQL?

Assim que os dados não podem caber na memória, o SQL geralmente supera NoSQL.
O mesmo vale para as coisas que NoSQL não pode fazer. A maioria das soluções NoSQL são otimizadas para acesso. Para qualquer outra coisa, você tem que escrever um programa e é muito difícil de bater um otimizador SQL para coisas complexas, especialmente coisas que são geradas automaticamente com base nas solicitações de usuários (necessária para a maioria dos sites).
SQL também pode bater NoSQL na maioria das máquinas individuais. Em um cluster, onde tudo está na memória, o NoSQL geralmente supera SQL para pesquisas importantes.

O que você acha sobre o Cloudera announcement?

O problema com o Hadoop é que não existe um modelo de negócios conhecido em torno dele que garante que os investidores vão ter um retorno (dinheiro) 10x que eles esperam. Por causa disso, eu tenho dificuldade em entender como Cloudera pode sobreviver no longo prazo.

Não é o suficiente para ter um bom produto. Você também tem que ser capaz de ganhar dinheiro com isso.

Cloudera - Websolute

Quem são os defensores primários de Big Data e NoSQL?

Todos os fornecedores NoSQL, é claro.

Se esse é todo o hype, por que eles estão falando sobre isso?

Não é apenas hype para todos. Há muitas grandes empresas e projetos que podem se beneficiar de Big Data.
No entanto, o meu ponto de vista é que a maioria não precisa e não deve usar NoSQL, porque se tornará mais caro no longo prazo, quando você finalmente descobrir que NoSQL não pode resolver todas as suas necessidades de negócio.


Source: https://blog.websolute.com.br/entenda-melhor-o-nosql-e-o-big-data/