Que o MapR como uma das distribuições Hadoop tem que oferecer

Nem todas as distribuições Hadoop são criados iguais. Além das alegações de marketing, existem diferenças reais que afetam a linha de fundo ao mesmo tempo que fazem as operações de TI mais fácil.

Alta disponibilidade
MapR tem uma abordagem holística para alta disponibilidade. Arquitetura MapR distribui metadados do NameNode em todos os nós do cluster de trabalho proporcionando auto-cura de várias falhas sem a necessidade de configuração ou hardware adicional. MapR permite recuperação instantânea, com arquivos e tabelas disponíveis rapidamente após falhas de nós ou reinicio do cluster. Jobs sobre MapR não tem que ser reiniciado em falhas de nós e sempre funciona até a conclusão. MapR também fornece NFS HA para o acesso contínuo e ininterrupto

Desepenho World-Record
Beneficio no desempenho de negócios através de múltiplas dimensões, não só na obtenção de emprego / trabalho mais rápido, mas também apertando mais valor de hardware. MapR tem logros de desempenho estelar, incluindo o recorde mundial de TeraSort, cliente MapR segurando o recorde mundial de MinuteSort, MapR-DB sendo 4-7x mais rápido do que HBase em outras distribuições, e OpenTSDB em MapR alcançando taxas de 100 milhões de pontos de dados / ingestão.

Facilidade de integração
MapR Direct Access NFS fornece NAS como o acesso ao Hadoop. Enquanto outras distribuições oferecem baixo desempenho, somente leitura NFS, MapR fornece capacidades de leitura-escritura de aceso random, POSIX compliant, alta diponibilidade, alta execução do aceso NFS em entornos de produção. Com NFS, os aplicativos podem transmitir streams diretamente em Hadoop, qualquer código de linguagem funciona em Hadoop, comandos linux padrão e ferramentas como o sed e awk estão prontos para uso e seus navegadores existentes e ferramentas de desenvolvimento externas.

Multi-tenancy real incluindo YARN
Centros de dados empresariais ou lagos de dados requerem diferentes usuários, aplicativos para coexistir no mesmo cluster com verdadeiro isolamento de trabalho e de segurança personalizada. MapR é a única plataforma que é construída para fornecer esses recursos com volumes lógicos, controle de posicionamento de dados e controle de colocação de emprego para jobs tanto MapReduce V1 e YARN.

Proteção de dados completa
MapR garante o mesmo grau de capacidade de backup e recuperação oferecido por plataformas de armazenamento corporativo. MapR Snapshots são garantidos para ser consistente, ao contrário de outras distribuições, de modo que o snapshot capta com precisão o estado exato do cluster no momento que o instantâneo foi tirado. Espelhado em MapR permite replicar dados de forma eficiente em aglomerados que permitem o compartilhamento de dados entre os locais de produção, produção e ambientes de pesquisa ou entre on-premise e infraestruturas de nuvem.

Menor Custo Total de Propriedade
Com um recorde mundial de desempenho sob o seu cinto, MapR é a opção mais econômica para a construção de um cluster Hadoop. Apoiado por uma arquitetura n-NameNode, aglomerados MAPR também são homogêneos e, portanto, fácil de manter e escalar ao contrário de outras distribuições Hadoop que requerem hardware de propósito específico ou configurações complexas. Além disso, MapR fornece refinado multi-tenancy para maximizar os recursos do sistema e suporte a várias cargas de trabalho e grupos de usuários distintos de forma eficiente.

Enterprise-Grade NoSQL
MapR-DB, o banco de dados in-Hadoop NoSQL que usa a API HBase, foi recentemente reconhecido como o banco de dados do topo do ranking de valor-chave NoSQL para oferta atual. O seu alto rendimento, baixa latência consistente, as características de nível empresarial e integração Hadoop permite que você implantar, em tempo real, aplicações analíticas operacionais críticos para os negócios. Como MapR Atzmon cliente Hen-tov de Pontis coloca, "MapR-DB requer cerca de metade das máquinas em comparação com outros [NoSQL] plataformas. Isso reduz drasticamente o custo de um novo sistema."

Open Source Imparcial
A Distribuição MapR oferece aos clientes mais flexibilidade e escolha para os seus projetos de código aberto. MapR suporta múltiplas estruturas de execução, tais como YARN e Spark, e múltiplas opções para SQL-on-Hadoop tecnologias, pacotes de aprendizado de máquina, bancos de dados NoSQL. Além disso, MapR apoia exclusivamente compatibilidade através de várias versões de projetos.

Read-Write File System
Ao contrário HDFS, que segue o paradigma de uma escritura e várias leituras, a Plataforma de Dados MapR proporciona uma verdadeira capacidade leitura escritura, sistema de arquivo aleatório capaz compatível com POSIX fornecendo características únicas, como leitura e escrita NFS. Esses recursos permitem que Hadoop funcione em tempo real, sirva de armazenamento empresarial e plataforma de processamento.

Enterprise-grade Sec
Segurança MapR inclui criptografia em nível de escritura para Hadoop, autorização granular com ACLs e expressões de controle de acesso booleanas, e autenticação via Kerberos ou um mecanismo baseado simplificado nome de usuário-senha. MapR também implementa projetos de segurança do Apache para camadas adicionais de proteção.

Ler mais