taking the work out of networking:第一章 释放内向者潜在的能量 书籍翻译 如果您觉得作者翻译的内容有帮助,让您学到了相关专业知识,请分享给更多人,让更多人学到大数据知识。您的分享,是作者翻译的动力! ![taking_the_work_out_of_networking]{cover_of_book} 人际交往更多的是长久的培养种植而不是即时的狩猎 --伊万·米斯纳 人际交是我们大多数人认为比较繁琐的多数事之一----它是一项需要从事的...
使用kylin前,你需要知道? hadoop生态 为什么要使用Kylin在使用一个框架之前我们都要问问自己为什么要使用这个框架,他要解决什么问题,这个框架在解决这方面问题有什么样的优势,Kylin也如此。那么他是解决什么问题的呢?他是解决数据仓库工程的最后阶段,OLAP(联机分析处理)的查询慢的问题。在实际的数据仓库项目中,我们需要在几亿甚至上百亿条的数据当中聚合查询我们所需要的信息,但是这对于批处理来说是非常缓慢的查询...
记录一次github + hexo 文件的迁徙 建站 起因事情是这样子的,我很早之前注册的名为longzuzero的github账号,当时名字是随便想,用《龙族》小说名的汉语拼音加上英文的零,当时n年后,我准备开始写属于自己的技术博客时,才发现,这个名字没有任何意义,所以建立博客之初我把名字定义为Lemcoden
kylin配置实记 hadoop生态 介绍Apache Kylin是Hadoop大数据平台上的一个开源OLAP引擎。它采用多维立方体预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。相对于之前的分钟乃至小时级别的查询速度,亚秒级别速度是百倍到千倍的提升,该引擎为超大规模数据集上的交互式大数据分析打开了大门。笔者作为一个大数据工程师,kylin这种查询速度极高的大数据OLAP引擎是必须需要学习掌握的,此文便是关于kylin的配置过程以及过程中遇到的一些问题,后续笔者可能会写多篇博客来阐述kylin开发遇到的问题以及如何解决。
postgresql的搭建(linux7)以及powerdesigner远程连接(windows10) 数仓建模 1.介绍这篇文章主要分两个部分: postergresql的搭建 powerdesigner远程连接postergtresql读者可以根据自己的需求读取
hive 配置及命令备忘录 hadoop生态 安装配置下载 12#wget http://mirror.bit.edu.cn/apache/hive/hive-2.3.4/apache-hive-2.3.4-bin.tar.gzwget https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.5/apache-hive-2.3.5-bin.tar.gz
yarn资源调度管理系统 hadoop生态 Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。