群主 大数据技术与架构
本文总结了一些读书的时候和工作后看过的书,这些书是从我的书单中挑出来的。
不完全统计我个人在京东、当当、亚马逊和Kindle上共买了几百本书,当然算起来其实没有花多少钱,有大量的书都是搞活动买到的。我挑了其中一些个人认为很值得看的书,大家可以搜一下,其实大部分书都可以在网上找到电子版。如果你打算仔细看看,推荐还是买基本纸质书籍,比如我个人其实还是更喜欢看一些纸质的书。
⚠️注意啦。这些书只是我个人看过的,包括计算机基础,算法,语言,后端开发,大数据开发,也包含了一些机器学习和算法的书,好坏也是从个人角度出发,如果某一本书你也看过,但是你觉得就是垃圾,那它就是你眼中的垃圾。
读者中应该有一部分不是计算机专业,或者是本科跨考的计算机大类的研究生,还有一些其他的情况,那么这里我强烈建议你要把下面这些基础书看看,补上自己的基础。
朋友们,下面这套书每本都是板砖那么厚,不管你是用来防身还是垫桌子都是不二之选。那就是国内机械工业出版社引进的黑皮书系列。
这套书我个人全部看下来的三分之一都不到... 太TM难啃了。后来到处找视频看...
如果你的英文足够好,硬刚原版也可以[手动狗头]。
好了,接下来是我买到几本好书。
《重构:修改代码的艺术》,这本书怎么说,是我买到的好书中排名前几的,这本书可以帮助你改掉代码中的'坏味道',写出高质量的代码。
这本书毁誉参半,觉得好的人觉得特别好,觉得不好的人觉得它就是垃圾,不如刷一会leetcode。但是我只能告诉你豆瓣上这本书评分9.1,是一本短小精悍的算法小册子。
如果你用的是Linux系统进行开发,那么Linux入门课非《鸟哥的Linux私房菜》莫属。全面详细地介绍了Linux操作系统。
推荐这本书的时候我还挺犹豫的,这本书其实是后端的开发人员更适合。作者是原来淘宝的技术负责人,主要介绍大型网站随着数据量、访问量增长而发生的架构变迁以及其中的一些中间件的使用。假如你对一个大规模的网站建设不够了解或者你在负责一个大型网站的建设,那么这本书非常适合你,可以了解大型网站架构变迁过程中的较为通用的问题和解法,并了解构建支撑大型网站的 Java 中间件的实践经验。
这本书是我的Java入门书,当然可能更多的人用的是《Java核心技术》卷1和卷2,那两本我也买了,但是没有读完... 因为那两本书太TM厚了,让我有恐惧感。effective java 的好处就是比较薄,让人读起来有成就感,更像Java核心技术的浓缩版。
《深入理解Java虚拟机:JVM高级特性与最佳实践》这本书有没有没读过的?这本书不用再多说了,是Java开发者必须要读的一本书,今年出了第三版。这本书是我们处理JVM问题包括面试工具书一般的存在。
《Java并发编程实战》《Java并发编程的艺术》这两本书我都看过,内容很像,也没有什么高下之分,如果你在处理并发问题或者需要在多线程开发上下点功夫,那么就要好好看看这本书。
我第一次使用Netty,是和我们的技术经理做一个图片缩放服务,那也是我第一次接触NIO并且实践。实际上有没有哪个大数据框架不会用到Netty?我可以很负责任的告诉大家,只要这个框架用到通信,那么就会用到Netty。
Hadoop、Storm、Spark、Facebook、Twitter、阿里巴巴都在使用Java高性能NIO通信框架Netty,本书告诉你Why,通过本书你可以全面、系统地理解Netty 架构设计理念,以及异步NIO 编程。
在Java领域,Netty是我们做NIO技术选型的不二之选。
如果你用到了Nginx,需要一本工具书,那么就《Nginx高性能Web服务器详解》吧。
上面这三张图是我在两年前京东做活动的时候买的书,大部分都看完了。没有什么特别的,当时对官网利用的不好,所以买了很多工具书来看。大部分都当作福利送给了读者。
现在因为各个框架迭代的版本很快,所以很少在买工具书看了。在这里对这些框架,我个人还是推荐去官网,这里英语好的优��,�յ�势就体现出来了,很多框架的出现一手资料都是英文,如果你的英文不好,那么只能等其他人翻译或者付费购买他人的教学教程。
着重推荐两本:
《数据算法:Hadoop/Spark大数据处理技巧》,这本书介绍的都是大数据领域基本设计模式、优化技术和数据挖掘及机器学习解决方案。并且把Hadoop和Spark当作工具进行了实现。如果你目前只是处在使用一些数据框架开发业务,那么真的要买来看看,高屋建瓴的站在一个高度俯看整个大数据生态。
《大数据处理之道》这本书非常贵,京东售价要200多块钱,非常适合大数据入门使用。这本书非常冷门,知道的人不多,京东上在售的几家店都是0成交,当然跟盗版猖獗也有关,网上都有PDF... 这本书大纲都吓人,从Hadoop、HDFS、Yarn、Hive、ZK、Spark、Storm、ELK都有涉及,适合入门。
总结如果把书分类,我个人看过的基础类的书远远超过框架类,框架只是工具,打牢基础才能做到举一反三,今天出一个Hadoop,明天出一个Spark,仅仅Apache一个组织就像一个框架工厂,每年就像下蛋似的一年几十个新项目问世,单纯掌握框架是学不过来的。
因为篇幅和时间原因,先写到这里,其实还有很多经典的书,比如《高性能MySQL》等,另外随着知识付费的兴起,很多网站都有付费课程,有些课程质量也很高,就不一一列举了。还有在机器学习和算法领域我也看了一些书籍,当然平时工作中用到的不多也不够专业就不推荐了。
在技术上,我还是那句话,当你需要学习某个技术方向的时候你就会去找资料,去豆瓣,去网站搜,看评价,看大纲。一切技术最终都是雕虫小技。
读书就是这样,读书的目的不仅仅是工作需要,更多的是自我提升。
这也是读书的意义所在吧。