欢迎来到985免费论文网-论文免费参考网!
当前位置: 首页 > 毕业论文 >

数据分析书籍阅读推荐

来源:985免费论文网  | 时间:2024-11-21 09:36:52 |

数据分析书籍阅读推荐

(1)《谁说菜鸟不会数据分析(入门篇)》

《谁说菜鸟不会数据分析(入门篇)》基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的讲解。全书共8章,依次讲解数据分析必知必会知识、确定数据分析的结构化思维、数据处理技巧、数据展现的技术。

我看了入门篇、工具篇、SPSS篇,觉得入门篇、工具篇收获挺大,SPSS在目前工作上用不上,没有实操,逐渐忘了。《谁说菜鸟不会数据分析》家族又壮大了,加入了Python、R语言、信息图表篇新成员。

(2)深入浅出数据分析

《深入浅出数据分析》以类似“章回小说”的形式,向读者展现数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法等数据分析方法论,让你对数据分析流程、作用有个全面的认识。

(3)深入浅出统计学

该书介绍了概率计算、几何分布、正态分布、等统计学知识。虽然在业务实践中,这些统计学知识不一定会用上,但是让你对有数据有更全面的认识。

(4)《统计数据会说谎》

尽信书,不如无书;尽信数,也不如无数。该书介绍了10种数据扭曲事实的方法,让你在解读数据报告的时候多个心眼,数据源头在哪里?图表是否合理?这本书读起来比较轻松,如果没时间看书的话,抽几分钟看下写的读书笔记。

数据之路:统计数据会说谎(一)数据之路:统计数据会说谎(二)

2、工具

工欲善其事必先利其器,有了数据,得采用分析工具来处理这些数据,得到想要的结果。数据分析工具很多, Excel、SPSS、SQL、Python、R、SASS等,但是使用频率最高的还是Excel、SQL,至于进一步是学Python、R还是SPSS,可以看所在团队用什么工具,再进一步学习,学习一本编程语言如Python,可以实现数据的自动化处理,极大的提升工作效率,有更多时间做更有价值的事情。

(5)Excel数据处理与分析实战技巧精粹

《EXCEL数据处理与分析实战技巧精粹》提炼了Excel技术论坛上百万个技术提问,通过270多个案例进行讲解。认真实操后,相信可以应对大部分Excel层级的数据处理与分析挑战。如果觉得看书太枯燥,网易云课堂上王佩丰老师的精品免费视频,播放量达到56.4万。

跟王佩丰学Excel视频教程:Excel实战1800分钟 - 网易云课堂

(6)《PPT,要你好看》

推荐数据分析的书,怎么推荐到PPT上面去了。此言差异,处理完数据、做好图表,你不能直接把Excel文件发给领导吧。更多的时候需要做PPT,向领导汇报。该书在豆瓣评分8.0分,作者是某高校博士,内容严谨、案例丰富。讲解PPT,却高于PPT,受到圈内一致好评。

(7)《MYSQL必知必会》

该书详细介绍了常用的SQL语法,全书才304页,做到了“麻雀虽小五脏俱全”,不讲一句废话。学习了常用的SQL语法,可以去牛客网上面做SQL题目,这样才能掌握的更牢固。

3、逻辑思维

(8)《金字塔原理》

金字塔原理:逻辑思维与表达呈现。金字塔原理是一种重点突出、逻辑清晰、主次分明的逻辑思路、表达。搭建金字塔的具体做法是:自上而下表达,自下而上思考,纵向疑问回答/总结概括,横向归类分组/演绎归纳,序言讲故事,标题提炼思想精华。

数据之路:《金字塔原理》带你训练逻辑思维

4、业务知识

(9)《数据化管理》--电商、零售

数据化管理:洞悉零售及电子商务运营》以对话的叙述,讲解了两个年轻人在大公司销售、商品、电商、数据等部门工作的故事,通过大量案例深入浅出地讲解了数据意识和零售思维。作者将各种数据分析方法融入到具体的业务场景中,最终形成数据化管理模型,从而帮助企业提高运营管理能力。

该书以商业实践、分析思路为主,较少讲解Excel操作,可见作者功力深厚。该书作者微博账号@数据化管理,经常分享数据分析知识,很喜欢的一位博主。

(10)《网站分析实战》

该书以讲解PC时代网站分析为主,可能与移动互联网时代有点脱节,但是书中流量分析、用户分析等思路还是挺值得借鉴的。该书引导你从数据中寻找有价值的结论,并且指导公司管理层的决策,最终创造更大的网占价值

开题报告中的毕业论文的研究方法或技术路线可以按照以下步骤进行编写:
1. 研究方法概述:首先,简要介绍整个研究方法或技术路线的概述,包括所选用的主要方法或技术,并说明选择该方法或技术的原因。
2. 数据采集方法:描述数据采集方法,即研究过程中收集信息和数据的方法。这可能包括实地调查、问卷调查、实验设计等。
3. 数据处理与分析方法:阐述研究中使用的数据处理和分析方法。这可能涉及统计学方法、计算机模拟技术、数据挖掘算法等。要详细说明所选方法的优势和适用性。
4. 结果展示与解释:描述如何展示和解释研究结果,包括图表、统计分析报告、模型解释等。
5. 结果验证方法:说明验证研究结果的方法。这可能包括实验验证、案例研究、文献综述等。
6. 技术路线分析:对于采用技术路线进行研究的论文,应具体描述所选用技术路线的设计和实施细节。包括技术路线中的各个步骤、所需的工具和设备、实施计划等。
7. 研究限制与可能的改进:识别研究过程中存在的限制和不足,并提出可能的改进方法或技术。
总之,开题报告中的毕业论文的研究方法或技术路线部分应该具体、清晰地概述所选用的方法或技术,并详细说明实施步骤、数据处理和分析方法、结果展示与验证方法,以及可能的改进措施。

总结为以下四点,可以参考。

1、Hadoop底层使用MapReduce计算架构,只有map和reduce两种操作,表达能力比较欠缺,而且在MR过程中会重复的读写hdfs,造成大量的磁盘io读写操作,所以适合高时延环境下批处理计算的应用;

2、Spark是基于内存的分布式计算架构,提供更加丰富的数据集操作类型,主要分成转化操作和行动操作,包括map、reduce、filter、flatmap、groupbykey、reducebykey、union和join等,数据分析更加快速,所以适合低时延环境下计算的应用;

3、spark与hadoop最大的区别在于迭代式计算模型。基于mapreduce框架的Hadoop主要分为map和reduce两个阶段,两个阶段完了就结束了,所以在一个job里面能做的处理很有限;spark计算模型是基于内存的迭代式计算模型,可以分为n个阶段,根据用户编写的RDD算子和程序,在处理完一个阶段后可以继续往下处理很多个阶段,而不只是两个阶段。所以spark相较于mapreduce,计算模型更加灵活,可以提供更强大的功能。

4、但是spark也有劣势,由于spark基于内存进行计算,虽然开发容易,但是真正面对大数据的时候,在没有进行调优的轻局昂下,可能会出现各种各样的问题,比如OOM内存溢出等情况,导致spark程序可能无法运行起来,而mapreduce虽然运行缓慢,但是至少可以慢慢运行完。

整理一下目前接触过的有助于提升数据分析思路的书。这些书阅读门槛比较低,不需要非常专业或高深的数学理论,而且和业务问题挂钩,大概能反映实际工作中的分析流程。

1、《如何用数据解决实际问题》点评:以“汽车销售下降”这个问题的分析案例贯穿全书,讲讲数据分析每个步骤需要注意的事项,对于初阶和中阶的数据分析从业者都有较好的指导意义。

2、《统计数字会说谎》点评:借鉴此书的思路不仅可以看数据分析报告里有没有“骚操作”,也可以用来鉴别假新闻或者谣言。

3、《赤裸裸的统计学》点评:一部分的内容和《统计数字会说谎》差不多,还有一部分内容更偏统计学知识,阅读难度不高

4、《精益数据分析》点评:这本书的要点是理解不同业务模式的流程,以及选择合适的指标来评估业务

5、《IBM SPSS数据分析与挖掘实战案例精粹》点评:本书提供了诸多商业分析案例,每个案例的分析思路均按照CRISP-DM流程来分步讲解,非常值得学习

6、《硅谷增长黑客实战笔记》曲卉点评:在业务背景下,数据分析需要怎么去辅助产品运营活动,怎么去建立指标体系,怎么去评估活动的效果;

7、《活用数据:驱动业务的数据分析实战》陈哲点评:这本书主要内容是怎么用数据分析辅助决策,e.g. 调查问卷设计、用户偏好分析、品牌建设分析、定价、规模预测、渠道评估等;

8、《数据化管理:洞悉零售及电子商务运营》黄成明点评:以零售下的业务场景,看”人货场“的分析,零售是典型的业务,其中的分析方法、思路也可以用到其他业务场景

9、《Python数据分析与数据化运营 》宋天龙点评:这本书的理论和实操都很不错,内容涉及的都是高频的数据分析问题,书的价格也不贵,就内容和性价比而言,可以秒杀市面上大部分数据分析的视频课了

10、《数据化决策》点评:中译本是原书第2版,最新是第3版,书关注的主题就是”如何量化“,很多看似不能量化的事物都是可以选择相应的方法或指标来衡量的,不过,量化的目的并不是计算出精准的数字,而是减少不确定性或优化问题;

11、《解决问题的三大思考工具》点评:这本书基本和数据分析没多大关系,主要内容是涉及到逻辑思考、横向思考、批判思考这3种思考,并提供了每种思考下细分的思考框架。在作者看来——逻辑思考是是基于现状推导出达到目标的解决方案,横向思考则是聚焦于最终目标同时考虑达到该目标的多种可能性,批判思考则是对目标的再次审核以确定目标背后真正的问题以及这个目标是不是真的目标。


数据分析书籍阅读推荐》由:互联网用户整理提供;
链接地址:/show/347018.html
转载请保留,谢谢!
推荐专题
相关文章