数据驱动:从方法到实践的读后感大全

发布时间: 2020-08-10 08:33:18 来源: 励志妙语 栏目: 经典文章 点击: 114

《数据驱动:从方法到实践》是一本由桑文锋著作,电子工业出版社出版的平装图书,本书定价:49,页数:216,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。《数据驱动:从方法到实践》精选点评:●有收获,侧重于数据体系搭建●尤其喜欢百度和最后垂直领域的实践案例,很难得有如此de

数据驱动:从方法到实践的读后感大全

  《数据驱动:从方法到实践》是一本由桑文锋著作,电子工业出版社出版的平装图书,本书定价:49,页数:216,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。

  《数据驱动:从方法到实践》精选点评:

  ●有收获,侧重于数据体系搭建

  ●尤其喜欢百度和最后垂直领域的实践案例,很难得有如此detail的披露。

  ●神策产品使用手册

  ●扩展了自己对数据驱动的理解,其中产品智能才是重中之重。前优秀百度er之作五星支持。

  ●上下班地铁时间看完 作者主要结合在百度的经历展开对数据的论述。如果有做数据相关的,可以参考

  ●之前在活动上听过桑总的分享,同时在偶然的机会下读过这本书。整体感觉没有假大空,和《精益数据分析》这本书一样,讲了很多生活中的案例,让我深入理解了“用数据思维指导做事,同时又不被数据所束缚”,推荐各位朋友读一读。

  ●读过抢先版。百度大数据平台的搭建过程介绍的比较完整,一看就是亲身经历过的,对数据的认知很有体系化,算是良心之作,缺点是行业实践部分只有4个行业,个人比较关注在线教育。总的来说,值得一读。

  ●杂乱无章,感觉笔者思绪乱飞,标题定的很大,实际只是一笔带过。最多算是神策的产品介绍书。

  ●这是我读过的为数不多的内容包含真枪实战案例的书,看了几本类似的书都感觉是雾里看花水中望月,方法论看似有道理,但是无法应用到真枪实战中,只是些概念的罗列。平时公司也有数据分析的需求,但是读书感觉并没能真正指导工作。我们公司买了神策数据,也是对作者的理念比较信服,看这本书偶有豁然开朗之感,原来数据分析的那些理论可以这样真正应用于业务!建议大家认真读这本书,一定会有所得。

  ●前五章还是很可看的。

  《数据驱动:从方法到实践》读后感(一):一本有理论有实践的书

  

本书的理论集中在第2章和第3章。

第2章的核心概念有“大数据”和“数据驱动”两个。

作者将大数据的特征定义为:大、全、细、时。将大数据的本质特征定义为:消除不确定性。

作者并没有使用一句话来定义数据驱动,因为数据驱动的字面含义已经非常清楚了,再用别的文字来阐释显得有些多于。

作者认为,数据驱动的商业价值主要有数据驱动决策和数据驱动智能产品,也就是第4章和第5章实践篇的内容。

作者定义了理想的数据驱动——“流”,并将这条流切分为数据接入、数据传输、数据建模、数据分析和数据可视化五部分,构成第3章数据驱动五环节的内容。

第3章讲数据驱动五环节,讲得挺好。

本书的实践集中在第4章、第5章和第6章。

  《数据驱动:从方法到实践》读后感(二):解答了好几个关键困惑

  书籍的前半部分给我惊喜,解答了很多我在搭建数据平台中的困惑,但是后半部分的信息量明显降低并且是在宣传神策公司,感觉作为一本知识型的数据,后半部分的大幅宣传不合适;

  整体上我得到的并且对我有帮助的知识:

数据驱动的数据、信息、知识、智慧理论数据驱动产品决策,也驱动产品智能数据驱动的流,包括数据接入、传输、建模/存储、统计分析挖掘、可视化反馈数据分析金字塔,采集、建模、分析、指标数据埋点包括前端埋点、后端埋点、业务数据库,之前忽略了后端埋点埋点方式分为无埋点/全埋点、代码埋点对于埋点事件,最好引入元数据管理多维事件模型event模型,引入who/when/where/what/how理论模型分为行为模型event和用户模型user几种数据分析方法:漏斗分析、分布分析、留存分析、用户路径、用户分群、点击分析指标体系的构建:第一关键指标法、海盗指标法数据的分析和实据的智能,可以连起来形成闭环

  书中强调了多次数据驱动产品智能,不过对于智能这部分介绍的很浅显有点不匹配的感觉,可能是因为篇幅也可能是因为我更想看到更多对智能的思考和应用场景,而不是简单的介绍下算法和几个简单案例

  当然,总体来说对我帮助很大,推荐

  《数据驱动:从方法到实践》读后感(三):《数据驱动》:技术角度构建的数据观

  《数据驱动》这本书看第一遍的时候很流畅,作者虽然讲了一些技术方面的东西,但没有纯粹的从技术方面延伸来谈,更多的是站在产品的角度上,对数据驱动的方法和自己的亲身实践进行了讲述。虽然研发、产品、运营都能从这本书中不同的角度得到启发自己的Aha!Moment,但个人觉得,最好是在有一点技术或运营基础上,再来看这本书,理解起来会更好一些。

  书的结构很严密,因此在看的过程中,脉络很好理解和把控,钉是钉、卯是卯。但是在整理导图的时候,问题就来了:正是因为作者的严密,让我想偷懒跳过哪些章节,都会被一眼识破。在目录和标题的基础上,结合阅读过程中的重点,花了一晚上时间敲了下面这张导图,与诸君分享:

《数据驱动:从方法到实践》思维导图

  说起来读的第一本数据方面的书也是舍恩伯格的《大数据时代》,在《数据驱动》中,桑文锋也多次提到这本书,两者的很多思想和观点可谓一脉相承、不谋而合。作者从在百度大数据工作的经历开始谈起,先从客观上对大数据的定义、本质、现状与时代发展进行了概述。进而在第三章中,对数据采集与埋点、建模、分析方法和指标体系构建进行了陈述。在第四章中,对数据驱动决策的AARRR法进行了进行了介绍,以及数据驱动产品改进和体验优化的方法。在第五章则更进一步,将目光瞄准了数据驱动产品智能,作者认为,“数据驱动决策只能发挥数据20%的价值,数据更大的价值在于驱动产品智能”。而在末章中,作者结合自己多年的实践经验,分享了在四个不同行业进行进行数据分析的全过程。

  通观全书,作者的观点其实在最后想说的话中已经告诉了读者:

  1、数据意识最为关键,培养用数据说话的意识,不管是产品改进、运营监控,还是其他的决策,首先问自己有没有数据做支撑。

  2、重视数据源的建设。数据源乃大数据之根基。

  3、驱动决策并非发挥大数据的全部价值,让产品智能化更代表行业的发展方向。目前大部分数据分析产品可以满足企业在决策层面的需求分析。在未来,随着大数据在行业应用中的深化,更加依赖强健的数据仓库和灵活的平台开发能力,通过基础数据叠加算法模型,从而驱动产品智能化。

  总的来说,这是一本乍看起来平平无奇,但是越读越有深度、越读越有趣味的书,在敲下这些文字的同时,已经迫不及待的想要再读第三遍了。虽然书中的很多概念和理念,在之前也通过不同的渠道耳濡目染过,但是却无法游刃有余地应用于实战之中。在看了作者的这本书之后,对于笔者数据分析体系的建设,从技术方面撬开了一道缝隙,让一个非技术出身的产品运营人,也能够从技术层面去理解数据采集和埋点、数据模型及建模,以及启发其他产品层面的方法与思路。虽然模式不能拿过来直接套用,但是启发的价值已经值回票价。

  在看完书之后,还有一个疑惑:所谓的数据分析,应该是从研发角度主导,开发出工具来供业务人员使用;还是从业务需求主导,由业务相关人员描述自己想得到的数据形态,再由研发来进行设计。又或者说,这二者融合起来,本身就应该是统一的产品思维。这也正是数据架构师与数据分析师二者的区别何在之问。

  最后忍不住吐槽一下书的印刷质量和排版,刚买回来的新书,看了两遍,已然有脱页散架之势。另外,书中每一章节都没有标注标题序号,一开始看起来确实容易云里雾里,不得已,就只能纯手工完成标序号的工作,这也是值得改进的地方。

  《数据驱动:从方法到实践》读后感(四):读书笔记-数据驱动:从方法到实践

  

DT时代,做产品需有数据意识,决定产品迭代方向。最常用的,A/Btest,就是用数据说话。本书侧重基础讲解,对于如何进行数据分析、埋点、建立产品北极星指标、以及辅助产品运营、商业决策、建立用户画像标签,可获得入门理解。

大数据的本质是消除不确定性埋点 全埋点,无埋点。前段,用户交互数据 代码埋点。前端,后端 导入辅助工具多维事件模型 event实体 user实体数据分析 行为事件分析。事件、纬度、指标 漏斗分析。科学归因、属性关联 留存分析 分布分析。单一指标,频次、总额 点击分析 用户路径 用户分群,用户画像 属性分析指标体系 第一关键指标法 海盗指标法数据驱动:决策 运营监控 acquisition activation。新用户真正体验到了产品核心功能 aha moment magic number。进行了如此操作,体会到了产品价值。所表现出来的数据 不同环节通过ID串联 retention referral。NPS revenue 产品改进 商业决策数据驱动:产品智能 用户智能 基于规则 基于机器学习 用户画像 user persona。用于理解用户需求,想象用户的使用场景 user profile。 是否反应真实需求。关注能帮助产品运营的动态信息 时效性。及时更新用户标签 覆盖度。大部分用户画像没有绝对的正确与否,因此与其提升标签的准确度,不如设计更能描述目标用户的标签,提升用户画像的覆盖度,及更细的颗粒度画像业务不会揭示问题,用户行为会揭示问题我们所说的用户激活,是指新用户真正体验了产品的核心功能要提升用户留存,首先要考虑这些流失的用户是否真的体验了产品的核心功能,也就是说是否被真正激活了Magic Number只是一种表象,背后的原因是用户只有在进行了这些操作后,才真正体验了产品的价值。在有些线上线下结合的场景,有时候甚至需要通过人工的方式实现ID串联。运营人员应该考虑到如何让用户先用起来,以后再去补充必要的信息。我们提升留存的思路,不要局限在如何让已有的用户更活跃,而是让新来的用户尽快地进入最佳的体验状态。OMTM(One Metric ★at Matters,第一关键指标)在企业所处的任何阶段都无比重要,这是当前阶段的北极星指标,是高于一切、需要集中全部注意力的数字。你可以捕捉所有的数据,但只关注其中重要的那些。对应发展所处的4个阶段,第一关键指标分别是活跃企业数、企业留存率、核心功能人均使用次数,以及企业质量。业务不会揭示问题,用户行为会揭示问题

  《数据驱动:从方法到实践》读后感(五):数据驱动:从方法到实践

第3章 数据驱动的环节

  数据采集的问题

  通过业务数据库实现统计分析时,一些互联网公司基于业务数据库中存储的订单、用户注册信息等数据,进行常规的统计分析需求,实时且准确,但也有不足之处。

  首先,业务数据和统计分析数据耦合。业务数据库是为业务运转而设计的,满足机器读写访问需求。为了提升性能,会进行一些分表等操作。一个正常的业务都要有几十张甚至上百张数据表,这些表之问有复杂的依赖关系,这就导致业务分析人员很难理解表的含义。运营人员硬着头皮用几个月的时间好不容易看明白了,可能隔天又被工程师告知因为性能问题拆表,导致运营人员做无用功。

  其次,性能较差,无法进行批量数据操作。业务数据表设计针对高并发、低延迟的小操作,而数据分析常常针对大数据进行批量操作,导致性能很差。

  最后,缺少必要的数据字段。业务数据库是为满足正常的业务运转服务的,而有些分析需求用到的信息并不会在业务数据库中出现。比如浏览器版本信息,我们在进行数据分析时就会用到,分析不同测览器版本的用户转化情况,但是正常的业务流程并不使用,这时我们就无法进行对应的分析。

  使用Web日志统计分析,即用户在进行各种访问时,在服务器端打印一条记录,这条记录包含本次访问相关的信息,该方法能实现数据的解耦,使业务数据据和统计分析数据相互分离。然而,这种方式的问题“目的不纯”——web日志往往是工程师为了方便Debug顺便做的,这样的日志对于业务层面的分析,常常“缺斤少两”。另外,从打印日志到处理日志再到输出结果,整个过程很容易出错,我在百度时花了几年时间才解决了这一问题。

  不可否认,以上三种方式都一定程度上解决了一部分数据采集的问题,但并不彻底。

  痛苦:埋点混乱,常现埋错、漏理

  我曾经接触了一家七八年的老牌互联网公司,他们的数据采集有400+个点每次数据产品经理A提出数据采集的需求后,工程师B就会按照要求增加埋点,并交给数据产品经理A去验证。A最初觉察不到异常,但是产品上线之后,却发现埋错了,或者漏埋了,然后要求B再进行升级发版操作,整个过程效率极低。这是不少全业埋点的缩影。

  无奈:数据团队和业务工程团队配合困难

  一般来说,为了拿到基本的业务指标,需要业务工程团队去配合做一些数据采集工作,在两个团队配合方面,以下两种原因让数据采集工作不能得到应有的重视。

  首先,求“快”,数据分析让路产品升级。

  产品选代通常是企业优先级最高事项,当数据采集工作与产品选代撞车时,一般会放弃数据采集工作,如果没有数据指标的支撑,就无法衡量这个功能的升级是否合理,互联网产品并非功能越多越好,产品是否经得起考验,还是要靠数据说话。

  其次,KPI驱动,数据团队需求得不到业务重视。

  数据团队和业务工程团队是平级的团队,数据团队工作繁琐且不能直接提升工程团队的KPI,导致需求时常不被重视,让数据采集工作难有进展。

  数据采集遵循法则

  大、全、细、时

  科学的数据采集和埋点方式

  可视化/全埋点、代码埋点、导入辅助工具

  提升数据准确性的策略

  1.采集关键行为,推荐后端埋点。

  2.进行事件设计和明确统计口径,保证统计数据的质量。

  3.具有完善的元数据管理和埋点管理。

  4.通过多维分析能力快速定位异常。

  数据建模

  多维事件模型,分成Event实体和User实体

  数据分析方法

  行为事件分析、漏斗分析、留存分析、分布分析、点击分析、用户路径、用户分群、属性分析

  指标体系构建

  第一关键指标法、海盗指标法(AARRR)

第4章 数据驱动产品和运营决策

第5章 数据驱动产品智能

  产品智能:在数据基础上套用某种算法模型,将结果数据反馈到产品中,让产品具备一种学习能力。

  产品功能是易变的、难以预测的,但是基于数据的功能是有共同点的,尤其是它们对于底层基础数据的处理和访问的需求,基本上是稳定不变的。针对这部分需求,我们可以抽象出一个比较通用的数据平台,以减少不同数据应用中的重复数据处理过程,让不同数据应用更专注于业务相关需求的实现,不用纠结数据从哪来、数据如何访问等重复、枯燥的问题。

  数据平台需要具备对数据灵活处理的能力,包括接收、订阅、清洗、存储、计算、查询等,整个过程要高效,且考虑通用性。

  机器学习是研究通过不显式编程来赋予计算机学习能力的一个领域。机器学习并不是一个被完全设计好的程序,而是一种特殊的、能够自我提升的算法,让计算机自己从数据中学习并由此具备解决问题的能力。

  机器学习的算法有很多,如回归算法、分类算法、聚类算法、关联分析算法等。

  机器学习算法,一般是按照有监督和无监督,以及模型最终输出目标是映射到连续空间和离散空间这两个维度来分类的。是否有监督,就看输入给机器的数据是否有标签,有监督学习就意味提交的不仅仅有问题,还有答案。是连续还是离散,则主要取决于算法输出的结果是无限多个还是有限多个。

  一个典型的机器学习处理流程包括问题分析、数据清洗、特征工程、魔性训练、模型验证。其中,数据清洗、特征工程是最重要的工作。通过特征工程,我们可以将对解决问题有意义的关键信息从海量数据中抽取出来,让数据中的规则浮现,同时结合自己的先验知识更有效地进行处理和分析。

  用户画像有两种:User Persona与User Proflie。User Persona是产品设计、运营人员从用户群体中抽象出来的典型用户。User Proflie是根据每个用户的行为数据,产出描述用户的标签的集合。

本文标题: 数据驱动:从方法到实践的读后感大全
本文地址: http://www.lzmy123.com/jingdianwenzhang/121294.html

如果认为本文对您有所帮助请赞助本站

支付宝扫一扫赞助微信扫一扫赞助

  • 支付宝扫一扫赞助
  • 微信扫一扫赞助
  • 支付宝先领红包再赞助
    声明:凡注明"本站原创"的所有文字图片等资料,版权均属励志妙语所有,欢迎转载,但务请注明出处。
    冬日笔记读后感精选《用生活常识就能看懂财务报表》经典读后感有感
    Top