您的位置: turnitin查重官网> 科学 >> 初中科学小论文 >像数据科学家一样

像数据科学家一样

收藏本文 2024-01-30 点赞:10083 浏览:44263 作者:网友投稿原创标记本站原创

数据已经成为工业世界、商业世界,以及日常工作的必需品,但凡有些头脑的管理者都会意识到,不会用数据分析、不和数据分析师发生关系都不会有好前途。如果公司没有一支数据分析管理队伍,绝对是公司最大的劣势。
幸运的是,你不必非得成为一个数据分析科学家,从数据中梳理出未来的蓝图。这篇文章会提供一种策略和练习,帮助那些随时准备拥抱数据的人开始他的想法,这个练习我已经用了20年。这个策略虽然不能让你变成数据神童,但会帮助你识别数据,从浩如烟海的数据中发现机会,并提高你和数据专家、分析师合作的效率。
这项练习是一项指引式练习,每一步都会揭示数据分析的一个重要概念,从理解变量到运用想象力。
首先,从你关注但令你困扰的事情开始,比如,会议总是不能按时开始。将之设为一个理由并写下来:“会议总是不能按时开始,真的就只能如此吗?”
接下来,想象数据能够帮你解决这个理由,为找到这些数据制定一项计划。写下和搜集数据相关的所有条款。例如,定义什么是“会议开始”,是某人说:“我们开始开会”,还是具体的某一时间点。
现在开始搜集数据,其中最关键的是你要信任数据。当你开始的时候,你一定会发现数据搜集有间歇性。例如,即使会议已经开始,但如果一位职位更高的领导进入会议室就意味着会议会重新开始。随着事情的进展随时修正标准和草案是很常见的事。
接下来,你可以开始画一张草图,一张好图能够让你更直白地理解数据,也方便和他人交流。有很多好策略能够帮你完成草图,我最喜欢手绘图,我喜欢把这张图称为“时间线索图”。这张图的横轴代表时间,纵轴代表变量。图表下面是会议开始时间和迟到分钟的对比数据。
现在回到最初你提出的理由,开始进一步综合分析。你会发现“在过去的两个星期,10%的会议是按时召开的,未按时召开的会议平均延迟的时间是12分钟。”先别急着高兴,你还需要回答“这样会有什么后果”这个理由。“如果这两周的样本具有典型性,那么一天会浪费多少时间,这些时间对公司来说损失的费用是多少”。
很多数据分析最后不了了之的理由就在于没有关注“会产生什么样的后果”这一理由。如果80%的会议都按时召开,最初理由的答案也许会变成“会议都是按时召开,”这样就没有分析下去的必要性了。
任何事情都需要更深一层次的分析。要对变量敏感,要知道变量会让你更好地认识所有理由、有更深层的洞察,以及为转变目前状况提供灵感。把变量设定为8~20分钟较为合理,有些会议是按时开始,有些甚至推迟了30分钟。但如果把变量设置为0~30分钟,就太大了。
接下来,进一步挖掘“这些数据还能揭示哪些理由”。数据提醒你有五次会议是按时开始的,另外的会议至少延迟7分钟。通过进一步的挖掘,你也许会发现,这五次会议都是由财务部的副总监召集的,你得出了“财务部副总监喜欢按时开会”的结论。
接下来你要做什么呢?下一步的重要性在哪里?从个人的角度看,结果既有趣又重要。首先:你可以想想,你延迟开会浪费的时间总计下来你能够做多少事情,其次,既然副总监能做到按时开会,那为什么你不能呢?
如果从整个公司的层面看,作用就不光是这么简单了。你也许不确定你的结果是否具有典型性,也不确定是否其他人也会像副总监那样对开会迟到这件事不讲情面。但可以肯定的是,你会发现更深层面的事实。开会迟到是否和其他事情有联系?是否在某一时间开会迟到会更严重?电话会议和面对面开会,哪个更像数据科学家一样深思相关范文由写论文的好帮手www.udooo.com提供,转载请保留.容易延迟?会议不能按时召开和某些人有关系吗?这些理由都可以成为你接下来要研究的理由。选择任何一个理由,回到第一步,重复以上的过程。
我希望你会觉得这个练习很有意思,你会从数据中发现很多有趣的事情,这会让你上瘾。但是,无论你是否会体会到这些乐趣,都不要轻率地开始这项训练。如果你真的是一个数据盲童,对此不敏感,我还是谦虚地倡议,不要尝试这项练习。商

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号