数据科学工作是最令人垂涎的职业之一,在过去三年的“玻璃门最佳就业机会”排行榜上排名第一,而且拥有合适技能的人的平均工资也很高。根据图8最近的一份报告,这些专业人士对工作的满意度也很高:89%的数据科学家表示他们热爱自己的工作,而2015年这一比例为67%。
该报告发现,对数据科学家的需求仍然很高:在接受调查的240名数据科学家中,49%的人表示,他们每周至少会接到一份新工作的联系。造成这种情况的部分原因是,越来越多的公司正在扩大数据的收集和使用,并需要一位能够分析数据的专业人士来推动商业洞察力,并将其应用于机器学习和人工智能(AI)等新技术。
报告发现,大约90%的数据科学家表示,他们的一些工作为人工智能和机器学习项目提供了信息。近40%的人说,他们的大部分工作都是这样做的。然而,这并不意味着这项工作没有挑战:约55%的受访者表示,培训数据的质量和数量是他们工作中最大的挑战。
数据科学和机器学习仍然是比较年轻的领域,所以对于哪种语言、工具和框架是最好的,还没有达成压倒性的共识。尽管机器学习社区基本上已经开始使用Python(61%),但根据报告,机器学习框架的使用仍然存在很大的差异。
根据报告,以下是数据科学家使用的前10个机器学习框架:
值得强调的是,许多流行的工具都是开源的--包括Pandas、Numpy、Scikit-Learning、Matplotlib和TensorFlow--报告指出,这表明这个社区更喜欢开源、社区驱动的软件。由于许多这样的框架已经存在多年了,早期的采用者很可能已经非常熟悉这些框架了,其他人需要时间、精力和性能质量才能将他们从高层职位中剥离出来。
通过遵循这些专家提示,以及阅读关于数据科学创新的见解,掌握大数据分析的基本原理。星期一交货星期一