大数据时代,数据科学也越来越引起人们的关注。那么到底什么是数据科学呢?一般来讲,数据科学就是从数据中提取信息知识,即是数据挖掘与预测分析的延伸,亦是发掘知识与数据的过程。)所以,通俗来讲,数据科学,就是通过分析数据,来挖掘获得这些数据中的潜在信息。
Data science 还有其他几个类似的别称,比如 Data Mining(NJIT) 、 Data Analytics(Cornell University) 、 Preictive Analytics(DePaul University) 、 Business Analysis ( NYU/Forham University )、 Business Intelligence an Data Analytics (Carnegie Mellon University) 等等。
所以,在针对这个专业选校时,一定要注意,不要只看名称,而是要重点看课程设置。
数据科学专业需要具备的能力:
( 1 )计算机科学能力
一般来说,数据科学专业大多要求具备编程、计算机科学相关的专业背景。简单来说,就是对处理大数据所必需的 Haoop 、 Mahout 等大规模并行处理技术与机器学习相关的技能。
( 2 )数学、统计、数据挖掘的能力
除了数学、统计方面的素养之外,还需要具备使用 SPSS 、 SAS 等主流统计分析软件的技能。其中,面向统计分析的开源编程语言及其运行环境“ R ”最近备受瞩目。R 的强项不仅在于其包含了丰富的统计分析库,而且具备将结果进行可视化的高品质图表生成功能,并可以通过简单的命令来运行。此外,它还具备称为 CRAN ( The Comprehensive R Archive Network )的包扩展机制,通过导入扩展包就可以使用标准状态下所不支持的函数和数据集。R 语言虽然功能强大,但是学习曲线较为陡峭,建议从 python 入手。
( 3 )数据可视化
信息的质量很大程度上依赖于其表达方式。对数字罗列所组成的数据中所包含的意义进行分析,开发 Web 原型,使用外部 API 将图表、地图、 Dashboar 等其他服务统一起来,从而使分析结果可视化,这是对于数据科学家来说十分重要的技能之一。
( 4 )跨界为王
麦肯锡认为未来需要更多的 “ translators ”,能够在 IT 技术,数据分析和商业决策之间架起一座桥梁的复合型人才是最被人需要的。” translators “可以驱动整个数据分析战略的设计和执行,同时连接的 IT,数据分析和业务部门的团队。如果缺少“ translators “,即使拥有高端的数据分析策略和工具方法也是于事无补的。天才的” translators “非常罕见。但是大家可以各敬其职,数据战略家可以使用 IT 知识和经验来制定商业决策,数据科学家可以结合对专业知识的深入理解使用 IT 技术开发复杂的模型和算法,分析顾问可以结合实际的业务知识与分析经验聚焦下一个行业爆点。
在美国前 50 的院校中,大概有 15 所左右的学校开设数据分析专业,其中包括哥伦比亚大学,华盛顿圣路易斯大学,康奈尔大学,西北大学,南加州大学等知名院校。过去一年里,至少有六所美国大学,包括弗吉尼亚大学、哥伦比亚大学、俄亥俄州立大学等开设或宣布计划开设数据科学方面的硕士研究生培养项目。
【微语】用知识的海洋为伴,让旅途充满无尽的可能。祝福你留学生活一帆风顺。