谢菲尔德大学研究生数据分析课程旨在培养学生分析大数据集的技能,以便能够将信息转化为可操作的知识。课程侧重于管理大量信息并将其转化为可操作的知识。教授了对现代世界中需要解释的数据集类型进行实际分析所需的关键技能。这些涉及大型数据集以及结构化和非结构化数据。那么,数据分析专业究竟学什么?请看下述课程解析。
一、可扩展机器学习
本课程将重点介绍可应用于大规模数据(如人口水平)的技术和算法。从理论的角度来看,课程将集中于算法的并行化和算法方法,如随机梯度下降。课程还将包含一个重要的实用元素,重点介绍在实践中部署可扩展ML(如SpARK)的方法、python/Scala等编程语言以及在高性能计算平台/集群上的部署。
二、文本处理
本课程介绍了自然语言文本处理的基本概念和思想,涵盖了处理文本语料库的技术,并考察了需要自动处理大量文本的代表性系统。课程侧重于文本分析的现代定量技术,并探索从文本中表示和获取信息的重要模型。
三、机器学习和自适应智能
该课程基于支撑现代人工智能的核心技术。介绍统计机器学习和概率建模及其在描述现实世界现象中的应用。课程将为学生提供现代最先进算法的基础,使现代计算机系统能够从数据中学习。
四、自然语言处理
本课程介绍了书面自然语言的计算机处理领域,称为自然语言处理(NLp)。课程将涵盖标准理论、模型和算法,讨论问题的竞争性解决方案,描述示例系统和应用,并强调开放研究的领域。
五、专业问题
本课程旨在促进对计算机的更广泛的社会、法律和道德问题的认识。描述了技术变革、社会和法律之间的关系,强调了计算机和计算机专业人员在技术社会中发挥的强大作用。同时还介绍了与计算机学科相关的特定法律领域(例如,知识产权、缺陷软件的责任、计算机滥用等),旨在提供对计算机专业人员非常重要的道德概念的理解,以及考虑道德困境的经验。
六、团队项目
团队项目为学生提供了参与行业启发的研究工作的机会。课程以小组为单位进行。项目由计算机科学系的工作人员或行业专家进行监督。学生将组成小组,共同选择一个感兴趣的项目,然后在导师的帮助下,通过对主题领域进行全面分析并制定解决方案来完善研究范围。该项目是在强有力的监督下开发的。学生的小组将在学期的前几周内陈述项目概述,并在学期结束时提交一份工作报告。
七、R统计数据科学
本课程从基本的R语言知识开始,介绍了R语言的更多方面,演示如何使用和编写R中的函数,介绍一些编程工具,并展示如何使用R实现一些蒙特卡罗技术。除了编程方面,该课程还说明了R中的基本探索性数据分析,并介绍了ggplot2图形系统中使用的图形语法。还展示了R web应用程序Shiny。
以上几门是谢菲尔德大学研究生数据分析专业的核心课程,除此之外,学生还需要完成一个60学分的数据分析论文项目。同时还可以从该专业提供的选修课列表中进行选择。