谢菲尔德大学MSc Data Analytics 数据分析课程将培养学生分析大数据集的技能,使学生能够将信息转化为可操作的知识。这门课程是为有数学背景的学生(例如数学、经济学、工程、物理或化学第一学位)以及已经在相关行业工作的学生设计的。课程的重点是管理大量信息,并将其转化为可操作的知识。课程将教授学生对现代世界中需要解释的数据集类型进行实际分析所需的关键技能。这些数据涉及大型数据集以及结构化和非结构化数据。课程利用了一系列学科开发的技术,例如计算机科学、人工智能、数学和统计学。
主修课程如下:
1、Scalable Machine Learning可扩展机器学习:
本课程将专注于可应用于非常大规模数据的技术和算法(例如,人口水平)。从理论角度来看,课程将专注于算法的并行化和算法方法,如随机梯度下降。课程还将有一个重要的实用元素,关注在实践中部署可扩展ML的方法,如SpARK,编程语言,如python/Scala,以及在高性能计算平台/集群上的部署。
2、Text processing文本处理:
本课程介绍了自然语言文本处理的基本概念和思想,涵盖了处理文本语料库的技术,并研究了需要自动处理大量文本的代表性系统。本课程着重于文本分析的现代定量技术,并探讨从文本中表示和获取信息的重要模型。
3、Machine Learning and Adaptive Intelligence机器学习和自适应智能:
该课程介绍了支撑现代人工智能的核心技术。课程将介绍统计机器学习和概率建模及其在描述现实世界现象中的应用。该课程将为学生提供现代最先进算法的基础,允许现代计算机系统从数据中学习。
4、Natural Language processing自然语言处理:
本课程介绍了书面自然语言的计算机处理领域,即自然语言处理(NLp)。课程将涵盖标准理论、模型和算法,讨论问题的解决方案,描述示例系统和应用,并强调开放研究的领域。
5、professional Issues专业问题:
本课程旨在提高学生对计算机所涉及的更广泛的社会、法律和道德问题的认识。课程描述了技术变化、社会和法律之间的关系,强调了计算机和计算机专业人员在技术社会中发挥的强大作用。本课程亦介绍与计算学科有关的法律范畴(例如知识产权、软件缺陷的责任、电脑误用等)。
6、Team project团队项目:
团队项目为学生提供了参与行业启发的研究工作的机会。项目是小组进行的。项目由工业问题提出,并由计算机科学系工作人员或行业专家监督。学生将组成小组,共同选择一个感兴趣的项目,然后在导师的帮助下,通过对主题领域进行彻底分析,并制定解决方案,从而细化研究范围。该项目是在严格监督下开发的。学生的小组将在学期的前几周内提出项目概述,并在学期结束时提交一份工作报告。
7、Statistical Data Science in R统计数据科学在R中的应用:
本课程从一些基本的R语言开始,介绍R语言的进一步方面,演示如何使用和编写R函数,介绍一些编程工具,并展示如何使用R实现一些蒙特卡罗方法。除了编程方面,该课程还演示了R中的基本探索性数据分析,并介绍了ggplot2图形系统中使用的图形语法。还说明了R web应用程序Shiny。
8、Data Analytics Dissertation project数据分析论文项目:
对于个人项目,学生可以在大学内外许多不同的环境中从广泛的可能性中选择。该项目在夏季完成,在此期间,学生将有一位个人学术导师指导研究。