9月29日下午,我院组织的第二期“互联”学术沙龙如期在信电楼204教室举行。此次学术沙龙活动邀请到了永乐高ylg8888的刘君强教授,主题是“大数据挖掘和分析”。
在活动开始,刘君强老师简单介绍了大数据的概念,通过引入科技发展过程中数据量的变化来指引学生了解大数据。进入大数据时代之后,大数据分析也更加获得人们的关注。于是,刘君强老师简单地以阿里、腾讯、百度相比较为例引入大数据分析的必要性,并用Twitter预测犯罪案例来生动讲解大数据分析。
在介绍了基本的大数据概念之后,刘君强老师介绍了数据挖掘模型,主要是数据挖掘的基本问题,特征抽取、数据泛化;频繁模式,关联规则;聚类分析;异常化分析等等。之后,刘君强老师用具体案例详细讲解了如何实现数据挖掘。
接下来,刘君强老师介绍的是大数据分析采用的技术平台。结合实验室正在使用的技术平台,主要介绍Hadoop,并引用挖掘天气数据案例来详细讲解Hadoop的MapReduce流程,还介绍了Spark集群计算平台,并通过将Spark与Hadoop作对比,让学生更好的理解Hadoop。
刘君强老师最后介绍了云计算。具体分析了云的类型和介绍了一些具体云案例。结合阿里云、腾讯云的租用以及百度云,刘君强老师形象地说明了云的好处。
学术沙龙最后,感谢刘君强老师对关于“大数据挖掘和分析”这方面知识的详尽介绍,也希望同学们通过此次学术沙龙活动能有所收获。
供稿:彭丹
摄影:邹喜