2020-2021第二学期第一周的《Hadoop认证教程》在授课之前提前给学生发送了在网络上找好的资料,该门大数据专业课程涉及的面很宽广,在授课期间一直希望学生打起万分精神。在授课的过程中,发现大数据专业的学生对该门课程很感兴趣,而这门课程跟此次的大数据竞赛又存在着万分关联,因此在课后的时候花了几个小时的时间给学生制作了对应的文档。
《Hadoop认证教程》这门课程的开篇讲授以集群为主,学生需要在自己的电脑端事先搭建好对应的集群环境,在已经存在集群环境的基础上才可以进行相关操作。考虑到部分学生电脑配置较低的情况,在课上拓展了第二种方案即使用本地windows构建Hadoop,但在Hadoop的课程中虽然本地构建Hadoop也能够实现相关wordcount等其他功能,两种方式都对应讲授并且制作了手册且制作好的电子版手册下发到了每个学生的手中。
备课过程
《Hadoop认证教程》的备课过程比较困难,由于Hadoop涉及的面太广泛,因为《Hadoop认证教程》这门课程需要提前掌握linux,java等相关计算机专业知识。因此在备课过程当中也是参考了许多的网络资料和相关书籍,参考的材料包括如下:《鸟哥的私房菜》、《java程序设计基础》等。网络材料主要参考尚硅谷在b站上面的《尚硅谷大数据技术之Hadoop》,同时也参考了部分Mooc当中的材料。
图1:职教云备课资料图
课程与竞赛相关联
高职类大数据竞赛(G-12大数据技术与应用)方面的竞赛大量使用到了Hadoop的知识,首先是集群的搭建,在授课当中首先教授学生搭建了相关集群,手把手教搭建集群.在教会搭建集群的同时由于竞赛可以使用两种工具撰写java的代码,于是在教会搭建集群的基础上,找好相关的Hadoop的依赖包发送给对应的学生,在第一次课程的讲授过程中学生在自己本地电脑端完成了相关代码的撰写以及自己上传将自己写好的java代码打包成对应的jar包上传到集群当中并查看统计单词的效果。
图2:部分学生作品截图
在《Hadoop认证课程》的后期课程还将继续以竞赛为中心,将竞赛的知识点大量融入《Hadoop认证课程》的教程中去,让学生学有所得,学有所成。大数据技术与应用的竞赛主要使用Hadoop做大数据的集群以及后期的数据清洗环节,后期《Hadoop认证教程》也必将涉及《Hadoop认证教程》当中的数据清洗环节。
图3:使用Hadoop完成数据清洗
授课过程总结
在授课过程中偏向于实践为主,先讲部分行业现状,理论基础接着穿插入实践相关的知识,例如讲Mapreduce的过程中先讲授wordcount的实现过程及其理论,讲完wordcount实现的代码后紧接着讲授部分理论让学生加深对于map,reduce以及在hadoop集群当中资源调度的映像,通过图文的方式使得学生对hadoop当中yarn资源管理框架有个清晰的认知。
图5:Mapreduce核心思想图解
在第一周《Hadoop认证教程》课程结束后,布置了相关作业,用来考察学生对于这一周课程的接受程度,课程作业共包含三个模块:第一,搭建Hadoop的本地开发环境。第二,使用本地搭建好的Hadoop开发环境完成基于windows的wordcount功能。第三,将打包好的jar包上传到集群当中执行,查看执行后的相关wordcount的统计结果。以下是《Hadoop认证教程》当中wordcount实现的部分代码截图:
图6:wordcount部分代码截图