近年来,“大数据”已经深入人心,社会各个行业的企业都沉淀了大量的数据,如何把数据利用起来,创造价值,业务数据增值等命题已经成为业界的热门话题。自2010年以来,大数据技术已经成功地应用到新兴互联网企业(如电商企业、搜索引擎、社交网站、互联网广告服务提供商等)、金融企业(银行、保险、证券公司、互联网金融借贷公司等)、通信运营商(电信、移动、联通)等行业的企业。这些国内外的先驱企业通过对自身积累的数据进行分析挖掘利用,在不同程度上获得了数据分析带来的收益,带来了很大的数据价值增值作用,并从一定程度上拉开了与没有利用数据创造价值的企业之间的领先优势,提升了企业的竞争力。
本课程重点讲解基于大数据平台的数据仓库平台的应用实战。深入讲解Hive数据仓库的项目实战,并分别基于Hadoop+Hive构建大数据仓库,以及Spark + Hive构建实时数据仓库分析平台的应用实战。
SPSS数据挖掘与建模。
课程提供搜索日志数据分析案例,数据量约为4000万条,课程包含大作业,以项目的形式结合真实的业务数据分析需求,整合大数据分析平台工具完成该项目任务,完成一个完整的项目案例任务。
本课程安排了4个实验。