培训时间:

大数据建模与分析挖掘应用实战

  培训讲师:周老师

  时间地点:
本课程时间已过期,点击搜索其它开课时间

  培训费用:7800

  赠送积分:7800

    服务电话:010-82593357

大数据建模与分析挖掘应用实战详细内容

大数据建模与分析挖掘应用实战(北京,6月24-27日)
【培训日期】2021年6月24-27日
【培训地点】北京
【培训对象】
1.大数据分析应用开发工程师
2.大数据分析项目的规划咨询管理人员
3.大数据分析项目的IT项目高管人员
4.大数据分析与挖掘处理算法应用工程师
5.大数据分析集群运维工程师
6.大数据分析项目的售前和售后技术支持服务人员

【课程背景】
大数据建模与分析挖掘技术已经逐步地应用到新兴互联网企业(如电子商务网站、搜索引擎、社交网站、互联网广告服务提供商等)、银行金融证券企业、电信运营等行业,给这些行业带来了一定的数据价值增值作用。
■本次课程面向有一定的数据分析挖掘算法基础的工程师,带大家实践大数据分析挖掘平台的项目训练,系统地讲解数据准备、数据建模、挖掘模型建立、大数据分析与挖掘算法应用在业务模型中,结合主流的Hadoop与Spark大数据分析平台架构,实现项目训练。
■结合业界使用最广泛的主流大数据平台技术,重点剖析基于大数据分析算法与BI技术应用,包括分类算法、聚类算法、预测分析算法、推荐分析模型等在业务中的实践应用,并根据讲师给定的数据集,实现两个基本的日志数据分析挖掘系统,以及电商(或内容)推荐系统引擎。
■本课程基本的实践环境是Linux集群,JDK1.8, Hadoop 2.7.*,Spark 2.1.*。
■学员需要准备的电脑最好是i5及以上CPU,4GB及以上内存,硬盘空间预留50GB(可用移动硬盘),基本的大数据分析平台所依赖的软件包和依赖库等,讲师已经提前部署在虚拟机镜像(VMware镜像),学员根据讲师的操作任务进行实践。
本课程采用技术原理与项目实战相结合的方式进行教学,在讲授原理的过程中,穿插实际的系统操作,本课程讲师也精心准备的实际的应用案例供学员动手训练。

【培训目标】
1.本课程让学员充分掌握大数据平台技术架构、大数据分析的基本理论、机器学习的常用算法、国内外主流的大数据分析与BI商业智能分析解决方案、以及大数据分析在搜索引擎、广告服务推荐、电商数据分析、金融客户分析方面的应用案例。
2.本课程强调主流的大数据分析挖掘算法技术的应用和分析平台的实施,让学员掌握主流的基于大数据Hadoop和Spark、R的大数据分析平台架构和实际应用,并用结合实际的生产系统案例进行教学,掌握基于Hadoop大数据平台的数据挖掘和数据仓库分布式系统平台应用,以及商业和开源的数据分析产品加上Hadoop平台形成大数据分析平台的应用剖析。
3.让学员掌握常见的机器学习算法,深入讲解业界成熟的大数据分析挖掘与BI平台的实践应用,并以客户分析系统、日志分析和电商推荐系统为案例,串联常用的数据挖掘技术进行应用教学。

【培训特色】
定制授课+ 实战案例训练+ 互动咨询讨论

【课程大纲】
两个完整的项目任务和实践案例(重点) 
1.日志分析建模与日志挖掘项目实践
a)Hadoop,Spark,并结合ELK技术构建日志分析系统和日志数据仓库
b)互联网微博日志分析系统项目
2.推荐系统项目实践
a)电影数据分析与个性化推荐关联分析项目
b)电商购物篮分析项目
Hadoop,Spark,可结合Oryx分布式集群在个性化推荐和精准营销项目。 项目的阶段性步骤贯穿到三天的培训过程中,第三天完成整个项目的原型
培训内容安排如下:

第一天 业界主流的数据仓库工具和大数据分析挖掘工具 
1.业界主流的基于Hadoop和Spark的大数据分析挖掘项目解决方案
2.业界数据仓库与数据分析挖掘平台软件工具
3.Hadoop数据仓库工具Hive
4.Spark实时数据仓库工具SparkSQL
5.Hadoop数据分析挖掘工具Mahout
6.Spark机器学习与数据分析挖掘工具MLlib
7.大数据分析挖掘项目的实施步骤 配置数据仓库工具Hadoop Hive和SparkSQL

部署数据分析挖掘工具Hadoop Mahout和Spark MLlib
 大数据分析挖掘项目的数据集成操作训练 
1.日志数据解析和导入导出到数据仓库的操作训练
2.从原始搜索数据集中抽取、集成数据,整理后形成规范的数据仓库
3.数据分析挖掘模块从大型的集中式数据仓库中访问数据,一个数据仓库面向一个主题,构建两个数据仓库
4.同一个数据仓库中的事实表数据,可以给多个不同类型的分析挖掘任务调用
5.去除噪声 项目数据集加载ETL到Hadoop Hive数据仓库并建立多维模型
 基于Hadoop的大型数据仓库管理平台—HIVE数据仓库集群的多维分析建模应用实践 6.基于Hadoop的大型分布式数据仓库在行业中的数据仓库应用案例
7.Hive数据仓库集群的平台体系结构、核心技术剖析
8.Hive Server的工作原理、机制与应用
9.Hive数据仓库集群的安装部署与配置优化
10.Hive应用开发技巧
11.Hive SQL剖析与应用实践
12.Hive数据仓库表与表分区、表操作、数据导入导出、客户端操作技巧
13.Hive数据仓库报表设计
14.将原始的日志数据集,经过整理后,加载至Hadoop + Hive数据仓库集群中,用于共享访问 利用HIVE构建大型数据仓库项目的操作训练实践
 Spark大数据分析挖掘平台实践操作训练 
15.Spark大数据分析挖掘平台的部署配置
16.Spark数据分析库MLlib的开发部署
17.Spark数据分析挖掘示例操作,从Hive表中读取数据并在分布式内存中运行 
第二天 聚类分析建模与挖掘算法的实现原理和技术应用 
18.聚类分析建模与算法原理及其在Spark MLlib中的实现与应用,包括:
a)Canopy聚类(canopy clustering)
b)K均值算法(K-means clustering)
c)模糊K均值(Fuzzy K-means clustering)
d)EM聚类,即期望最大化聚类(Expectation Maximization)
e)以上算法在Spark MLib中的实现原理和实际场景中的应用案例。
19.Spark聚类分析算法程序示例 基于Spark MLlib的聚类分析算法,实现日志数据集中的用户聚类
 分类分析建模与挖掘算法的实现原理和技术应用  
20.分类分析建模与算法原理及其在Spark MLlib中的实现与应用, 包括:
f)Spark决策树算法实现
g)逻辑回归算法(logistics regression)
h)贝叶斯算法(Bayesian与Cbeyes)
i)支持向量机(Support vector machine)
j)以上算法在Spark MLlib中的实现原理和实际场景中的应用案例。
21.Spark客户资料分析与给用户贴标签的程序示例
22.Spark实现给商品贴标签的程序示例
23.Spark实现用户行为的自动标签和深度技术 
基于Spark MLlib的分类分析算法模型与应用操作
 关联分析建模与挖掘算法的实现原理和技术应用  
24.预测、推荐分析建模与算法原理及其在Spark MLlib中的实现与应用,包括:
k)Spark频繁模式挖掘算法(parallel FP Growth Algorithm)应用
l)Spark关联规则挖掘(Apriori)算法及其应用
m)以上算法在Spark MLib中的实现原理和实际场景中的应用案例。
25.Spark关联分析程序示例 基于Spark MLlib的关联分析操作
第三天 推荐分析挖掘模型与算法技术应用 
26.推荐算法原理及其在Spark MLlib中的实现与应用,包括:
a)Spark协同过滤算法程序示例
b)Item-based协同过滤与推荐
c)User-based协同过滤与推荐
d)交叉销售推荐模型及其实现 
推荐分析实现步骤与操作(重点)
 回归分析模型与预测算法 
27.利用线性回归(多元回归)实现访问量预测
28.利用非线性回归预测成交量和访问量的关系
29.基于R+Spark实现回归分析模型及其应用操作
30.Spark回归程序实现异常点检测的程序示例 
回归分析预测操作例子
 图关系建模与分析挖掘及其链接分析和社交分析操作  
31.利用Spark GraphX实现网页链接分析,计算网页重要性排名
32.实现信息传播的社交关系传递分析,互联网用户的行为关系分析任务的操作训练 图数据的分析挖掘操作,实现微博数据集的社交网络建模与关系分析
 神经网络与深度学习算法模型及其应用实践 
33.神经网络算法Neural Network的实现方法和挖掘模型应用
34.基于人工神经网络的深度学习的训练过程
a)传统神经网络的训练方法
b)Deep Learning的训练方法
35.深度学习的常用模型和方法
a)CNN(Convolutional Neural Network)卷积神经网络
b)RNN(Recurrent Neural Network)循环神经网络模型
c)Restricted Boltzmann Machine(RBM)限制波尔兹曼机
36.基于Spark的深度学习算法模型库的应用程序示例 基于Spark或TensorFlow神经网络深度学习库实现文本与图片数据挖掘
 项目实践 
37.日志分析系统与日志挖掘项目实践
a)Hadoop,Spark,ELK技术构建日志数据仓库
b)互联网微博日志分析系统项目
38.推荐系统项目实践
a)电影数据分析与个性化推荐关联分析项目 项目数据集和详细的实验指导手册由讲师提供
 培训总结 
39.项目方案的课堂讨论,讨论实际业务中的分析需求,剖析各个环节的难点、痛点、瓶颈,启发出解决之道;完成讲师布置的项目案例,巩固学过的大数据分析挖掘处理平台技术知识以及应用技能 讨论交流

【讲师介绍】
  周老师, 中国科学院通信与信息系统专业博士。北京邮电大学移动互联网与信息化实验室特聘研究员、对外经贸大学信息学院特聘兼职教师、中国移动集团高级培训讲师,长期从事大数据、4G、移动互联网安全、管理及大数据精确营销等研究方向。国内顶级信息系统架构师,金牌讲师,技术顾问,移动开发专家。拥有丰富的通信信息系统设计、开发经验及培训行业经验,先后为全国超过15家省移动公司,超过30家地市移动公司有过项目开发合作及授课,担任多个大型通信项目的总师。

  张老师,阿里大数据高级专家,国内资深的Spark、Hadoop技术专家、虚拟化专家,对HDFS、MapReduce、HBase、Hive、Mahout、Storm、spark和openTSDB等Hadoop生态系统中的技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用,因此在Hadoop开发和运维方面积累了丰富的项目实施经验。近年主要典型的项目有:某电信集团网络优化、中国移动某省移动公司请账单系统和某省移动详单实时查询系统、中国银联大数据数据票据详单平台、某大型银行大数据记录系统、某大型通信运营商全国用户上网记录、某省交通部门违章系统、某区域医疗大数据应用项目、互联网公共数据大云(DAAS)和构建游戏云(Web Game Daas)平台项目等。

【费用及报名】
1、费用:培训费7800元(含培训费、讲义费);如需食宿,会务组可统一安排,费用自理。

我要报名没有找到合适的课程,请在这里提交您的培训需求   发布需求

上课时间
参加人数
费用
联系人
单位名称
部门职务
通信地址
看不清,请换一张看不清,请换一张

推荐课程

企业劳动法规实务指导(2天)【培训费用】3580元/人(包括会费,讲义,证书)【课程收益】随着《劳动合同法》的颁布和实施,许多企业爆发种种劳资纠纷,企业在处理劳资纠纷时常遇以下问题: 陷入某些人力资源法律概念的误区; 没有掌握企业规章制度制定和执行的方法; 没有掌握有效预防与处理劳动争议的方法。针对以上问题,本课程帮助您从整体上把握人力资源法律规则,细致分析...

 讲师:张老师 Robert详情


客户关系管理   2026-05-06

客户关系管理(2天)【培训费用】3980元/人(包括会费,讲义,证书)【课程收益】销售仅是把客户拿下,而服务才能把客户留下,使得客户有推荐和再购买的能力和行动才是我们企业销售的真正水平,才是企业的核心竞争力。本课程通过实战案例,通过培训,学员提高客户服务与运营管理的意识、掌握客户服务的基本理念和管理工具和技巧。提高企业的整体客户管理的水平。学会如何做好客户服...

 讲师:张老师 Robert 王老师 Rice详情


大客户开发与管理技巧(2天)【培训费用】3980元/人(包括会费,讲义,证书)【课程收益】各公司都非常重视大客户,因为他们使我们的生存之本,给我们带来重大的价值或潜在价值,所以开发和管理大客户就非常重要。但往往销售人员对大客户的管理缺乏系统的开发和维护方法,造成客户的投诉或流失。本培训课程就是为学员提供一套工业品大客户销售行之有效的方法和工具,从而有效提高大...

 讲师:王老师 Rice 张老师Richard 肖老师详情


高级商务演讲技巧   2026-05-06

高级商务演讲技巧(2天)【培训费用】 3980元/人(包括会费,讲义,证书)【课程对象】需要加强和提高演讲能力的任何人士,任何需要在商业和社会场合进行正式和即兴讲话的人。【课程背景】:场景举例:总经理:我们上个月开了4场产品推广活动,公司花了不少钱,但是,产品的销售情况总是不尽人意,为什么我们在推荐会上的销售达成率没有想象中那么高,大家觉得原因在哪里?客户经...

 讲师:张老师Richard 张老师 Robert详情


战略分析与战略制定(2天)【培训费用】 3980元/人(包括会费,讲义,证书)【课程收益】战略管理是企业管理至关重要的一环,它决定一个企业能否做“正确的事”,进而决定企业的生死存亡。本课程意在使学员掌握战略分析与制定的方法与工具,掌握企业战略规划与实施的基本流程与主要应用模型,从而为制定正确的战略打下基础。【课程对象】公司董事长、总裁、各事业部负责人、战略总...

 讲师:张老师 Robert详情


有效开展市场调研 (2天)【培训费用】 3980元/人(包括会费,讲义,证书)【课程收益】市场营销调研是企业了解市场、掌握消费者需求的重要手段。可以说,调研工作做与不做,以及调研工作是否有效,将直接决定着企业决策的合理程序。本课程通过对调研问题的确定、调研计划的制定、一二手资料的收集、问卷设计、抽样计划、数据分析及调研报告撰写等内容的介绍,系统讲授了营销调研...

 讲师:王老师 Rice 张老师Richard详情


薪酬福利体系构建技巧(2天)【培训费用】3980元/人(包括会费,讲义,证书)【课程收益】薪酬往往是企业最敏感的部分,如何设计好薪酬体系涉及到员工的激励和保留的效果,所以研究和掌握薪酬设计和管理的规律就显得至关重要。本培训课程提供了全面和先进的薪酬体系的设计思路,通过围绕一个兼顾外部、内部、个人三方面的公平的模型精心设计,使薪酬体系成为激励员工创造良好业绩的...

 讲师:张老师 Robert详情


基层管理者/班组长职业化提升训练(2天) 【培训费用】3580元/人(包括会费,讲义,证书)【课程收益】上面千根线,下面一根针。基层管理者对企业的价值创造是非常基础的、关键的,如何把他们打造成效率高手才是生产企业提升制造、服务和质量水平的真谛!本课程为各种生产和服务企业打造,科学全面地提升班组长职业化水平。【参加对象】 一线主管,一线班组长,一线各级管理人员...

 讲师:张老师 Robert详情


全媒体时代的企业危机公关与舆情应对培训时间地点:深圳 培训费用:3600元/人(培训费用、资料费、茶歇、结业证书、税费等一年内可免费复训一.课程背景:企业发生危机,如同面对税收一样不可避免。危机来临之时,组织做出的一系列的管理与沟通动作,用以消除危机因素、降低经营损失、减轻商誉损害、修复品牌形象,重新获取内部外部的信任和支持,就是危机公关。在当下社会经济发展...

 讲师:田付详情


设计思维工作坊   2026-05-07

设计思维工作坊培训时间/地点:2026年5月78日(星期四 星期五)/上 海收费标准:¥5000/人Ø含授课费、证书费、资料费、午餐费、茶点费、会务费、税费Ø不包含学员往返培训场地的交通费用、住宿费用、早餐及晚餐课程背景:设计思维不同于传统的工业产品设计,站在全新的角度进行思考,带来系统性的改变,从而取得极具创意的成果。设计工作坊将帮助参与者建立新的思维模...

 讲师:刘老师详情


COPYRIGT @ 2018-2028 HTTPS://WWW.QG68.CN INC. ALL RIGHTS RESERVED. 管理资源网 版权所有