Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 3161|回复: 4
打印 上一主题 下一主题

【大数据教育】3月1日STORM免费网课

[复制链接]

470

主题

1614

帖子

5378

积分

超级版主

Rank: 8Rank: 8

积分
5378

Python达人研究僧

跳转到指定楼层
楼主
发表于 2018-1-22 10:17:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 huangyuefeng 于 2018-3-5 11:30 编辑


光环是做职业教育的,跟他们合作看看。
回复

使用道具 举报

470

主题

1614

帖子

5378

积分

超级版主

Rank: 8Rank: 8

积分
5378

Python达人研究僧

沙发
 楼主| 发表于 2018-1-22 10:50:05 | 只看该作者

分享题目,数据很重要,Storm帮你现在就要

本帖最后由 huangyuefeng 于 2018-2-24 13:36 编辑

嘉宾图片(还在找)



嘉宾介绍:黄跃峰

资深大数据研发专家,10年研发经验,实干派。
专业领域聚焦在流式处理、数据平台构建、互联网数据产品研发。

曾在商用版Storm、国内顶级数据平台、以及百PB量级数据治理等项目,
作为leader进行设计、研发和落地应用。
曾受邀到国内顶级大学做大数据主题分享,
工作成果在知名专业书籍上多有论及。

分享大纲:
非实时计算几乎都基于MapReduce计算框架,但MapReduce并不是万能的。对于搜索应用环境特定场景等现实问题,MapReduce并不能很好地解决问题。
近年,流式处理成为学界和工业界的新热点,并在讨论中逐渐达成共识。
数据需求十万火急,不愿等也不能等;
数据价值当然热的高,用冷数据是退而求次;

在实时数据处理领域,
从老牌劲旅Storm,到名门之后Spark-Streaming,再到新生力量Flink,
他们要解决的,都是大数据处理的时效性问题。

嘉宾会从流式处理的典型场景开始,
深入浅出地跟大家分享,
Storm解决哪类问题,
Storm怎么解决问题,如何开始学习Storm,Storm等流式处理处理的发展前景;


参考材料:
我在吉大做大数据技术分享
http://ccst.jlu.edu.cn/info/1091/1405.htm

杨栋(前同事)对流式计算技术发表的文章
https://www.csdn.net/article/2011-11-07/307058


郭江亮(前同事)对流式计算技术发表的文章
https://www.csdn.net/article/2014-10-28/2822319
光环这边的线上分享案例

http://www.fmi.com.cn/index.php? ... ow&catid=36&id=3061

http://www.fmi.com.cn/index.php? ... ow&catid=36&id=3078



回复 支持 反对

使用道具 举报

470

主题

1614

帖子

5378

积分

超级版主

Rank: 8Rank: 8

积分
5378

Python达人研究僧

板凳
 楼主| 发表于 2018-1-22 11:07:22 | 只看该作者
本帖最后由 huangyuefeng 于 2018-1-22 11:09 编辑

郭江亮把UDW-RT直接就发文章了,
这算怎么回事呢,
UDW-RT是我做的。
应该要整理下,
把RT的东西到CSDN上分享下。
刷刷脸。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

470

主题

1614

帖子

5378

积分

超级版主

Rank: 8Rank: 8

积分
5378

Python达人研究僧

地板
 楼主| 发表于 2018-3-3 11:41:39 | 只看该作者
本帖最后由 huangyuefeng 于 2018-3-3 11:47 编辑

3月1日做了一次线上网课。反馈如下:


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

470

主题

1614

帖子

5378

积分

超级版主

Rank: 8Rank: 8

积分
5378

Python达人研究僧

5#
 楼主| 发表于 2018-3-5 11:22:32 | 只看该作者

飞马做了个总结帖

本帖最后由 huangyuefeng 于 2018-3-5 11:23 编辑

图片就是我的ppt,挂了无所谓。


数据很重要,Storm帮你现在就要
大数据所在的业务领域,可谓是炙手可热,在实时数据处理领域,近年来,流式处理成为学界和工业界的新热点,并在讨论中逐渐达成共识,数据需
作者: | 2018-03-02 15:51:38



大数据所在的业务领域,可谓是炙手可热,在实时数据处理领域,近年来,流式处理成为学界和工业界的新热点,并在讨论中逐渐达成共识,数据需求十万火急,不愿等也不能等。飞马网于3月1日晚邀请到资深大数据研发专家——黄跃峰,在线上直播中深入浅出地和大家分享了关于Storm的相关知识。

黄跃峰老师主要从入门、原理、实战三个方面对Storm进行详细讲述,以下是具体内容。

一. 入门

作为一门主流的技术,Storm拥有非常高的关注度,流式处理与大数据是承接与扩展的关系,大数据是包含流式处理的更大领域。

1.批处理的劣势:时效性太差

以下是两条优化路径:

综合前面两条优化路径和论文实践,我们得出结论,基于Hadoop的批处理框架,要进行时效性地改造,事实上很难达到理想效果。

2.流式处理的优势

在“现在就要”的这种秒即时效性场景里,Storm是一枝独秀。

从上面的两种场景中,我们可以看到,使用流式处理获得的实时数据,能够大幅度地提高推荐的精准度以及用户的满意度。

提炼一下,这就是流式处理的异步场景,当然除此之外,也有同步模式。

综上所述,流式处理给大数据开拓了新的方向,因此不少技术社区有志于推动该方向的发展,这就使得流式处理迎来百花齐放、多种技术一起发展的局面。

3.Storm继往开来

流式处理系统早有渊源。

在时效性要求较高的场景,Storm的地位无可取代。Storm是一个分布式的实时的流式的计算平台,这是它独特的优势,使得Storm完全有别于其它同类的和类似的技术。


二.原理

Storm的由来了解之后,黄跃峰老师对数据流组件、架构、编程接口这些原理进行了独家讲授。

1.数据流组件很完备

数据流组件相当于Storm的肢体,黄老师用机场的行李转盘来作类比。

以上六种就是Storm的肢体,除此之外,它也有自己的骨架。


2.Storm架构健壮、高效

它的架构主要分为以下几个层次。

和Hadoop1.0相比较,它们之间很类似,特别是在健壮性上,但这两套技术分别面对的是实时和批量不同的场景,所以是区分度很大,各有优势的两种技术。

除了健壮之外,这套架构也非常高效,让我们来看一看高效的地方。

3.Storm编程接口很清晰

      最主要的编程接口有三种:Spout、Bolt、Topology。

三.实战

我们通过入门的环节了解Storm的由来和原理的章节打好基础之后,黄跃峰老师开始实战讲解。同样模拟机场行李转盘,运用前面的知识做实际的编程,进行Hello Airport环境搭建,首先是介绍一个简单的设计。

然后进入编码环节

那这些编码运行起来会是什么样子呢?我们来看一下运行日志。

通过运行日志,我们得出这个设计和实现达到了我们的预期,很好很强大。


当大家在跃跃欲试想要找一个Storm环境试手的过程中,黄老师表示,下面这一部分能够帮助大家以最快速度配置好环境,Storm需要Java6以上版本,以及Passion、Zookeeper3.4.5版本。

以上就是这次线上直播的主要内容,除此之外黄跃峰老师还针对大家的提问进行了耐心解答。此次讲述内容深入浅出,不管是对有志于大数据技术的高级人才,还是较为年轻的IT从业者来说,都有很大帮助。




回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Comsenz Inc.  

GMT+8, 2025-12-14 21:25 , Processed in 0.056165 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表