IT培訓網(wǎng)

IT培訓

Java培訓
軟件測試培訓
Web培訓
Linux培訓
Python培訓
互聯(lián)網(wǎng)營銷培訓
UI培訓
大數(shù)據(jù)培訓

關注我們

官方公眾號 回復"大禮包"享福利

領學習資料 分享IT知識

|

IT在線學習

熱門課程更多 >

Java開發(fā)
Web前端
Python+人工智能
全鏈路UI/UE設計
VR/AR游戲開發(fā)
大數(shù)據(jù)
室內(nèi)設計
PMP認證
互聯(lián)網(wǎng)營銷
全域電商運營
新媒體與短視頻運營
軟件測試
Linux云計算
Office
計算機軟考

OAO訓練營: 不離崗不離校學門IT技術(shù)

優(yōu)學VIP: 16大類IT課程提升職場競爭力

關注我們

掃碼領資料 零基礎學IT

微信掃碼關注 回復“大禮包”享福利

| 初高中軟件培訓| 中公企商培訓| 中公聯(lián)合辦學| 優(yōu)校邦| 中公PMP| 中公軟考| 計算機二級培訓

實訓項目庫 登錄 | 注冊

中公教育 IT 培訓品牌

專注于職業(yè)教育的A股上市公司

證券代碼：002607

400-650-7353

您所在的位置：首頁 > IT干貨資料 > 大數(shù)據(jù) > 【大數(shù)據(jù)基礎知識】Spark算子介紹及map算子的使用

【大數(shù)據(jù)基礎知識】Spark算子介紹及map算子的使用

發(fā)布：大數(shù)據(jù)培訓
來源：大數(shù)據(jù)干貨資料
2021-07-07 18:48:01
閱讀()
分享

手機端入口

進入到大數(shù)據(jù)圈的朋友們都對Spark的強大功能有所了解，那么提到Spark，我們就想到了其中的算子，Spark的強大功能如何實現(xiàn)，自然離不開其中的算子了。怎么理解這些算子呢，我們可以簡單把它理解為方法或函數(shù)，Spark已經(jīng)定義好了很多功能強大的方法或函數(shù)，在這里稱為算子。

Spark中的算子分為兩類：一是轉(zhuǎn)換類算子(Transformation)，二是行動類算子(Action)。轉(zhuǎn)換類算子執(zhí)行后得到新的RDD，并且不會立即執(zhí)行，需要有行動類算子觸發(fā)才能執(zhí)行。行動類算子是立即執(zhí)行的，并且執(zhí)行后得到的不再是RDD。

這次，我們用命令行的方式先來看看這些算子如何使用。

首先，我們進入spark-shell命令行方式：

[root@node2 ~]# spark-shell --master spark://node1:7077

執(zhí)行上面命令后，就進入了命令行方式：

此時，我們就可以測試使用Spark中的算子了。

有一點我們要注意的，這些算子都是作用在RDD上，所以我們首先要得到RDD。

map算子

map算子實現(xiàn)的是一一映射。

對某一個rdd執(zhí)行map，rdd中每一條數(shù)據(jù)都會執(zhí)行操作。也就是說rdd中有幾條數(shù)據(jù)，就會被迭代幾次。

執(zhí)行map算子后返回值的數(shù)據(jù)類型，取決于給map傳遞的函數(shù)的返回值類型。

scala> val rdd=sc.makeRDD(List(1,2,3,4,5,6,7),3)

rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[3] at makeRDD at :24

首先，我們通過makeRDD，將一個list轉(zhuǎn)換成RDD，并且指定分區(qū)數(shù)為3。

scala> val rdd1=rdd.map(_>5)

rdd1: org.apache.spark.rdd.RDD[Boolean] = MapPartitionsRDD[4] at map at :26

執(zhí)行map算子，傳遞的函數(shù)是判斷元素是否大于5，結(jié)果得到一個新的的RDD，并且元素類型是Boolean類型。由此我們也可以看到，結(jié)果RDD的元素類型就是由傳入map算子的函數(shù)決定的。

此時，實際上還沒有真正執(zhí)行，我們需要使用一個Action算子觸發(fā)執(zhí)行。

scala> rdd1.collect

[Stage 0:===================> res0: Array[Boolean] = Array(false, false, false, false, false, true, true)

我們使用collect算子觸發(fā)執(zhí)行，得到結(jié)果。Collect算子是Action類算子，是將結(jié)果回收到客戶端。在生產(chǎn)環(huán)境中，要慎用此算子。我們測試中因為數(shù)據(jù)量非常小，用此算子是沒有問題的。

文章“【大數(shù)據(jù)基礎知識】Spark算子介紹及map算子的使用”已幫助人

>>本文地址：http://liujunjsxg.cn/zhuanye/2021/69184.html

THE END

聲明:本站稿件版權(quán)均屬中公教育優(yōu)就業(yè)所有，未經(jīng)許可不得擅自轉(zhuǎn)載。

推薦閱讀

1 您的年齡

18歲以下
18-30歲
30歲以上

2 您的學歷

高中及以下
�？萍耙陨�

3 您更想做哪個方向的工作？

編程開發(fā)類
設計類
運營類
測試運維類

獲取測試結(jié)果

大前端
大數(shù)據(jù)
互聯(lián)網(wǎng)營銷
Java
Linux
Python
嵌入式
全域電商運營
軟件測試
室內(nèi)設計
平面設計
電商設計
網(wǎng)頁設計
UI設計
VR/AR
網(wǎng)絡安全
新媒體
直播帶貨
智能機器人

大家都在看
點擊排行榜

1 軟件測試需要學習什么技術(shù)？

2 大數(shù)據(jù)培訓什么內(nèi)容，培訓完都可以從事什么工作？

3 Web前端飽和了嘛？現(xiàn)在參加培訓還能找到工作嗎？

4 Python培訓完好找工作嗎，現(xiàn)在學習還來得及嗎？

5 Unity培訓完薪資待遇多少錢？

6 網(wǎng)絡營銷的前景怎么樣?現(xiàn)在學習還來得及嗎?

7 優(yōu)就業(yè)Linux培訓課程體系是如何構(gòu)成的？

8 Web前端的前景怎么樣？現(xiàn)在學習來得及嗎？

UI設計工資一般多少?

IT行業(yè)工資一般多少

UI設計師工資一般多少？

it培訓機構(gòu)排名，it培訓機構(gòu)哪個好？

編程都有哪些種類？

零基礎學編程應該從哪入手？

現(xiàn)在UI設計培訓一般需要多少錢？

it培訓課程有哪些？IT培訓具體都是培訓哪些？

快速通道fast track

開班地區(qū) 查看有哪些
課程大綱點擊獲取大綱
課程價格點擊查看價格
近期活動領取優(yōu)惠券
合作企業(yè) 免費推薦就業(yè)
往期薪資查看詳細數(shù)據(jù)

近期開班時間TIME

07月15日Java
咨詢/試聽
07月15日Python+人工智能
咨詢/試聽
07月15日Web前端
咨詢/試聽
07月15日UI設計
咨詢/試聽
07月15日大數(shù)據(jù)
咨詢/試聽
07月15日Java
咨詢/試聽
07月15日Python+人工智能
咨詢/試聽
07月15日Web前端
咨詢/試聽
07月15日UI設計
咨詢/試聽
07月15日大數(shù)據(jù)
咨詢/試聽

上一篇【大數(shù)據(jù)基礎知識】Spark常用算子（二）

下一篇【大數(shù)據(jù)基礎知識】Spark實現(xiàn)WordCount

優(yōu)就業(yè)——中公教育旗下IT培訓品牌

中公教育是大型的多品類職業(yè)教育機構(gòu)，提供超過100個品類的綜合職業(yè)就業(yè)培訓服務。

優(yōu)就業(yè)是中公教育IT培訓品牌，致力于培養(yǎng)面向互聯(lián)網(wǎng)領域的高端人才，以學員就業(yè)為目的，優(yōu)質(zhì)就業(yè)為宗旨，是一家集Java、Web前端、UI設計等十余類課程為一體的IT培訓機構(gòu)。

優(yōu)就業(yè)

中公教育IT培訓品牌 400-650-7353

Copyright©1999- 北京中公教育科技有限公司 .All Rights Reserved 京ICP備10218183號-88
京ICP證161188號京公網(wǎng)安備11010802020723號投訴建議：400-650-7353

掃碼回復關鍵詞“大禮包”
享學習福利

微信公眾號

iPhone下載

Android下載