近年來大數(shù)據(jù)技術人才層出不窮,但無論如何求職者只有經(jīng)過層層面試才能獲得施展才華的機會,而面試的首關就是一套技術面試題,所以中公優(yōu)就業(yè)小編整理了一些常見的大數(shù)據(jù)面試題,希望對大家有幫助。
1、舉一個簡單的例子說明mapreduce是怎么來運行的 ?
2、secondarynamenode的主要職責是什么?簡述其工作機制
3、Sqoop用起來感覺怎樣?
4、kafka 數(shù)據(jù)高可用的原理是什么
5、MapReduce 中排序發(fā)生在哪幾個階段?這些排序是否可以避免?為什么?
6、100w 個數(shù)中找出最大的 100 個數(shù)。
7、一個文本文件,大約有一萬行,每行一個詞,要求統(tǒng)計出其中最頻繁出現(xiàn)的前10個詞,請給出思想,給出時間復雜度分析。
8、已知某個文件內包含一些電話號碼,每個號碼為8位數(shù)字,統(tǒng)計不同號碼的個數(shù)。
9、有一千萬條短信,有重復,以文本文件的形式保存,一行一條,有重復。 請用 5 分鐘時間,找出重復出現(xiàn)最多的前 10 條。
10、每個文件至少有1000萬行,請用程序完成以下工作,
1)每個文件的個子的IP
2)出現(xiàn)在b.text而沒有出現(xiàn)在a.text的IP
3)每個user出現(xiàn)的次數(shù)以及每個user對應的IP的個數(shù)
相關推薦:
更多內容
>>本文地址:http://liujunjsxg.cn/jiuye/2018/45570.html
聲明:本站稿件版權均屬中公教育優(yōu)就業(yè)所有,未經(jīng)許可不得擅自轉載。
1 您的年齡
2 您的學歷
3 您更想做哪個方向的工作?