這篇文章給大家介紹基于eclipse開發(fā)spark2.0的dataFrame是怎樣的,內(nèi)容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

成都創(chuàng)新互聯(lián)服務項目包括科爾沁網(wǎng)站建設、科爾沁網(wǎng)站制作、科爾沁網(wǎng)頁制作以及科爾沁網(wǎng)絡營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術優(yōu)勢、行業(yè)經(jīng)驗、深度合作伙伴關系等,向廣大中小型企業(yè)、政府機構等提供互聯(lián)網(wǎng)行業(yè)的解決方案,科爾沁網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟效益。目前,我們服務的客戶以成都為中心已經(jīng)輻射到科爾沁省份的部分城市,未來相信會繼續(xù)擴大服務區(qū)域并繼續(xù)獲得客戶的支持與信任!
前些天準備研究下spark2.0的spark-sql.
我主要的工具是eclipse
版本是hadoop2.7+spark2.0
廢話少說,直接上代碼wordcount
import org.apache.spark.sql.SparkSession
import org.apache.spark._
import org.apache.spark.SparkContext._
import scala.io.Source
/**
* Created by Administrator on 2016/7/29 0029.
*/
object wordcount2{
def main(args: Array[String]) {
val sparksession=SparkSession.builder()
.master("local")
.getOrCreate()
import sparksession.implicits._
//val ds=sparksession.read.textFile("hdfs://192.168.153.11:9000/user/spark/a.txt").as[String]
// val ds=sparksession.read.text("file:/D:/a.txt").as[String]
//var ds = sparksession.read.format("text").load("file:/D:/a.txt").as[String];
// val ds=sparksession.sparkContext.textFile(args(0)).toDS()
// val result=ds.flatMap(_.split(" ")).filter(_.length>0).groupBy().count()
val warehouseLocation ="file:/" // "hdfs://192.168.21.8:9000/" //"file:/"
val sparkSession1 = SparkSession.builder().master("local").appName("tst").config("spark.sql.warehouse.dir",warehouseLocation).getOrCreate()
var ds = sparksession.read.format("text").load("file:/D:/a.txt").as[String];
val counts = ds.flatMap(line => line.split(" "))
val words = counts.groupByKey(_.toLowerCase())
val datas = words.count()
datas.show()
//result.show()
//主要注意點是 var ds = sparksession.read.format("text").load("file:/D:/a.txt").as[String];
//這里load的路徑要注意
}
}
關于基于eclipse開發(fā)spark2.0的dataFrame是怎樣的就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
分享標題:基于eclipse開發(fā)spark2.0的dataFrame是怎樣的
網(wǎng)站URL:http://chinadenli.net/article44/gdpohe.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站、網(wǎng)站設計、營銷型網(wǎng)站建設、關鍵詞優(yōu)化、品牌網(wǎng)站制作、ChatGPT
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)