【云计算】SparkCore编程之路
小标 2018-12-05 来源 : 阅读 680 评论 0

摘要:本文主要向大家介绍了【云计算】SparkCore编程之路,通过具体的内容向大家展现,希望对大家学习云计算有所帮助。

本文主要向大家介绍了【云计算】SparkCore编程之路,通过具体的内容向大家展现,希望对大家学习云计算有所帮助。


1.sparkCore实现wordCount(Idea+scala)


import org.apache.spark.{SparkConf, SparkContext}

object wordCount {

  def main(args: Array[String]): Unit = {
    //设置本地运行  2核
    val conf = new SparkConf().setAppName("scalaWordCount").setMaster("local[2]")
    val sc = new SparkContext(conf)

    //读取文件
    //val rdd1 = sc.textFile(args(0))
    val rdd1 = sc.textFile("d:/data/word.txt");
    //切分后压平
    val rdd2 = rdd1.flatMap(x=>x.split(" "))
    //将数据都赋值 1
    val rdd3 = rdd2.map((_,1))
    //很据key  进行计算
    val rdd4 = rdd3.reduceByKey(_+_)
    //排序
    val rdd5 = rdd4.sortBy(_._2)
    //生成新文件 保存到hdfs
   // val rdd6 = rdd5.saveAsTextFile(args(1))
    println(rdd5.collect().toBuffer);

    sc.stop()
  }
}


2.创建一个数组,根据数据创建一个Bean对象,继承Order,实现序列化(Serializable).从而对数组进行排序


import org.apache.log4j.{Level, Logger}
import org.apache.spark.{SparkConf, SparkContext}

object CustomSort1 {

  def main(args: Array[String]): Unit = {
    Logger.getLogger("org.apache.spark").setLevel(Level.OFF)

    val conf = new SparkConf().setAppName("IPLocation").setMaster("local[*]")
    val sc = new SparkContext(conf)
                        //id 姓名 年纪 颜值
    val users = Array("1,tom,18,100","2,lisa,19,500","3,lisi,30,50","4,zhangsan,25,100")
    val userLines = sc.makeRDD(users)
    val userRDD = userLines.map(line => {
      val fields = line.split(",")
      val num = fields(0).toInt
      val name = fields(1)
      val age = fields(2).toInt
      val rate = fields(3).toInt
      new User(num,name,age,rate)

    })

    //排序
    val sorted = userRDD.sortBy(x => x)
    println(sorted.collect().toBuffer)
  }


}

class User(val num:Int,val name:String,val age:Int,val rate:Int) extends Ordered[User] with Serializable {
  override def compare(that: User): Int = {
    //先根据颜值排序,如果颜值相同,根据年龄排序。
    if(this.rate == that.rate){
      this.age-that.age
    }else{
      that.rate-this.rate
    }
  }

  override def toString: String = {
    s"user:$num,$name,$age,$rate"
  }
}


3.SparkCore数据保存到Mysql



import java.sql.{Connection, DriverManager}

import org.apache.log4j.{Level, Logger}
import org.apache.spark.rdd.JdbcRDD
import org.apache.spark.{SparkConf, SparkContext}

object JDBCDemo {
  val conn: () => Connection = () =>{
    DriverManager.getConnection("jdbc:mysql://localhost:3306/test?characterEncoding=UTF-8","root","123456")
  }

  def main(args: Array[String]): Unit = {
    Logger.getLogger("org.apache.spark").setLevel(Level.OFF)
    val conf = new SparkConf().setAppName("").setMaster("local[*]")
    val sc = new SparkContext(conf)
    val jdbcRDD = new JdbcRDD(
      sc,
      conn,
      "select * from logs where id >=? and id <=?",
      1,
      5,
      2,
      rs=>{
        val id = rs.getLong(1)
        val name = rs.getString(2)
        val age = rs.getInt(3)
        (id, name, age)
      }


    )
    val result = jdbcRDD.collect()
    println(result.toBuffer)
    sc.stop()

  }

}


          

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标大数据云计算大数据安全频道!

本文由 @小标 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程