博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop安装-Spark Windows 环境 pycharm开发环境搭建
阅读量:4337 次
发布时间:2019-06-07

本文共 656 字,大约阅读时间需要 2 分钟。

 

1、下载版本对应的spark和hadoop,如下:

  

2、配置Spark

  解压Spark并配置环境变量,

  新建环境变量如下:

    

   在Path中增加如下环境变量:  

    

3、配置hadoop相关变量,

    

    

4、下载hadoop组件,并进行配置(winutils )

  下载地址:

  将下载好的组件解压放到hadoop_home的bin目录下,不进行文件替换

 5、验证是否安装成功,打开cmd执行pyspark,成功如下:

  

6、配置pycharm,安装pycharm,此处不再详细描述

7、为pycharm安装 pyspark组件,file—>settings—>Project Interpreter

  

  安装组件pyspark

8、配置,环境,run—>Edit Configurations add Python,如下

    

  然后配置如下:

    SPARK_HOME :  D:\hadoop\spark-2.3.0-bin-hadoop2.7

    HADOOP_HOME : D:\hadoop\hadoop-2.9.0

    PYTHONPATH : D:\hadoop\spark-2.3.0-bin-hadoop2.7\python\lib\py4j-0.10.6-src.zip

    

9、然后就ok了

 

 

 

  

 

 

  

 

转载于:https://www.cnblogs.com/wind-man/p/8785380.html

你可能感兴趣的文章
CSS3 结构性伪类选择器(1)
查看>>
IOS 杂笔-14(被人遗忘的owner)
查看>>
自动测试用工具
查看>>
前端基础之BOM和DOM
查看>>
[T-ARA/筷子兄弟][Little Apple]
查看>>
编译Libgdiplus遇到的问题
查看>>
【NOIP 模拟赛】Evensgn 剪树枝 树形dp
查看>>
java学习笔记④MySql数据库--01/02 database table 数据的增删改
查看>>
两台电脑如何实现共享文件
查看>>
组合模式Composite
查看>>
程序员最想得到的十大证件,你最想得到哪个?
查看>>
我的第一篇CBBLOGS博客
查看>>
【MyBean调试笔记】接口的使用和清理
查看>>
07 js自定义函数
查看>>
jQueru中数据交换格式XML和JSON对比
查看>>
form表单序列化后的数据转json对象
查看>>
[PYTHON]一个简单的单元測试框架
查看>>
iOS开发网络篇—XML数据的解析
查看>>
[BZOJ4303]数列
查看>>
一般处理程序在VS2012中打开问题
查看>>