it-roy-ru.com

Почему spark-Shell не работает с NullPointerException?

Я пытаюсь выполнить spark-Shell в Windows 10, но получаю эту ошибку каждый раз, когда запускаю ее.

Я использовал как последнюю версию, так и версию spark-1.5.0-bin-hadoop2.4.

15/09/22 18:46:24 WARN Connection: BoneCP specified but not present in     
CLASSPATH (or one of dependencies)
15/09/22 18:46:24 WARN Connection: BoneCP specified but not present in                 CLASSPATH (or one of dependencies)
15/09/22 18:46:27 WARN ObjectStore: Version information not found in    
metastore. Hive.metastore.schema.verification is not enabled so recording the schema version 1.2.0
15/09/22 18:46:27 WARN ObjectStore: Failed to get database default, returning NoSuchObjectException
15/09/22 18:46:27 WARN : Your hostname, DESKTOP-8JS2RD5 resolves to a loopback/non-reachable address: fe80:0:0:0:0:5efe:c0a8:103%net1, but we couldn't find any external IP address!
Java.lang.RuntimeException: Java.lang.NullPointerException
    at org.Apache.hadoop.Hive.ql.session.SessionState.start(SessionState.Java:522)
    at org.Apache.spark.sql.Hive.client.ClientWrapper.<init>    (ClientWrapper.scala:171)
    at org.Apache.spark.sql.Hive.HiveContext.executionHive$lzycompute(HiveContext.scala    :163)
    at org.Apache.spark.sql.Hive.HiveContext.executionHive(HiveContext.scala:161)
    at org.Apache.spark.sql.Hive.HiveContext.<init>(HiveContext.scala:168)
    at Sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
    at Sun.reflect.NativeConstructorAccessorImpl.newInstance(Unknown Source)
    at Sun.reflect.DelegatingConstructorAccessorImpl.newInstance(Unknown Source)
    at Java.lang.reflect.Constructor.newInstance(Unknown Source)
    at org.Apache.spark.repl.SparkILoop.createSQLContext(SparkILoop.scala:1028)
    at $iwC$$iwC.<init>(<console>:9)
    at $iwC.<init>(<console>:18)
    at <init>(<console>:20)
    at .<init>(<console>:24)
    at .<clinit>(<console>)
    at .<init>(<console>:7)
    at .<clinit>(<console>)
    at $print(<console>)
    at Sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at Sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)
    at Sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)
    at Java.lang.reflect.Method.invoke(Unknown Source)
    at org.Apache.spark.repl.SparkIMain$ReadEvalPrint.call(SparkIMain.scala:1065)
    at org.Apache.spark.repl.SparkIMain$Request.loadAndRun(SparkIMain.scala:1340)
    at org.Apache.spark.repl.SparkIMain.loadAndRunReq$1(SparkIMain.scala:840)
    at org.Apache.spark.repl.SparkIMain.interpret(SparkIMain.scala:871)
    at org.Apache.spark.repl.SparkIMain.interpret(SparkIMain.scala:819)
    at org.Apache.spark.repl.SparkILoop.reallyInterpret$1(SparkILoop.scala:857)
    at org.Apache.spark.repl.SparkILoop.interpretStartingWith(SparkILoop.scala:902)
    at org.Apache.spark.repl.SparkILoop.command(SparkILoop.scala:814)
    at org.Apache.spark.repl.SparkILoopInit$$anonfun$initializeSpark$1.apply(SparkILoopInit.scala:132)
    at org.Apache.spark.repl.SparkILoopInit$$anonfun$initializeSpark$1.apply(SparkILoopInit.scala:124)
    at org.Apache.spark.repl.SparkIMain.beQuietDuring(SparkIMain.scala:324)
    at org.Apache.spark.repl.SparkILoopInit$class.initializeSpark(SparkILoopInit.scala:124)
    at org.Apache.spark.repl.SparkILoop.initializeSpark(SparkILoop.scala:64)
    at org.Apache.spark.repl.SparkILoop$$anonfun$org$Apache$spark$repl$SparkILoop$$process$1$$anonfun$apply$mcZ$sp$5.apply$mcV$sp(SparkILoop.scala:974)
    at org.Apache.spark.repl.SparkILoopInit$class.runThunks(SparkILoopInit.scala:159)
    at org.Apache.spark.repl.SparkILoop.runThunks(SparkILoop.scala:64)
    at org.Apache.spark.repl.SparkILoopInit$class.postInitialization(SparkILoopInit.sca      la:108)
    at org.Apache.spark.repl.SparkILoop.postInitialization(SparkILoop.scala:64)
    at org.Apache.spark.repl.SparkILoop$$anonfun$org$Apache$spark$repl$SparkILoop$$proc      ess$1.apply$mcZ$sp(SparkILoop.scala:991)
    at org.Apache.spark.repl.SparkILoop$$anonfun$org$Apache$spark$repl$SparkILoop$$proc      ess$1.apply(SparkILoop.scala:945)
    at org.Apache.spark.repl.SparkILoop$$anonfun$org$Apache$spark$repl$SparkILoop$$proc      ess$1.apply(SparkILoop.scala:945)
    at scala.tools.nsc.util.ScalaClassLoader$.savingContextLoader(ScalaClassLoader.scal      a:135)
    at org.Apache.spark.repl.SparkILoop.org$Apache$spark$repl$SparkILoop$$process(SparkILoop.scala:945)
    at org.Apache.spark.repl.SparkILoop.process(SparkILoop.scala:1059)
    at org.Apache.spark.repl.Main$.main(Main.scala:31)
    at org.Apache.spark.repl.Main.main(Main.scala)
    at Sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at Sun.reflect.NativeMethodAccessorImpl.invoke(Unknown Source)
    at Sun.reflect.DelegatingMethodAccessorImpl.invoke(Unknown Source)
    at Java.lang.reflect.Method.invoke(Unknown Source)
    at org.Apache.spark.deploy.SparkSubmit$.org$Apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:672)
    at org.Apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:180)
    at org.Apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:205)
    at org.Apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:120)
    at org.Apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
  Caused by: Java.lang.NullPointerException
    at Java.lang.ProcessBuilder.start(Unknown Source)
    at org.Apache.hadoop.util.Shell.runCommand(Shell.Java:445)
    at org.Apache.hadoop.util.Shell.run(Shell.Java:418)
    at org.Apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.Java:650)
    at org.Apache.hadoop.util.Shell.execCommand(Shell.Java:739)
    at org.Apache.hadoop.util.Shell.execCommand(Shell.Java:722)
    at org.Apache.hadoop.fs.FileUtil.execCommand(FileUtil.Java:1097)
    at org.Apache.hadoop.fs.RawLocalFileSystem$DeprecatedRawLocalFileStatus.loadPermissionInfo(RawLocalFileSystem.Java:559)
    at org.Apache.hadoop.fs.RawLocalFileSystem$DeprecatedRawLocalFileStatus.getPermission(RawLocalFileSystem.Java:534)
   org.Apache.hadoop.Hive.ql.session.SessionState.createRootHDFSDir(SessionState.Java:599)
    at org.Apache.hadoop.Hive.ql.session.SessionState.createSessionDirs(SessionState.Java:554)

org.Apache.hadoop.Hive.ql.session.SessionState.start (SessionState.Java:508) ... еще 56

  <console>:10: error: not found: value sqlContext
               import sqlContext.implicits._
                ^
  <console>:10: error: not found: value sqlContext
               import sqlContext.sql
                ^
36
Nick

Я использовал Spark 1.5.2 с Hadoop 2.6 и у меня были похожие проблемы. Решаем, выполняя следующие шаги:

  1. Загрузите winutils.exe из хранилища в некоторую локальную папку, например C:\hadoop\bin.

  2. Установите HADOOP_HOME в C:\hadoop.

  3. Создайте каталог c:\tmp\Hive (используя Windows Explorer или любой другой инструмент).

  4. Откройте командную строку с правами администратора.

  5. Запустите C:\hadoop\bin\winutils.exe chmod 777 /tmp/Hive

С этим я все еще получаю некоторые предупреждения, но никаких ОШИБОК и могу нормально запускать приложения Spark.

46
max

Я столкнулся с подобной проблемой, и решил ее, поместив winutil в папку bin. Hadoop_home должен быть установлен как C:\Winutils, а winutil должен быть помещен в C:\Winutils\bin.

Windows 10 64-битных Winutils доступны в https://github.com/steveloughran/winutils/tree/master/hadoop-2.6.0/bin

Также убедитесь, что у командной строки есть административный доступ. 

См. https://wiki.Apache.org/hadoop/WindowsProblems

5
user6567143

Я предполагаю, что вы столкнулись с https://issues.Apache.org/jira/browse/SPARK-10528 . Я видел ту же проблему в Windows 7. Изначально я получал исключение NullPointerException, как и вы. Когда я поместил winutils в каталог bin и установил HADOOP_HOME, чтобы он указывал на каталог Spark, я получил сообщение об ошибке, описанное в проблеме JIRA.

3
Michael Pigg

Или, может быть, по этой ссылке ниже будет легче следовать, 

https://wiki.Apache.org/hadoop/WindowsProblems

Загрузите и скопируйте файл winutils.exe в папку «spark\bin». Повторно запустить Спарк-Шелл

Если вы не установили свой/tmp/Hive в доступное для записи состояние, сделайте это. 

2
kepung

Для Python - Создайте SparkSession в вашем Python (этот раздел конфигурации только для Windows)

spark = SparkSession.builder.config("spark.sql.warehouse.dir", "C:/temp").appName("SparkSQL").getOrCreate()

Скопируйте winutils.exe и сохраните в C:\winutils\bin и выполните приведенные ниже команды

C:\Windows\system32>C:\winutils\bin\winutils.exe chmod 777 C:/temp

Запустить командную строку в режиме ADMIN (Запуск от имени администратора)

1
Sachin Sukumaran

Вам нужно дать разрешение на каталог/tmp/Hive для разрешения этого исключения.

Надеюсь, у вас уже есть winutils.exe и установлена ​​переменная окружения HADOOP_HOME. Затем откройте командную строку и выполните следующую команду от имени администратора:

Если файл winutils.exe находится в папке D:\winutils\bin, а \ tmp\Hive также находится на диске D:

D:\winutils\bin\winutils.exe chmod 777 D:\tmp\Hive

Для более подробной информации, вы можете обратиться по следующим ссылкам:

Частые проблемы произошли во время разработки Spark
Как запустить Apache Spark на Windows7 в автономном режиме

1
Nishu Tayal

Моя проблема заключалась в том, что в папке winutils/bin были другие .exe's/Jars. Поэтому я очистил все остальные и остался с одним только файлом winutils.exe. Использовал искру 2.1.1

0
JKMburu

Вы можете решить эту проблему, поместив mysqlconnector jar в папку spark-1.6.0/libs и перезапустите его снова. Это работает.

Важно то, что вместо запуска spark-Shell вы должны сделать

spark-Shell --driver-class-path /home/username/spark-1.6.0-libs-mysqlconnector.jar

Надеюсь, это сработает.

0
Deepak m

В Windows нужно клонировать "winutils"

git clone https://github.com/steveloughran/winutils.git

А также

set var HADOOP_HOME to DIR_CLONED\hadoop-{version}

Не забудьте выбрать версию вашего hadoop. 

0
user2590261

Проблема была решена после установки правильной версии Java в моем случае ее Java 8 и установки переменных среды. Убедитесь, что вы запустите winutils.exe, чтобы создать временный каталог, как показано ниже.

c:\winutils\bin\winutils.exe chmod 777 \tmp\Hive

Выше не должно возвращаться ни одной ошибки. Используйте Java -version, чтобы проверить версию Java, которую вы используете, прежде чем вызывать spark-Shell.

0
ashwin kumar