Hive

Hiveで、HDFS上にファイルがあるにもかかわらず、FileNotFoundException

Hiveのクエリを実行するバッチが異常終了してしまう。stderrのログにある、jobtrackerのページのURLをブラウザで開いて、そのページから、さらにFailedのリンクのページを開いて、Hadoopの、いくつかのDataNodeでFileNotFoundExceptionが発生していたことが…

HiveのLOAD DATAでtsvファイルを読み込んだら1列に1行分のすべての列が登録される。

LOAD DATAでtsvファイルを読み込んだら1列に1行分のすべての列が登録される。LOADしたあとで、selectしてみると、select col1 from table limit 100;この結果が、col1に、col1からcol8までの値が登録されてしまっている。つまり、col1に1行分のデータが登録…

Hiveでクエリを実行するとNullPointerException

Hiveでクエリを実行するとNullPointerExceptionがでて悩んでいた。SUM関数を使っているのに、GROUP BYを書き忘れていたせいだった。とほほ。