Hadoop

Hiveで、HDFS上にファイルがあるにもかかわらず、FileNotFoundException

Hiveのクエリを実行するバッチが異常終了してしまう。stderrのログにある、jobtrackerのページのURLをブラウザで開いて、そのページから、さらにFailedのリンクのページを開いて、Hadoopの、いくつかのDataNodeでFileNotFoundExceptionが発生していたことが…

HiveのLOAD DATAでtsvファイルを読み込んだら1列に1行分のすべての列が登録される。

LOAD DATAでtsvファイルを読み込んだら1列に1行分のすべての列が登録される。LOADしたあとで、selectしてみると、select col1 from table limit 100;この結果が、col1に、col1からcol8までの値が登録されてしまっている。つまり、col1に1行分のデータが登録…

Hiveでクエリを実行するとNullPointerException

Hiveでクエリを実行するとNullPointerExceptionがでて悩んでいた。SUM関数を使っているのに、GROUP BYを書き忘れていたせいだった。とほほ。

Hadoop リンク

オープンソースのSQL-in-Hadoopソリューション:我々はいまどこに?Hadoop初のメージャーバージョンアップ「Hadoop 2」正式版が公開。MapReduce以外の分散処理フレームワークも実行可能に - PublickeyYouTubeHadoop運用管理の今―その2 Cloudera Managerを使…