Tomo's IT Blog

技術的な調査メモ

spark

Apache Sparkの勉強-Clusterを構成してみよう!spark-ec2スクリプトでクラスタ簡単構築

今日は、自動でec2インスタンスを作成してSpark Clusterを構成してくれるspark-ec2ツールを利用してクラスタを構成してみます。正式なサイトは以下です。こちらに書かれている内容に沿って実施してみます。github.com ツールの概要 spark-ec2は、Apache Spar…

Apache Sparkの勉強-Clusterを構成してみよう!クラスタ起動スクリプトで一発起動してみる

前回は、SparkのStandaloneクラスタを手動スクリプトで構築して、対話シェルで動作を確認してみました。tmnj.hatenablog.com 今回は、クラスタ起動スクリプトを使用してスクリプト一発実行するだけでSparkがクラスタ構成で起動する方法を実施してみたいと思…

Apache Sparkの勉強-Clusterを構成してみよう!Standaloneクラスタ編

前回は、Apache SparkのQuick Guideを読み進めて、Sparkの動作を実際に確認してみました。 tmnj.hatenablog.com tmnj.hatenablog.com 今回は、Sparkのクラスタ構成に挑戦してみたいと思います。 まずは以下のドキュメントでClusterの概要を理解します。Clust…

Apache Sparkの勉強-実際に動かしてRDDを操作してみよう (2)

前回は、対話的にシェルを実行してRDDの操作を試してみました。tmnj.hatenablog.com 今回も、以下のQuick Startを元に続きを進めていきたいと思います。Quick Start - Spark 2.0.2 Documentation キャッシュしてみよう! Sparkはキャッシュ機能を有しており…

Apache Sparkの勉強-実際に動かしてRDDを操作してみよう

前回は、Apache Sparkのトップページを眺めて超概要を勉強しました。tmnj.hatenablog.com Apache Sparkってなに?と聞かれたら、「高度なDAG実行エンジンを備えた大規模データ高速処理基盤だよ!Hadoopより100倍速いよ!いろんな言語を使えるし、便利な拡張…

Apache Sparkの勉強-超概要を理解する

Apache Sparkを基礎から勉強していきます。 基本的にはドキュメントを読み進めながら動作を確認していこうと思います。 まずはトップページを読んでみよう Apache SparkのトップページApache Spark™ - Lightning-Fast Cluster Computingここを見れば、そもそ…

AWS EC2インスタンスを試す- その3:EC2インスタンス作成

前回は、EC2インスタンス作成のための準備をしました。tmnj.hatenablog.com今回は、EC2インスタンス作成まで実施します。 今回は、m4.xlarge×3インスタンスを作成してみたいと思います。 Amazon EBS-backed インスタンスとは EC2インスタンス作成 AMIの選択

AWS EC2インスタンスを試す- その1:EC2調査編

目的 AWS EC2調査 EC2インスタンスタイプとは? 料金を確認してみる スポットインスタンスとは? 補足:ECUとは? EC2インスタンスの作成 目的 よく、仕事柄いろいろなソフトウェアの検証を実施しますが、今後はEC2を活用して簡単かつスピーディーに検証環境…