Amazon Redshiftとは
『Amazon Redshift』とはどのようなものなのでしょうか?まずは、概要や従来のサービスとの違いについて見ていきましょう。
AWSの機能の一つ
Amazon Redshiftは『AWS』(AmazonWebService)の一つです。AWSは、Amazonが提供しているクラウドサービスを指します。
AWSは、データの管理やITインフラの整備、アプリケーションの管理・運営などをオンライン上で行うサービスのことです。Amazonが自社の商品情報や在庫を管理するためのシステムを、外部に公開したことが始まりです。
AWSはとにかくサービスの種類が豊富で、『SHARP』や『docomo』などの一流企業も利用しています。
規模拡大にも対応できるデータウェアハウス
Amazon Redshiftは、AWSが提供している『データウェアハウス』です。データウェアハウスとは、さまざまなデータ源からデータの収集・分析を行うサービスです。
例えば、コンビニの売り上げのデータの中から『雨の日にもっとも売れる商品』や『30代男性がもっとも多く購入しているおにぎりの種類』など、単純な数値では見つからないデータを、わかりやすく洗い出すことができます。
Amazon Redshiftは、従来のデータウェアハウスのおよそ10倍の速さで、この処理を実現できると言われているほどの高性能を誇っているのです。
データウェアハウスとデータベースの違い
データウェアハウスという言葉と似た意味で、『データベース』という言葉があります。この二つの言葉の違いはなんでしょうか?それは、データウェアハウスが過去のデータを保管するのに対し、データベースは現在使っているデータを蓄積していくサービスだという点です。
例えば、コンビニのレジ内には、購入記録が保管され続けます。しかし、商品の検索などはできても、細かく分析できるわけではありません。また、ある程度データが蓄積されれば過去のデータも消えてしまいます。これは、コンビニのレジ内の記録がデータベースによって管理されているからです。
一方、データウェアハウスによる管理は、Amazonの倉庫に見られるように、新しい情報が更新されたからといって、古い情報を消すことはまずありません。さらに、どこにどんな商品があるのか、どのような商品が売れているのかを詳しく分析することもできます。
現在のデータを蓄積しておくデータベースに対し、データウェアハウスは膨大なデータを管理する倉庫のようなものだと考えてください。
Amazon Redshiftの特徴
データウェアハウスをサービスとして提供している企業はAmazonだけではありません。それらの企業のデータウェアハウスと比較して、Amazon Redshiftにはどのような特徴があるのかを見ていきましょう。
クラウド上にあること
Amazon Redshiftは、クラウド上に構築されているというのが大きな特徴です。つまり、データの管理をAmazonが行っているという点で、大きなメリットを得ることができます。
何らかのトラブルで自社のデータが破損したとしても、元のデータはAmazonが管理しているため運用に問題はありません。自社のセキュリティに不満があったとしても、実際に利用されるのはAmazonの高度なセキュリティです。データの盗難や流出への対策という面でのメリットがあるのです。
高速で費用対効果が高い
データウェアハウスは、分析や整理の処理が早いのも特徴です。従来のデータベースと比較し、Amazon Redshiftは10倍のパフォーマンスを実現するとされています。
これは、従来のデータベースとは異なりデータを列で管理していることや、それによってデータの圧縮率が高いこと、データの処理を複数のノードによって並列処理していることが要因です。
また、これらの機能によって、Amazon Redshiftでは他のデータウェアハウスと比べて利用時間や容量が大きく削減できます。Amazon Redshiftは実際に利用した分だけコストがかかる仕様なので、同量のデータでも他のサービスと比べてかなりのコストダウンが見込めるのです。
SQL対応
SQLに対応しているのも、Amazon Redshiftの利点でしょう。
SQLとは、データベースやデータウェアハウスとやりとりをするための言語のことです。SQLは多くの企業が利用しているメジャーな言語なので、Amazon Redshift以外のデータベースやソフトとの連携がしやすくなっています。
数値の抽出や、細かい分析も、SQLを使って行うことが可能です。
Amazon Redshiftの導入方法
Amazon Redshiftを実際に導入する方法について解説していきます。次の手順に従って実行してください。
AWSアカウント作成
まずは、AWSのアカウントを作成します。アカウント未作成の場合は、下記リンクから作成してください。
個人情報の入力や支払い方法の選択など、情報の入力が求められます。なお、表示されたページが日本語以外の場合は、右上の『言語選択ボックス』から日本語を選択してください。
情報入力が終わったら登録したメールアドレスにAWSからメールが送られてきますので、メール内のリンクからサインインすればアカウントの作成は完了です。
Amazon S3にデータを格納
AWSにサインインした後は、Amazonのクラウドストレージサービスである『Amazon S3』にバケットを作成します。
バケットはPCでいうフォルダのようなもので、これを作成しないとデータを格納することができません。マネジメントコンソールの中に『バケットの作成』というコマンドがあるので、クリックしてください。
バケットが作成されたら、バケット内に実際にデータを格納します。『アクション』の中にある『アップロード』を選択し、『ファイルの追加』からアップロードしたいファイルを選択しましょう。
ファイルが表示されれば、データの格納作業は完了です。
無料トライアルが可能
Amazon Redshiftは基本的に有料ですが、750時間の無料トライアルを利用して、使い勝手を試すことができます。
基本的には2カ月間試すことができますが、複数のクラスター(処理システム)を使うと、無料時間の消費が早くなります。初めてAmazon Redshiftでクラスターを作成すると、自動的にトライアルに移行します。
Amazon Redshiftの料金
Amazon Redshiftを本格的に利用する場合の、料金体系について紹介します。
料金体系は二つ
Amazon Redshiftには二つの料金体系があります。
一つは『オンデマンド料金』です。これはクラスターのノードとタイプによって、1時間あたりに支払う料金を決める方式です。ノードの数が増えればそれだけ料金も増額されます。初期費用はかかりません。
もう一つは『リザーブドインスタンスの料金』と呼ばれるタイプで、1年もしくは3年間の契約を結ぶ方式です。『前払いなし』『一部前払い』『全前払い』の三つの支払い方法が選択可能で、全前払いを選んだ場合、3年で最大75%の割引になるのが特徴です。
利用状況に応じた選択が可能
料金体系については、利用状況に応じた選択が可能です。必要なストレージの容量やCPUによってプランを細かく選ぶことができるほか、一時的に容量を増やして大規模な処理を行う同時実行スケーリングについても、別途料金を払うことで対応できるようになります。
他にも、データの保存形式により料金を安くできるなど、使い方次第でコストを削減することが可能です。
従来型と比べて費用面のメリットが大きい
従来のデータベースと比較しても、費用面で大きなメリットがあります。まず、Amazon Redshiftはクラウド型のサービスのため、メンテナンスやサーバーの用意はすべてAmazonが行います。これらに関する費用が一切かかりません。
また、データウェアハウスを導入するにあたって、従来のタイプでは費用に融通がきかず、わずか数TBの容量でも億単位の費用がかかることもあります。その点、使い方や料金プランの選択の幅が広いAmazon Redshiftでは、運用コストを大きく抑えることが可能です。
Amazon Redshiftで実現できること
Amazon Redshiftを使うと、実際にどんなことができるのでしょうか?Amazon Redshiftの用途について解説します。
きめ細かいマーケティング
ユーザーのニーズにいち早く応えるために、きめ細やかなマーケティングが必要な際にAmazon Redshiftは力を発揮します。
日本たばこ産業株式会社の例を見てみましょう。たばこは、規制強化や値上げによる売り上げ低下を防止するために、より精度の高いマーケティング施策やキャンペーンが必要です。
しかし、取り扱うデータ量があまりにも多いことから、データ収集を終える頃にはキャンペーンが終わっていたというケースもあったそうです。
Amazon Redshiftを導入したことで新たな分析基盤が構築され、データの処理速度が大きく向上したことにより、より効果的なキャンペーンの実施やマーケティング施策が行えるようになったといいます。
柔軟な運用が可能
他のツールからAmazon Redshiftへ移行する際や、新たなツールを導入する際にも対応しやすい、柔軟な運用が強みです。
株式会社ビデオリサーチでは、社内のデータベースをAmazon Redshiftに移行する際に想定していた、他システムとの連携やリソース対応などを、すべて容易にクリアできたそうです。
リソースはコンソール画面を数クリックするだけで増やせるほか、SQLによって他のソフトとの連携も簡単に行えます。従来のデータウェアハウスにはない柔軟性も、Amazon Redshiftの強みと言えるでしょう。
まとめ
Amazon Redshiftは、クラウドを利用した新時代のデータウェアハウスです。処理速度が既存のデータウェアハウスよりも10倍以上も早く、メンテナンスや初期費用がかからない点から、コストを大幅に削減できます。データ移行やカスタマイズについても問題なく行える柔軟性もあります。
大規模なデータの管理や運用が必要になった場合、Amazon Redshiftの利用を検討してみてはいかがでしょうか。