2010年7月10日土曜日

速いと噂のETLツール「Syncsort DMExpress」

このエントリーを含むはてなブックマーク はてなブックマークに追加 Add to Delicious Bookmark この記事をクリップ! Googleブックマークへ追加 Digg


今回はETLツールである「Syncsort DMExpress」のレビューをしていきたいと思います。
そもそもETLツールというのは、Extract/Transform/Loadと3つの単語の頭文字を並べただけの単純な言葉なのですが、日本語にするとデータを取ってきて、加工して、対象となるデータベースに書き出すだけです。

そのETLですが有名なところでは
talendのオープンソースTalend Integration Suite(Talendによれば、同社製品のダウンロード数は1500万件、ユーザー数は30万、顧客数は約1000社に達しているという。)
IBMのDataStage
InformaticaのPowerCenterなど

そして今回は米国Syncsort社が開発し、日本ではアシストが販売している高速データ加工ツール「Syncsort DMExpress」をレビューしてきます。
アイコンをF1風にしているだけあって世界最速です。
2006年に1時間で3.9Tバイトを記録した、SunのサーバによるSASのEnterprise Data Integration Serverを上回り1.6ギガバイト/1秒を達成しています。
単位を直すと、1時間で5.76Tバイトにもなります。
また、価格は、最小構成で168万円からで、CPU追加毎に60万円となっております。

そして使い方ですが、まずはタスクエディタというツールを使いデータを取ってきます。
ここでデータソースを選択し、使用するテーブルを選びます。
データソースはODBCなどの接続方法が選べ、市販のOracleやSQLServerなども選べます。また親切なことにHelpが日本語で分かりやすいです。インターネットでマニュアルを探してもあまり出てこないので、Helpを見るほうが早いと思います。

またデータベースのテーブルを選択し、使いたいカラムを選ぶことができます。

これでExtract/Transform/LoadのExtractは終わりです。
次はTransformですが、これはジョブエディタというツールを使用します。
これについてはまた後日


続き:ETLツール「Syncsort DMExpress」2

0 件のコメント: