2014/06/04 11:26
情報・通信
インテグレーションソフトウェアのリーダーであるTalend株式会社(本社:東京都港区、代表取締役社長 有延 敬三)は、Apache Hadoop上でネイティブに稼働する統合基盤ソフトウェアの最新版「Talend 5.5」を発表します。
Talendのソフトウェアは、業界で唯一、全てのHadoopディストリビューション上で最高のパフォーマンスを提供できるように最適化されており最新版の「Talend 5.5」は、Hadoop上での処理性能を平均45%(Talend5.4との比較)向上しています。データ統合、データクレンジング処理、データマッピング処理などを高速に行えることにより、数ギガバイトの膨大かつ複雑なデータであってもHadoopクラスターにストリーミング連携・解析することも可能になり、ビッグデータのリアルタイムな活用をスムーズにします。
Hadoopの導入が急増する中、Hadoop開発者の不足が課題となっていますが、Talendのソフトウェア製品はMapReduceやPigに精通していない開発者でも、ビジュアル開発環境を使ったハイパフォーマンスでスケーラビリティの高いHadoopコードを生成する業界唯一のツールです。Talendのソフトウェア製品は、オープンソースモデルで開発されており、Hadoopなどの最先端技術のオープンソース開発コミュニティに積極的に参加しているため、新しい技術への対応スピードが早く、ユーザー企業の開発者は、Talendのソフトウェア製品を利用して最先端の技術を容易に活用することができます。
その一例として、「Talend 5.5」では、大規模データのクラスタコンピューティングフレームワークとして注目されているApache SparkをサポートしたTalendのソフトウェア製品をいちはやく開発者サイトで公開しました。
「Talend 5.5」のオープンソース版は、TalendのWebサイトから無償でダウンロード可能です。
また、商用製品は国内13社の販売パートナー経由で提供する予定です。販売予定日は準備が整い次第、弊社サイトなどでお知らせさせて頂く予定です。また、Spark用コンポーネント(試験版)を、Talendforge.orgのTalend Exchangeから無償でダウンロードできます。
TalendForge.org:http://talendforge.org
Talend Exchange:http://www.talendforge.org/exchange/
● TPC-Hテストで平均45%の性能向上
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
マッピングツールの性能向上により大規模ファイルのストリーミング処理も可能に
業界最高のパフォーマンスと、Hadoop上でネイティブに稼働する拡張性の高いソフトウェアコードで、使い易いビッグデータ統合ツールを提供するTalendは、Transaction Processing Performance Councilが開発したパフォーマンスベンチマークテストTPC-Hなど、パフォーマンス/スケーラビリティに関する厳しいテストを実施した上で全ての製品をリリースしています。最新版「Talend 5.5」は、TPC-Hテストの22項目において最大67%(Talend5.4比較)の性能向上を達成し、MapReduceコードの生成に関しては平均45%高速(Talend5.4比較)になりました。また、業界最大規模の金融サービス企業の1社と協業し、実環境におけるテストを実施した結果、1,000ノードのHadoopクラスターにおいて、高いスケーラビリティとパフォーマンスを示すことを実証しました。
「Talend 5.5」は、製品ライン全体において性能向上していますが、その1つの例が、XML、EDI やJava オブジェクトなどの複雑なデータを扱えるよう設計されたマッピングツール「Talend Data Mapper」です。データマッピングは、ヘルスケア業界におけるEDIや、Financial Product Markup Language (FPML)を使った銀行間での金融情報の伝達などに特に重要で、「Talend Data Mapper」の性能が向上したことで、数ギガバイトのドキュメントであってもHadoopクラスターにストリーミングできる能力を有し、あらゆる大規模ファイルをサポート可能となりました。
● Apache Sparkをサポートし、リアルタイム・ビッグデータの実現を加速
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
企業のビッグデータ活用の取り組みにおいて、データ解析は最初のステップであり、次のステップでは同時進行で発生する様々なトランザクションにリアルタイムに解析結果を渡して、意思決定の迅速化を図ることが求められます。
Talendの開発・研究組織であるTalend Labは、TalendのアライアンスパートナーであるAltic社と協業し、ハイボリューム、ハイスピードデータの取扱いに最適であり、不正取引監視やセンサーデータ処理などに活用できる最新技術であるApache Sparkをサポートしました。
Talendは、オープンソースビジネスモデルを踏襲し、オープンソース開発コミュニティに積極的に参加していることで、Hadoopの最新技術にいち早く対応して、Talend Studioに反映させています。これにより、Talendユーザーは、常にビッグデータの最新技術を容易に利用しながら、ビジネス価値の向上のための本来の業務に専念することができます。
◆ Talend 5.5 について
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇販売・出荷開始 : 2014年7月 (予定)
◇販売価格:190万円より
※上記価格は、1年間単位のサブスクリプションライセンスで、保守料金を含みます。
◇販売経路:Talend、および販売パートナー経由
◇対応OS:Linux(CentOS、Red Hat、SUSE、Ubuntu)、Oracle Solaris、Mac OS X、Microsoft Windows
◇商用製品 Talend Enterpriseシリーズ
* Talend Enterprise Data Integration V.5.5
* Talend Enterprise Big Data V. 5.5
* Talend Enterprise ESB V. 5.5
◇商用製品 Talend Platformシリーズ (上記製品をベースとする課題別ソリューション)
* Talend Platform for Big Data V. 5.5
* Talend Platform for Data Management V. 5.5
* Talend Platform for Data Services V. 5.5
* Talend Platform for Data Services with Big Data V. 5.5
* Talend Platform for Master Data Management V. 5.5
* Talend Platform for Master Data Management with Big Data V. 5.5
* Talend Platform for Enterprise Integration V. 5.5
* Talend Platform for Enterprise Integration with Big Data V. 5.5
◇オープンソース製品 Talend Open Studio シリーズ
* Talend Open Studio for Data Integration V. 5.5
* Talend Open Studio for Big Data V. 5.5
* Talend Open Studio for Data Quality V. 5.5
* Talend Open Studio for MDM V. 5.5
* Talend Open Studio for ESB V. 5.5
* Bonita BPM V.5.8
※オープンソース製品は、以下サイトから無償でダウンロード・利用が可能です。
http://jp.talend.com/download
………………………………………………………
Apache Spark
SparkはMapper、Reducer、JOIN、GROUP BY、フィルタなどの任意の演算子によってアプリケーションを書けるようにするプログラミングモデルです。この組み合わせにより、繰り返しの機械学習、ストリーミング、複雑なクエリ、そしてバッチなど幅広い領域を表現するのが簡単になります。また、Sparkは、演算子の各々が生成するデータを追跡し、 アプリケーションが確実にメモリ内にこのデータを保存できるようにします。これによりアプリケーションは高コストなディスクアクセスを避けることができます。Sparkの使いやすさは、ユーザーがたくさんのMapとReduce処理に縛られずにアプリケーションを構築できるというその一般的なプログラミングモデルから来ています。Sparkの並列プログラムは逐次プログラムに非常によく似ていて、それにより開発とレビューを簡単にすることができます。最後に、Sparkによりユーザーは単一のアプリケーションでバッチ処理、インタラクティブ処理、ストリーミングジョブを簡単に組み合わせることができます。その結果、SparkジョブはHadoopジョブに比べて1/2から1/10のコード量で最大で100倍もの速度で実行することができます。(出典:Cloudera社ホームページより)
………………………………………………………
Talendのソフトウェアは、業界で唯一、全てのHadoopディストリビューション上で最高のパフォーマンスを提供できるように最適化されており最新版の「Talend 5.5」は、Hadoop上での処理性能を平均45%(Talend5.4との比較)向上しています。データ統合、データクレンジング処理、データマッピング処理などを高速に行えることにより、数ギガバイトの膨大かつ複雑なデータであってもHadoopクラスターにストリーミング連携・解析することも可能になり、ビッグデータのリアルタイムな活用をスムーズにします。
Hadoopの導入が急増する中、Hadoop開発者の不足が課題となっていますが、Talendのソフトウェア製品はMapReduceやPigに精通していない開発者でも、ビジュアル開発環境を使ったハイパフォーマンスでスケーラビリティの高いHadoopコードを生成する業界唯一のツールです。Talendのソフトウェア製品は、オープンソースモデルで開発されており、Hadoopなどの最先端技術のオープンソース開発コミュニティに積極的に参加しているため、新しい技術への対応スピードが早く、ユーザー企業の開発者は、Talendのソフトウェア製品を利用して最先端の技術を容易に活用することができます。
その一例として、「Talend 5.5」では、大規模データのクラスタコンピューティングフレームワークとして注目されているApache SparkをサポートしたTalendのソフトウェア製品をいちはやく開発者サイトで公開しました。
「Talend 5.5」のオープンソース版は、TalendのWebサイトから無償でダウンロード可能です。
また、商用製品は国内13社の販売パートナー経由で提供する予定です。販売予定日は準備が整い次第、弊社サイトなどでお知らせさせて頂く予定です。また、Spark用コンポーネント(試験版)を、Talendforge.orgのTalend Exchangeから無償でダウンロードできます。
TalendForge.org:http://talendforge.org
Talend Exchange:http://www.talendforge.org/exchange/
● TPC-Hテストで平均45%の性能向上
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
マッピングツールの性能向上により大規模ファイルのストリーミング処理も可能に
業界最高のパフォーマンスと、Hadoop上でネイティブに稼働する拡張性の高いソフトウェアコードで、使い易いビッグデータ統合ツールを提供するTalendは、Transaction Processing Performance Councilが開発したパフォーマンスベンチマークテストTPC-Hなど、パフォーマンス/スケーラビリティに関する厳しいテストを実施した上で全ての製品をリリースしています。最新版「Talend 5.5」は、TPC-Hテストの22項目において最大67%(Talend5.4比較)の性能向上を達成し、MapReduceコードの生成に関しては平均45%高速(Talend5.4比較)になりました。また、業界最大規模の金融サービス企業の1社と協業し、実環境におけるテストを実施した結果、1,000ノードのHadoopクラスターにおいて、高いスケーラビリティとパフォーマンスを示すことを実証しました。
「Talend 5.5」は、製品ライン全体において性能向上していますが、その1つの例が、XML、EDI やJava オブジェクトなどの複雑なデータを扱えるよう設計されたマッピングツール「Talend Data Mapper」です。データマッピングは、ヘルスケア業界におけるEDIや、Financial Product Markup Language (FPML)を使った銀行間での金融情報の伝達などに特に重要で、「Talend Data Mapper」の性能が向上したことで、数ギガバイトのドキュメントであってもHadoopクラスターにストリーミングできる能力を有し、あらゆる大規模ファイルをサポート可能となりました。
● Apache Sparkをサポートし、リアルタイム・ビッグデータの実現を加速
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
企業のビッグデータ活用の取り組みにおいて、データ解析は最初のステップであり、次のステップでは同時進行で発生する様々なトランザクションにリアルタイムに解析結果を渡して、意思決定の迅速化を図ることが求められます。
Talendの開発・研究組織であるTalend Labは、TalendのアライアンスパートナーであるAltic社と協業し、ハイボリューム、ハイスピードデータの取扱いに最適であり、不正取引監視やセンサーデータ処理などに活用できる最新技術であるApache Sparkをサポートしました。
Talendは、オープンソースビジネスモデルを踏襲し、オープンソース開発コミュニティに積極的に参加していることで、Hadoopの最新技術にいち早く対応して、Talend Studioに反映させています。これにより、Talendユーザーは、常にビッグデータの最新技術を容易に利用しながら、ビジネス価値の向上のための本来の業務に専念することができます。
◆ Talend 5.5 について
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
◇販売・出荷開始 : 2014年7月 (予定)
◇販売価格:190万円より
※上記価格は、1年間単位のサブスクリプションライセンスで、保守料金を含みます。
◇販売経路:Talend、および販売パートナー経由
◇対応OS:Linux(CentOS、Red Hat、SUSE、Ubuntu)、Oracle Solaris、Mac OS X、Microsoft Windows
◇商用製品 Talend Enterpriseシリーズ
* Talend Enterprise Data Integration V.5.5
* Talend Enterprise Big Data V. 5.5
* Talend Enterprise ESB V. 5.5
◇商用製品 Talend Platformシリーズ (上記製品をベースとする課題別ソリューション)
* Talend Platform for Big Data V. 5.5
* Talend Platform for Data Management V. 5.5
* Talend Platform for Data Services V. 5.5
* Talend Platform for Data Services with Big Data V. 5.5
* Talend Platform for Master Data Management V. 5.5
* Talend Platform for Master Data Management with Big Data V. 5.5
* Talend Platform for Enterprise Integration V. 5.5
* Talend Platform for Enterprise Integration with Big Data V. 5.5
◇オープンソース製品 Talend Open Studio シリーズ
* Talend Open Studio for Data Integration V. 5.5
* Talend Open Studio for Big Data V. 5.5
* Talend Open Studio for Data Quality V. 5.5
* Talend Open Studio for MDM V. 5.5
* Talend Open Studio for ESB V. 5.5
* Bonita BPM V.5.8
※オープンソース製品は、以下サイトから無償でダウンロード・利用が可能です。
http://jp.talend.com/download
………………………………………………………
Apache Spark
SparkはMapper、Reducer、JOIN、GROUP BY、フィルタなどの任意の演算子によってアプリケーションを書けるようにするプログラミングモデルです。この組み合わせにより、繰り返しの機械学習、ストリーミング、複雑なクエリ、そしてバッチなど幅広い領域を表現するのが簡単になります。また、Sparkは、演算子の各々が生成するデータを追跡し、 アプリケーションが確実にメモリ内にこのデータを保存できるようにします。これによりアプリケーションは高コストなディスクアクセスを避けることができます。Sparkの使いやすさは、ユーザーがたくさんのMapとReduce処理に縛られずにアプリケーションを構築できるというその一般的なプログラミングモデルから来ています。Sparkの並列プログラムは逐次プログラムに非常によく似ていて、それにより開発とレビューを簡単にすることができます。最後に、Sparkによりユーザーは単一のアプリケーションでバッチ処理、インタラクティブ処理、ストリーミングジョブを簡単に組み合わせることができます。その結果、SparkジョブはHadoopジョブに比べて1/2から1/10のコード量で最大で100倍もの速度で実行することができます。(出典:Cloudera社ホームページより)
………………………………………………………