Car-tech

Cloudera Preps Hadoop untuk Perusahaan

Making Self-Service BI a Reality with Cloudera's Analytic Database

Making Self-Service BI a Reality with Cloudera's Analytic Database
Anonim

Cloudera telah meluncurkan seperangkat alat manajemen Hadoop baru, yang disebut Cloudera Enterprise, bahwa perusahaan akan menawarkan biaya berlangganan tahunan, diumumkan pada hari Selasa. Ini juga telah memperbarui paket distribusi open-source dari Hadoop.

Baik rilis baru, serta beberapa kemitraan baru dengan penyedia vendor perangkat lunak manajemen data, menunjukkan perusahaan yang bersiap untuk menawarkan teknologi database yang muncul - sekarang banyak digunakan oleh raksasa Web seperti Google dan Yahoo - ke pasar perusahaan sebagai alternatif untuk database relasional.

"Taruhan kami bukan hanya perusahaan-perusahaan Web besar, tetapi bank, rumah sakit dan perusahaan asuransi akan menemukan bahwa mereka perlu menganalisa kompleks dan terstruktur data bersama, dan Hadoop dibuat untuk itu, "kata CEO Cloudera, Mike Olson. "Hadoop memecahkan masalah baru, dengan cara yang baru."

Salah satu dari semakin banyak database non-SQL, atau NoSQL, Hadoop didasarkan dari Google MapReduce, kerangka kerja untuk memproses data secara paralel di sejumlah besar komputer node. Hadoop, sekarang sedang dikembangkan sebagai proyek open-source oleh Apache Software Foundation, menawarkan alternatif untuk database relasional tradisional, setidaknya untuk kasus-kasus menganalisis besar, dengan cepat mengubah set data.

Dapat bekerja dengan SQL dan non -SQL data, dan lebih tahan terhadap kegagalan server dari database relasional, kata Olson.

Cloudera adalah kemasan Hadoop untuk organisasi tingkat menengah, baik dengan distribusi Hadoop, dan seperangkat alat manajemen yang baru dirilis. Kedua paket harus memungkinkan organisasi tanpa banyak pengalaman teknis mendalam di Hadoop untuk menjalankan perangkat lunak, kata Olson. "Ada mitos bahwa Hadoop dapat digunakan jika Anda memiliki data skala Google. Ada banyak pengguna yang hanya memiliki beberapa terabyte data yang ingin mereka analisis," kata Olson.

Distribusi Cloudera untuk Hadoop (CDH) adalah paket open-source dari program perangkat lunak pra-terintegrasi yang dibangun di sekitar Hadoop Common, yang sebelumnya bernama Hadoop Core. Paket termasuk: Hive, yang menyediakan infrastruktur data warehouse; HBase, database yang mendasari Hadoop; Babi, kompilator untuk program peta-mengurangi; Zookeper, penjadwalan untuk menjalankan aplikasi di beberapa server, dan MapReduce.

Dalam versi 3 yang baru dirilis, paket ini menyertakan tiga program yang telah dirilis oleh perusahaan sebagai proyek sumber terbuka, di bawah lisensi open source Apache V2. Salah satunya adalah Flume, yang dapat membantu pemuatan data ke Hadoop. Tambahan baru lainnya adalah Oozie, yang merupakan perangkat lunak manajemen alur kerja. Yang terakhir adalah kode Hadoop User Environment (HUE), yang menyediakan antarmuka pengguna untuk mengelola Hadoop.

"HUE memungkinkan siapa pun untuk membangun aplikasi yang ditargetkan pada analis. Ia tahu cara berbicara dengan kelompok Hadoop," kata Olson.

Paket Cloudera Enterprise menambah CDH versi 3 dengan alat manajemen tambahan. Perangkat lunak baru ini, yang bukan sumber terbuka, memungkinkan administrator untuk mengontrol manajemen akses melalui penggunaan Protokol Akses Direktori Ringan. Program juga disediakan untuk menyediakan sumber daya, untuk melakukan konfigurasi dan pemantauan kinerja.

Olson tidak akan membahas berapa banyak Cloudera telah dibuat dari biaya berlangganan dan konsultasi sejauh ini, tetapi mencatat bahwa kuartal pertama tahun 2010, perusahaan dibuat sebanyak apa yang diperolehnya hingga setengah tahun 2009. Di antara berbagai industri, jasa keuangan, telekomunikasi, ritel, pemerintah, dan perusahaan perdagangan Web telah menunjukkan minat dalam teknologi, kata Olson.

"Hal-hal yang dilakukan perusahaan dengan Hadoop bervariasi. umum, orang-orang ini menangkap banyak data dari banyak tempat dan perlu menggantinya dengan analisis canggih, "kata Olson. "Layanan keuangan tertarik menggunakan Hadoop untuk mendeteksi penipuan. Di telekomunikasi, ada kebutuhan nyata untuk mengoptimalkan jaringan dan mengurangi jumlah pelanggan."

Selain menawarkan paket-paket ini, Cloudera telah menggalang dukungan untuk Hadoop dari penyedia intelijen bisnis (BI) dan perangkat lunak manajemen data.

Olson berencana untuk mengumumkan, selama keynote-nya di Hadoop Summit 2010, yang berlangsung di Santa Clara, California pada hari Selasa, bahwa vendor BI MicroStrategy akan mendukung penggunaan Hadoop.

Mitra baru lainnya adalah Talend, vendor perangkat lunak integrasi data sumber terbuka. Perusahaan telah memperpanjang Talend Integration Suite untuk berinteraksi dengan database Hadoop. Rangkaiannya memungkinkan administrator untuk mengelola dan menggabungkan beberapa sumber data dari satu konsol. Dengan Hadoop, perangkat lunak "dapat secara asli memasukkan atau mengambil data, dan memproses data dalam arsitektur Hadoop," kata Wakil Presiden Pemasaran Talend, Yves de Montcheuil.

Microstrategy dan Talend bergabung dengan semakin banyak perusahaan yang menyiapkan open source atau alat manajemen komersial untuk Hadoop. Minggu lalu, Cloudera dan Quest memulai proyek untuk membangun perangkat lunak yang dapat menghubungkan Hadoop dengan database Oracle. Pada bulan Mei, perusahaan open-source, bisnis-intelijen Pentaho mengumumkan bahwa paket BI-nya akan bekerja dengan database Hadoop.

Dalam wawancara terpisah dengan IDG News Service, CTO Yahoo Raymie Stata menunjukkan bahwa Hadoop dapat mengurangi kebutuhan untuk membangun superkomputer. untuk menganalisis kumpulan data besar. Secara tradisional, set data besar telah dipindahkan dari penyimpanan ke superkomputer, yang merupakan kumpulan server yang dikumpulkan, untuk dianalisis. Sebaliknya, Hadoop memindahkan perhitungan analitik ke tempat data berada, menghilangkan kebutuhan akan mesin penghancur angka raksasa, cental. Yahoo adalah kontributor terkemuka awal untuk Hadoop.

Selain penawaran Cloudera, Hadoop juga sedang dikomersilkan oleh IBM, yang baru-baru ini mulai menawarkan serangkaian layanan analitik yang menggunakan teknologi tersebut.

Joab Jackson mencakup perangkat lunak enterpise dan umum berita teknologi untuk Layanan Berita IDG. Ikuti Joab di Twitter di @Joab_Jackson. Alamat e-mail Joab adalah [email protected]