Komponen

Vendor Database Menambahkan Google MapReduce

Power BI - Map visualization

Power BI - Map visualization
Anonim

Greenplum dan Aster Data Systems, dua startup yang terlibat dalam skala besar analisis data, mengumumkan minggu ini bahwa produk mereka akan mendukung MapReduce, teknik pemrograman yang awalnya dikembangkan oleh Google untuk pemrosesan paralel dari kumpulan data besar di seluruh perangkat keras komoditas.

Pengembang perangkat lunak cenderung lebih nyaman dengan bahasa seperti Java dan C ++ daripada Bahasa database SQL, kata Mayank Bawa, pendiri dan CEO Aster, pembuat sistem database cluster yang membagi beban kerja menjadi beberapa tingkatan diskrit.

"Kebanyakan pengembang berjuang dengan nuansa membuat database menari dengan baik ke arah mereka," dia menulis di posting blog. "Memang, maestro SQL diperlukan untuk melakukan kueri menarik untuk transformasi data (selama pemrosesan ETL atau pemrosesan Extract-Load-Transform) atau penambangan data (selama analitik)."

Masukkan MapReduce, tujuannya adalah untuk menyediakan "Kerangka sepele yang sepele sehingga bahkan pengembang pemula (alias magang) bisa menulis program dalam berbagai bahasa (Java / C / C ++ / Perl / Python) untuk menganalisis data independen skala," Bawa aja.

Sementara itu, Greenplum, pembuat database itu mengatakan dapat skala ke petabyte informasi, mengatakan minggu ini bahwa kerangka MapReduce akan menjadi bagian dari mesin dataflow pada September.

Pengumuman kembar membawa anggukan persetujuan dari satu pengamat dekat dari database dunia.

"Sendiri, MapReduce dapat melakukan banyak pekerjaan penting dalam manipulasi data dan analisis. Mengintegrasikannya dengan SQL seharusnya hanya meningkatkan penerapan dan kekuatannya," tulis Curt Monash dari Monash Research, di blog DBMS2.

"MapReduce tidak diperlukan untuk tabu manajemen data. Itu telah diparalelkan secara efisien dengan cara lain, "tambahnya." Tetapi jika Anda ingin membangun struktur non-tabular seperti indeks teks atau grafik, MapReduce ternyata sangat membantu. "