Windows

Hadoop mendapat lebih banyak pencarian dengan MapR, Cloudera merilis

How to install Cloudera QuickStart VM on VMware

How to install Cloudera QuickStart VM on VMware
Anonim

Pengguna platform pengolahan data Hadoop sekarang memiliki dua alat tambahan untuk membantu mereka menyortir informasi pegunungan mereka.

Distribusi M7 MapR yang baru menghapus lapisan Hadoop JVM untuk meningkatkan kinerja

Hadoop distributor MapR telah mengintegrasikan Pencarian LucidWorks ke dalam distribusinya sendiri. Cloudera, sementara itu, telah meluncurkan rilis lengkap pertama dari sumber terbuka mesin query SQL Impala untuk Hadoop.

[Bacaan lebih lanjut: Layanan streaming TV terbaik]

"Menggunakan pencarian sebagai antarmuka pengguna untuk data besar sangat menarik. Pencarian sangat cocok untuk memanfaatkan banyak jenis informasi yang berbeda, terutama informasi yang tidak terstruktur, ”kata Jack Norris, kepala pemasaran untuk MapR. "Kami melihat beberapa aplikasi yang sangat menarik dengan mesin pencari pada intinya, bahkan jika pengguna biasa tidak akan memikirkannya sebagai mesin pencari."

LucidWorks Search adalah versi komersial dari open source Apache Lucene / Solr full mesin pencarian -text. Dengan integrasi MapR baru, LucidWorks Search dapat mencari baik melalui data pada Sistem Berkas Hadoop (HDFS) atau pada file pada sistem file lainnya.

LucidWorks Search menawarkan snapshot dan cermin untuk ketersediaan tinggi, dan menghilangkan banyak pekerjaan yang diperlukan untuk pasang Lucene / Solr dari awal. Ini juga menawarkan dukungan asli untuk lebih banyak sumber data, antarmuka pengguna grafis dan kerangka kerja keamanan.

Mesin pencari dapat digunakan dalam aplikasi Web dinamis untuk cepat mengambil foto, iklan, rekomendasi produk, dan informasi lain yang dapat digunakan untuk mengisi situs web dengan cepat. “Ini bukan pengganti biaya rendah untuk gudang data. Ini adalah tentang memanfaatkan sumber data baru dan melakukan beberapa hal yang memiliki dampak dramatis pada bisnis, "kata Norris.

MapR dan LucidWorks telah bekerja sama dalam memasangkan teknologi mereka sejak 2011, ketika mereka membentuk perjanjian pemasaran bersama. Awal tahun ini, mereka merilis sebuah konektor yang membuatnya mudah untuk menggunakan Lucene / Solr dengan distribusi MapR Hadoop.

LucidWords Search bekerja dengan distribusi M7 MapR yang baru dirilis, dalam bentuk beta. Selain mendukung LucidWorks Search, edisi M7 telah diarsipkan ulang untuk menghilangkan kompaksi atau pemeriksaan konsistensi latar belakang, mempercepat kinerja.

Juga minggu ini, Cloudera merilis versi 1.0 dari Cloudera Impala, sebuah mesin query SQL-compliant open source untuk Hadoop. SQL adalah bahasa antarmuka basis data yang digunakan dalam sistem manajemen basis data relasional (RDMS) dan dikenal oleh administrator basis data.

Impala dirancang untuk mengeksekusi kueri lebih cepat daripada Hadoop's Hive, karena tidak menggunakan kerangka MapReduce, yang memerlukan hasil pencarian yang akan ditulis ke disk. Sebagai gantinya, pengguna dapat mempertanyakan data yang disimpan dalam HDFS dan HBase secara langsung. Pengguna dapat melakukan kueri data secara interaktif atau melalui proses batch.

Cloudera pertama kali merilis versi mesin ini Oktober lalu sebagai beta. Sejak itu, perangkat lunak ini telah diuji oleh perusahaan seperti 37signals dan Expedia.

Impala adalah komponen inti paket tambahan Cloudera Enterprise RTQ (Real-Time Query) untuk platform Cloudera Hadoop. Impala dapat diunduh tanpa biaya.

Diperbarui pada 6 Mei untuk mengoreksi informasi tentang teknologi Cloudera Impala.