Car-tech

Berikutnya: komputer eksternal, diharapkan tiba pada 2020

TensorFlow Dev Summit 2019 Keynote

TensorFlow Dev Summit 2019 Keynote

Daftar Isi:

Anonim

Jika peningkatan kecepatan superkomputer berlanjut pada kecepatan mereka saat ini, kita akan melihat mesin eksotis pertama pada tahun 2020, memperkirakan para pemelihara dari Kompilasi top500 sistem tercepat di dunia.

Arsitek sistem komputer besar seperti itu, bagaimanapun, akan menghadapi sejumlah masalah penting, seorang penjaga daftar memperingatkan.

"Tantangan akan sangat penting untuk mengirimkan mesin," kata Jack Dongarra, Universitas Tennessee, Knoxville, peneliti yang merupakan salah satu prinsip di balik Top500. Dongarra berbicara pada konferensi SC2012, yang diadakan minggu ini di Salt Lake City, selama presentasi tentang edisi terbaru dari daftar, dirilis minggu lalu.

Kami masih memiliki cara untuk pergi sebelum kinerja exascale mungkin. Sebuah mesin exascale akan mampu menghasilkan satu quintillion FLOPS (operasi floating point per detik), atau 10 hingga 18 FLOPS. Bahkan superkomputer tercepat saat ini menawarkan kurang dari 20 persen kemampuan mesin exascale.

Top500

Ketinggian baru

Dalam edisi terbaru daftar top500 superkomputer, dirilis Senin, komputer tercepat dalam daftar adalah sistem National Laboratory Titan Oak Ridge, mesin yang mampu mengeksekusi 17.59 petaflops. Petaflop adalah penghitungan titik apung kuadriliun per detik, atau 10 hingga 15 FLOPS.

Tetapi setiap daftar Top500 baru yang dikompilasi dua kali setahun menunjukkan seberapa cepat kecepatan superkomputer tumbuh. Dilihat dari daftar, superkomputer tampaknya memperoleh sepuluh kali lipat kekuasaan setiap sepuluh tahun atau lebih. Pada tahun 1996, komputer teraflop pertama muncul di Top500, dan pada tahun 2008, komputer petaflop pertama muncul dalam daftar. Ekstrapolasi dari tingkat kemajuan ini, Dongarra memperkirakan bahwa komputasi exascale akan tiba sekitar tahun 2020.

Komunitas High Performance Computing (HPC) telah menggunakan komputasi exascale sebagai tonggak utama. Intel telah menciptakan sederetan prosesor multicore masif, yang disebut Phi, bahwa harapan perusahaan dapat berfungsi sebagai dasar komputer eksternal yang dapat berjalan pada 2018.

Dalam ceramahnya, Dongarra membuat sketsa karakteristik mesin eksotis. Mesin semacam itu kemungkinan akan memiliki antara 100.000 dan 1.000.000 node dan akan dapat mengeksekusi hingga satu miliar benang pada waktu tertentu. Kinerja node individu harus antara 1,5 dan 15 teraflops dan interkoneksi perlu memiliki throughput 200 hingga 400 gigabyte per detik.

Pembuat superkomputer harus membangun mesin mereka sehingga biaya dan konsumsi daya mereka tidak meningkat secara linear bersama dengan kinerja, jangan sampai mereka tumbuh terlalu mahal untuk dibeli dan dijalankan, kata Dongarra. Sebuah mesin eksotis seharga sekitar $ 200 juta, dan hanya menggunakan sekitar 20 megawatt, atau sekitar 50 gigaflops per watt.

Dongarra mengharapkan bahwa setengah biaya untuk membangun komputer semacam itu akan dialokasikan untuk membeli memori untuk sistem tersebut. Dilihat dari roadmap produsen memori, Dongarra memperkirakan bahwa $ 100 juta akan membeli antara 32 petabyte hingga 64 petabyte memori pada tahun 2020.

Top500

Tantangan perangkat lunak

Selain tantangan dalam perangkat keras, perancang superkomputer exascale harus juga bergulat dengan masalah perangkat lunak. Salah satu masalah adalah sinkronisasi, kata Dongarra. Mesin hari ini memberikan tugas di antara banyak node yang berbeda, meskipun pendekatan ini perlu disederhanakan karena jumlah node meningkat.

"Hari ini, model kami untuk pemrosesan paralel adalah model garpu / gabung, tetapi Anda tidak dapat melakukannya di [tingkat paralelisme. Kita harus mengubah model kita. Kita harus lebih sinkron, "kata Dongarra. Sepanjang garis yang sama, algoritma perlu dikembangkan yang mengurangi jumlah komunikasi keseluruhan antar node.

Faktor-faktor lain harus dipertimbangkan juga. Perangkat lunak harus disertai rutinitas bawaan untuk pengoptimalan. "Kami tidak dapat bergantung pada pengaturan pengguna tombol dan tombol yang tepat untuk membuat perangkat lunak berjalan di dekat kinerja puncak," kata Dongarra. Ketahanan kesalahan akan menjadi fitur penting lainnya, seperti halnya reproduktifitas hasil, atau jaminan bahwa penghitungan rumit akan menghasilkan jawaban yang sama persis ketika dijalankan lebih dari sekali.

Reprodusibilitas mungkin tampak seperti ciri yang jelas untuk komputer. Namun pada kenyataannya, itu bisa menjadi tantangan untuk perhitungan besar pada superkomputer multinode.

"Dari sudut pandang metode numerik, sulit untuk menjamin reproduktifitas bit-bijaksana," kata Dongarra. "Masalah utamanya adalah dalam melakukan pengurangan - penjumlahan angka secara paralel. Jika saya tidak dapat menjamin urutan di mana angka-angka tersebut bersatu, saya akan memiliki kesalahan pembulatan yang berbeda. Perbedaan kecil itu dapat diperbesar. dengan cara yang dapat menyebabkan jawaban berbeda secara serampangan, "katanya.

" Kami harus membuat skenario di mana kami dapat menjamin urutan operasi tersebut dilakukan, sehingga kami dapat menjamin bahwa kami memiliki hasil yang sama, "Kata Dongarra.

Joab Jackson mencakup perangkat lunak perusahaan dan teknologi umum untuk berita Layanan Berita IDG. Ikuti Joab di Twitter di @Joab_Jackson. Alamat e-mail Joab adalah [email protected]