Un cluster Tesla per sperimentare con la programmazione parallela 23/02/2009 ore 09:17

Un cluster Tesla per sperimentare con la programmazione parallela

Autore: Paolo Corsini Categoria: Periferiche
E4 Engineering e NVIDIA mettono a disposizione un cluster Tesla con 8 GPU a titolo gratuito, per sperimentare i vantaggi del GPU Computing

In differenti contesti abbiamo avuto modo di analizzare ambiti di utilizzo delle GPU delle più recenti schede video non legati alla grafica 3D. Queste architetture sono così potenti negli ambiti di elaborazione parallela da poter venir utilizzate anche per eseguire codice tipicamente indirizzato al calcolo su CPU, ottenendo sensibili diminuzioni nei tempi di elaborazione.

Il segmento del GPU computing, termine con il quale sono indicate quelle elaborazioni di calcolo non legato alla grafica 3D che vengono eseguite utilizzando la potenza di calcolo della GPU del proprio sistema, sta progressivamente prendendo forma sia in ambito consumer che professionale. E' in quest'ultimo che ovviamente si ripone il maggiore interesse, in quanto una riduzione dei tempi di elaborazione è sempre apprezzata: permette a parità di tempo di eseguire più calcoli o di ottenere risposte in tempi più rapidi.

Avere a disposizione un pacchetto di GPU per elaborazioni parallela non è tuttavia sufficiente a ridurre i tempi di elaborazione. E' indispensabile che l'applicazione si presti, per sua natura, a venir eseguita in modo parallelo e che il codice venga adattato in modo tale da poter essere eseguito su una GPU. NVIDIA sta operando da tempo in questa direzione attraverso CUDA e le proprie soluzioni hardware della famiglia Tesla, basate su GPU della famiglia GT200 e disponibili sia come schede video dedicate che come server rack o workstation esterne.

E4 Computer Engineering, azienda impegnata impegnata nella produzione di sistemi server particolarmente orientata all'ambito HTPC, ha istituito una nuova iniziativa mirante alla diffusione delle soluzioni NVIDIA Tesla. Un cluster di 8 GPU è stato messo a disposizione, a titolo gratuito e con accesso da remoto, ai clienti E4 Computer Engineering affinché sia possibile studiare i benefici dell'elaborazione parallela via GPU del proprio codice.

L'architettura hardware messa a disposizione prevede due server E5118 a 1 unità, abbinati a due server Tesla S1070 ciascuno dotato di 4 GPU operanti in parallelo. La potenza di elaborazione massima teorica messa a disposizione, in single precision, è pari a 8 TeraFLOPs utilizzando in parallelo tutte e 8 le GPU NVIDIA messe a disposizione. Di seguito riportiamo il comunicato stampa fornito dal produttore, rimandando a questo sito web per tutti gli approfondimenti.

Scandiano, 20 febbraio 2009 - E4 Computer Engineering, azienda specializzata nella produzione di sistemi informatici di fascia alta e ad elevate performance per l'industria ed i centri di calcolo e ricerca scientifica, annuncia la possibilità, per i propri clienti, di effettuare test gratuiti, in connessione remota, per verificare il miglioramento delle performance dei propri codici sulle piattaforme E4® basate su architettura NVIDIA® Tesla™.

L’HPC è da molti anni uno dei core business di E4 Computer Engineering, e l’Azienda emiliana vuole dare ai propri clienti l’opportunità di sperimentare, in connessione remota, la potenza di calcolo del cluster HPC E4 basato sulle soluzioni NVIDIA® Tesla™ e composto da due Twin server 1U (4 nodi) E5118 e due server Tesla™ S1070. Il cluster è in grado di assicurare un livello di prestazioni di 8 teraflop di calcolo, fino a 150 volte superiore rispetto ai sistemi tradizionali e consumi energetici ridotti, grazie alla configurazione hardware ibrida (CPU + GPU). Questa soluzione scalabile rappresenta un passo molto importante, da parte di E4® Computer Engineering, verso la promozione di architetture hardware per applicazioni HPC che includano tecnologie di computing eterogenee.

“Rendendo disponibile i test gratuiti in remoto di questa soluzione, vogliamo permettere ai nostri clienti di verificare che le potenzialità di calcolo di questa particolare soluzione possono essere applicate con successo a tutte le strutture che adottano il calcolo ad alte prestazioni “, ha affermato Vincenzo Nuti, Amministratore Delegato di E4, che ha concluso: “I cluster basati su tecnologia NVIDIA Tesla apriranno nuove prospettive a realtà diverse da quelle solitamente conosciute. I sistemi di calcolo basati su NVIDIA Tesla, racchiudono in un’unica soluzione hardware altamente integrata potenza e affidabilità e costi molto ridotti.”

“Siamo entusiasti di fronte all’opportunità fornita al mondo HPC italiano da parte di E4. Gli sviluppatori che hanno preso in considerazione la programmazione per mezzo della tecnologia NVIDIA CUDA possono finalmente sperimentare i potenziali di scalabilità delle proprie applicazioni” – ha dichiarato Edmondo Orlotti, Professional Solutions Channel Sales Manager per il Sud Europa in NVIDIA – “La rivoluzione del GPU computing è ormai una realtà industriale, anche grazie a partner chiave come E4”.

Commenti (14) 

Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - Info
Per contattare l'autore del pezzo, così da avere una risposta rapida, si prega di utilizzare l'email personale (vedere in alto sotto il titolo). Non è detto che una domanda diretta inserita nei commenti venga verificata in tempi rapidi. In alternativa contattare la redazione a questo indirizzo email.
Commento # 1 di: demon77 pubblicato il 23 Febbraio 2009, 09:43
Io comincio ad essere un po' deluso.. cuda è fuori da parecchio ormai ma i programmi li si vede col contagocce.. soprattutto in ambito free dove non c'è veramente un tubazzo di straniente!!!

Io come minimo mi aspettavo tempo zero un sano codec X264 scritto per GPU da usare con virtualdub!!
E invece ciccia! Nè questo nè altro!!
Commento # 2 di: kralin pubblicato il 23 Febbraio 2009, 09:48
scrivilo tu demon...
Commento # 3 di: TheDarkAngel pubblicato il 23 Febbraio 2009, 09:56
Credo che la maggior parte dei programmatori stia aspettando una unificazione, qualcosa che vada su ogni singola gpu programmabile sul mercato, che sia ati, nvidia, intel o addirittura sis. Comunque ati avendo pure lei buona parte del mercato rende un pò inutile gran parte dei discorsi.
Commento # 4 di: inatna pubblicato il 23 Febbraio 2009, 10:01
Originariamente inviato da: demon77
Io comincio ad essere un po' deluso.. cuda è fuori da parecchio ormai ma i programmi li si vede col contagocce.. soprattutto in ambito free dove non c'è veramente un tubazzo di straniente!!!

Io come minimo mi aspettavo tempo zero un sano codec X264 scritto per GPU da usare con virtualdub!!
E invece ciccia! Nè questo nè altro!!


Armati di SDK e datti da fare
Commento # 5 di: demon77 pubblicato il 23 Febbraio 2009, 10:04
Eh vabbeh simpaticoni!!!
Se ero programmatore magari mi ci mettevo!!!
Commento # 6 di: DjLode pubblicato il 23 Febbraio 2009, 10:08
Guarda un pò E4 dove mi è finita
Commento # 7 di: ilmanu pubblicato il 23 Febbraio 2009, 10:31
effettyivamente anche io mi aspettavo qualcosa da usare cn vdub basato su x264 e sinceramente sono un po' deluso... pero' magari anno nuovo....
Commento # 8 di: homero pubblicato il 23 Febbraio 2009, 10:37
demon77 ha pienamente ragione!!!
e quelli che hanno scritto "datti da fare" avrebbero fatto meglio a tenere le proprie dita lontano dalla tastiera.
L'intero gruppo della Wolfram Research ha provato a sviluppare software parallelo da integrare in Mathematica ed analogamente il gruppo di matlab, purtroppo l'ambito di utilizzo delle funzioni parallelle messe a disposizione da CUDA è altamente limitante e di difficilissimo debugging.
Anche adesempio le schede Tesla CX sviluppate per accellerare premiere e adobe photoshop sono di gran lunga acerbe per permettere un reale vantaggio dal punto di vista prestazionale in quanto le schede purtroppo sono vincolate dall'architettura attuale dei PC pertanto richiedono un continuo sincronismo tra CPU-RAM-PCIE ed è questa terribile gestione degli interrupt che limita lo sviluppo delle applicazioni CUDA specie in ambito multitrend.
sapete quante volte nel debugging gli algoritmi di calcolo di impallavano senza alcuna possibilità di verificare quello che stava accadendo sulla scheda Tesla?
e purtrppo non c'e' alcun sistema se non un arcaica librarie in C++ che permetta di valutare le ragioni di questi blocchi che sono continui e spesso causati non dall'accoppiata CUDA+TESLA ma dall'hardware su cui questa gira e dall'OS su cui gira.
Pertanto la Strada intrapresa da GPGPU è ben lontana dall'essere risolta in quanto finche' si è costretti a passare attraverso il bus PCIE non è in alcun modo possibile ottenere un ambiente di sviluppo efficente, a meno di non integrare funzioni apposite nei kernel dei sistemi operativi. ma al momento niente di tutto questo pare in sviluppo.
quando avremmo GPGPU e CPU sullo stesso socket allora le cose saranno diverse e lo sviluppo sarà di gran lunga piu' facile ed attuabile.
per il momento vi lasciano sognare prestazioni da sogno....
Commento # 9 di: gianly1985 pubblicato il 23 Febbraio 2009, 10:43
Originariamente inviato da: demon77
Io comincio ad essere un po' deluso.. cuda è fuori da parecchio ormai ma i programmi li si vede col contagocce.. soprattutto in ambito free dove non c'è veramente un tubazzo di straniente!!!

Io come minimo mi aspettavo tempo zero un sano codec X264 scritto per GPU da usare con virtualdub!!
E invece ciccia! Nè questo nè altro!!


Aspetta che esca Snow Leopard che secondo me userà OpenCL pure per il blocco note Ovviamente questo richiede che passi a mac..
Originariamente inviato da: Sito Apple
Another powerful Snow Leopard technology, OpenCL (Open Compute Library), makes it possible for developers to efficiently tap the vast gigaflops of computing power currently locked up in the graphics processing unit (GPU). With GPUs approaching processing speeds of a trillion operations a second, they're capable of considerably more than just drawing pictures. OpenCL takes that power and redirects it for use in high-performance computing applications like genomics, video encoding, signal processing, and simulations of physical and financial models


A quanto pare se ne avvantaggeranno tutti i mac degli ultimi anni, addirittura parzialmente anche quelli con la intel GMA950:
http://macosrumors.com/2009/02/11/w...support-opencl/


Unito a Grand Central (sfruttamento multi-core) e transizione completa ai 64bit faranno di SL un gran OS secondo me....
Commento # 10 di: iva pubblicato il 23 Febbraio 2009, 11:41
@homero: hai qualche link sul fatto che CUDA su Mathematica sia difficile nel debugging?
Non dubito il fatto, sono solo interessato
Totale commenti: 14 « Pagina Precedente | Pag 1 di 2 | Pagina Successiva »

Lascia il tuo commento

Notizie

23.05.2012

Anche la Californa dice sì alle automobili senza conducente

Dopo il Nevada, anche la California formalizza una legge che permette la circolazione di automobili senza conducente, ovviamente con le dovute precauzioni...

22.05.2012

Foxconn, uno stabilimento produttivo solo per Apple

Il produttore taiwanese ha in programma lo stanziamento di 210 milioni di dollari per la costruzione di una linea produttiva che sarà dedicata ai prodotti...

22.05.2012

Ulteriori passi avanti nel campo delle memorie resistive

L'Università di Londra sviluppa una tecnologia di memoria resistiva utilizzando ossido di silicio, in grado di operare a temperatura e pressione ambiente...

21.05.2012

ARM: "Arriveremo al 20% del mercato PC"

Secondo Warren East, CEO dell'azienda, i processori ARM riusciranno nel giro dei prossimi tre o quattro anni ad insediare un quinto del mercato PC

21.05.2012

Acquisizione Motorola da parte di Google, anche l'antitrust cinese dà l'ok

Dopo l'ok degli organi di controllo europei e statunitensi arriva anche il consenso da parte delle autorità cinesi che impongono però a Google di mantenere...

21.05.2012

Vendite PC in Europa, la crisi si fa sentire

Vendite di PC inferiori alle attese per la zona Europa, nonostante le stime molto caute da parte dei produttori. A farsi sentire è la crisi che colpisce...

19.05.2012

Samsung realizza una nuova struttura di transistor in grafene

I ricercatori di Samsung riescono a realizzare un transistor funzionante impiegando il grafene, con un nuovo approccio all'impiego del materiale

18.05.2012

Rice University: risparmiare energia con un processore impreciso

Eliminando alcune parti della circuiteria logica e gestendo adeguatamente la probabilità d'errore è possibile realizzare processori funzionanti in grado...

18.05.2012

HP si prepara a ridimensionare la forza lavoro

Il taglio dei posti di lavoro potrebbe riguardare 30 mila persone, le risorse risparmiate saranno reinvestite in attività e strategie di crescita

18.05.2012

Facebook mette anche Lightbox nella lista della spesa

"Oggi cosa compro? Prendo Lightbox e poi la chiudo!". Sarà passato questo nella mente di Mark Zuckerberg? Non possiamo saperlo, quello che è certo è l'interesse...

18.05.2012

RunCore InVincible, SSD con il tasto di autodistruzione fisica

Soluzione sicuramente originale ma meno bizzarra di quanto possa sembrare, quella di RunCore Invincible: ecco un SSD che, in nome della sicurezza, mette...

18.05.2012

Facebook, il prezzo delle azioni è di 38 dollari

Raggiungendo una capitalizzazione di mercato d 104 miliardi di dollari, l'IPO di Facebook rappresenta la più grande offerta a Wall Street di una società...

17.05.2012

Samsung supera Nokia nelle vendite di telefoni cellulari

Nel mercato dei telefoni cellulari si registra, per la prima volta dopo molti trimestri una lieve flessione. Gli smartphone continuano però ad acquistare...

17.05.2012

Al debutto 3 nuove famiglie di processori Intel Xeon

Sono ben 28 le nuove CPU Xeon che Intel ha annunciato in questi giorni, divise in 3 famiglie: Xeon E5-4600 per soluzioni di elevata potenza sino a 4 socket;...