
Em uma apresentação durante uma conferência na cidade americana de Portland, a Intel fez uma demonstração de seu futuro processador gráfico (GPU) Larrabee. É importante recordar que quando a Intel iniciou o desenvolvimento do Larrabee, o objetivo era atingir 1TFlop com um chip composto de 16 núcleos, cada um dos quais operando em uma frequencia de 2.0Ghz e consumindo um total de 150W.

Isso é a teoria, vamos à prática. A Intel submeteu sua GPU ao escrutínio do benchmarck SGEMM, e obteve, com a metade dos núcleos ativos, 417GFlops. Quando todos os núcleos foram ativos, o chip atingiu 825GFlops.

Colocando esses números em perspectiva, pode-se pensar que estão abaixo da performance obtida tanto por uma AMD Radeon HD4850 quanto de uma nVidia GTX285. Ocorre que a performance do Larrabee é um número "real", obtido no teste de performance SGEMM (amplamente usado para aferir a capacidade de computadores de alta peformance) , ao contrário dos números teóricos indicados pela AMD e pela nVidia para suas placas.
O Larrabee atinge 1TFlop, em overclock
A empresa de Santa Clara também demonstrou a capacidade de sua GPU quando submetida a um overclock. Nessa situação ela conseguiu superar a marca de 1TFlops, atingindo, precisamente, 1.006Gflops.
Em termos de comparação, uma nVidia Tesla C1060 (baseada no chip gráfico GT200) obtém 370GFlops nesse teste, o que mostra que o Larrabee é 270% mais rápido que uma placa de vídeo da nVidia baseada no chip GT200.

Já do lado da AMD, uma AMD 9270 (Radeon HD4870), consegue atingir 300GFlops no teste SGEMM, um número inferior ao obtido pela placa da nVidia.
Larrabee x GTX285 x HD4870 x Core i7 975 x C2Q QX9770
Em termos de classificação, os resultados compilados dos testes ficariam assim, em ordem decrescente de performance:
1º - Intel Larrabee [LRB, 45nm] - 1006GFLOPS
2º - EVGA GeForce GTX285 FTW - 425GFLOPS
3º - NVIDIA Tesla C1060 [GT200, 65nm] - 370GFLOPS
4º - AMD FireStream 9270 [RV770, 55nm] - 300GFLOPS
5º - IBM PowerXCell 8i [Cell, 65nm] - 164GFLOPS
6º - Intel Core i7 XE 975 (3.33Ghz) - 101 GFLOPS
7º - Intel Core 2 Quad QX9770 (3.2Ghz) - 91GFLOPS
Especulação
Apesar de não dispor dos números das Radeon Série HD5XXX e tampouco da NVIDIA Tesla, espera-se que as placas da NVIDIA baseadas no GT300 atinjam mais de 1TFLOPS nesse teste, enquanto que uma AMD FireStream 9370 (Radeon HD5870) chegue a algo como 600GFlops no SGEMM.
Coment�rios