• <Xem thêm trên Intel.com

Intel® Xeon Phi™ Product Family

Highly parallel processing to power your breakthrough innovations

Intel® Xeon Phi™ Coprocessor

Power your breakthrough innovations with the highly parallel processing of the Intel® Xeon Phi™ coprocessor. We have packed over a teraFLOPS of double-precision peak performance into every chip.

Life science applications

Life sciences is one of the largest commercial market segments for high-performance computing. Life sciences includes many disciplines, such as chemistry, bio-chemistry, molecular modeling, protein folding, genomics, and statistical analysis to name a few.  Quick simulation and analysis leads to breakthroughs in all areas of the life sciences. BWA maps human genomes. Gromacs simulates particle molecular dynamics. LAMMPS is a versatile large scale atomic simulation package. MPI-HMMER is an open source MPI implementation of the HMMER protein sequence analysis suite. NAMD is a parallel molecular dynamics code for large bio molecular systems. 

Intel measured as of May 2014

Chi Tiết Cấu Hình

BWA: (Burrow-Wheeler Aligner Release bwa-0.5.10)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel® Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel® QuickPath Interconnect (Intel® QPI), 130W thermal design power (TDP), Intel® Turbo Boost Technology on, Intel® Hyper-Threading Technology (Intel® HT Technology) on) 64 GB memory at 1600 MHz, Red Hat Enterprise Linux* (RHEL*) 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel® Turbo Boost Technology off, error-correcting code (ECC) on)

Software stack (Intel Xeon Phi coprocessor):

Intel® Manycore Platform Software Stack (Intel® MPSS) 2.1.6720-21 (Flash*: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel® MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 178.73 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 119.17 seconds

Source: Intel Internal Testing TR2093

 

MPIHmmer:

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2670 (8 core, 20M cache, 2.6 GHz, 8.0 GT/s Intel QPI, 115W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386; coprocessor OS: 2.6.38.8-g5f2543d)

Intel® Composer XE 2013.3.163

Two-socket Intel Xeon processor score: 89 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 57 seconds

Source: Intel Internal Testing TR2051

 

LAMMPS (Production Protein Simulation 474K Stoms, Version 5 April 2014)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (2x 12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 135W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.3

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386)

Intel® Compiler 14.0.1; Intel MPI Library 4.1.2.040

 

1 Node

16 Nodes

Two-socket Intel Xeon processor score:

26.84 sec

4.33 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score:

19.10 sec

2.63 seconds

Source: Intel Internal Testing TR2104

 

GROMACS  (Version 5.0-rc1 - Workload 512K H20 with RF Method)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 2.312 ns/day

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 3.605 ns/day seconds

Source: Intel Internal Testing TR2101

NAMD: (STMV 2.10 pre-release)

Platform hosting the coprocessor and platform for 2S Intel® Xeon® processor baseline:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP, Intel Turbo Boost Technology on, Intel HT Technology on)  64 GB memory @ 1600 MHz, RHEL 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Xeon Phi):

MPSS 2.1.6720-21 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel Compiler 13.1.3 20130607

2S Intel Xeon score: 0.513 seconds

2S Intel Xeon + 2 Xeon Phi score: 0.158 seconds

Source: Internal Testing (TR 2100)

 

NAMD STMV 1 node 47 PPN per node

(Version 2.10 pre-release)

STMV (virus) benchmark (1,066,628 atoms, periodic, PME)

Platform hosting the coprocessor:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP)  64 GB memory @ 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (ECC on, Intel Turbo Boost Technology off)

NVIDIA K40c GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory @ 6.0 GT/s, ECC on, 235W TDP

CUDA 5.5.0, Driver 319.82 (boost frequency was not enabled for result)

Software stack:

MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

4 Nodes

 

2S Xeon only score:

0.158 ns/day

     

2S Xeon + 1 Xeon Phi score:

0.386 ns/day

0.729 ns/day

1.2879 ns/day

(higher is better)

2S Xeon + 2 Xeon Phi score:

0.512 ns/day

     

NVIDIA K40c* score:

0.32 ns/day

0.55 ns/day

1.02 ns/day

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR* (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

 

NAMD ApoA1 1 node (47 PPN per node)

Version 2.10 pre-release

Platform hosting the coprocessor:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP) 64 GB memory @ 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (ECC on, Turbo off)

NVIDIA K40c GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory @ 6.0GT/s, ECC on, 235W TDP

CUDA 5.5.0, Driver 319.82(boost frequency was not enabled for result)

Software Stack:

MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

 

2S Xeon + 1 Xeon Phi score (symmetric):

4.430 Mrps

6.607 Mrps

(higher is better)

NVIDIA K40c score:

4.08 Mrps

6.16 Mrps

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

Additional information: 1 2 3 4 5

Thông tin Sản phẩm và Hiệu năng

open

1. Phần mềm và tải được sử dụng trong các kiểm tra hiệu suất có thể chỉ được tối ưu hóa cho hiệu suất trên bộ vi xử lý Intel. Các kiểm tra hiệu suất, chẳng hạn như SYSmark và MobileMark, được đo bằng cách sử dụng cacvs hệ thống máy tính, thành phần, phần mềm, hoạt động và chức năng cụ thể. Bất kỳ thay đổi nào với bất kỳ yếu tố nào trong số này có thể tạo ra kết quả khác nhau. Bạn nên tham khảo các thông tin và các kiểm tra hiệu suất khác để hỗ trợ bạn trong việc đánh giá đầy đủ việc mua dự tính của bạn, bao gồm hiệu suất của sản phẩm đó khi kết hợp với các sản phẩm khác. Để biết thêm thông tin hãy truy cập vào www.intel.com/performance.

2. Intel không kiểm soát hay kiểm tra việc thiết kế hoặc triển khai các đánh giá chấm điểm của bên thứ ba hoặc những trang web được tham chiếu trong tài liệu này. Intel khuyến khích tất cả khách hàng truy cập các trang web tham chiếu hoặc các trang khác có báo cáo thông tin về đánh giá hiệu năng và xác nhận xem các đánh giá hiệu năng tham chiếu có chính xác và phản ánh đúng hiệu năng hệ thống hiện có để mua hay không.

3. Số hiệu bộ xử lý của Intel không phải là thước đo hiệu năng. Số hiệu bộ xử lý phân biệt các tính năng có trong mỗi họ bộ xử lý, chứ không phải giữa các họ bộ xử lý khác nhau. Hãy truy cập www.intel.com/content/www/us/en/processors/processor-numbers.html để biết chi tiết.

4. Trình biên dịch của Intel có thể tối ưu hóa hoặc không tối ưu hóa ở cùng cấp độ cho các bộ vi xử lý không phải của Intel đối với những tối ưu hóa không dành riêng cho các bộ vi xử lý Intel®. Các tối ưu hóa này bao gồm các tập hợp câu lệnh SSE2 và SSE3 cũng như các tối ưu hóa khác. Intel không bảo đảm tính sẵn có, các chức năng hoặc sự hiệu quả của bất kỳ tối ưu hóa nào trên các bộ vi xử lý không do Intel sản xuất. Những tối ưu hóa phụ thuộc bộ vi xử lý trong sản phẩm này nhằm mục đích sử dụng với các bộ vi xử lý Intel. Một số tối ưu hóa không cụ thể cho vi kiến trúc Intel® được dành cho các bộ vi xử lý Intel. Vui lòng xem Hướng dẫn sử dụng và tham khảo cho người dùng để biết thêm thông tin về các chỉ dẫn cụ thể trong thông báo này. Bản hiệu chỉnh thông báo #20110804

5. Cấu trúc phần cứng khác nhau có thể cần mã nguồn khác nhau. Kết quả dựa trên nỗ lực cao nhất của Intel trong việc sử dụng mã được tối ưu để chạy trên tất cả cấu trúc và thực hiện cùng một công việc. Sự tối ưu hóa mã sau đó có thể dẫn đến các kết quả khác nhau. Việc tối ưu hóa dựa vào bộ vi xử lý trong sản phẩm này là nhằm mục đích sử dụng cùng với các bộ vi xử lý của Intel®. Một số tối ưu hóa không cụ thể cho vi kiến trúc của Intel® được dành riêng cho các vi xử lý của Intel. Vui lòng xem Hướng dẫn sử dụng và tham khảo cho người dùng để biết thêm thông tin về các bộ chỉ dẫn cụ thể trong thông báo này. Bản hiệu chỉnh thông báo #20110804