Get More Performance for Every Dollar You Spend on AWS*, with Your Data on Intel

Discover the advantage of choosing instances based on Intel® Xeon® Scalable processors.

Are you getting the best value from your AWS* investment?

The cloud gives you the scalability, reliability, and flexibility you need, but not all clouds are created equal: Some instances deliver much more value than others. To understand the optimal choice for your workloads, you have to look at how those specific workloads perform. A generic performance statistic might not tell you much about the results you’ll actually see, especially if you’re running workloads that are compute-intensive or data-intensive. Similarly, knowing the price per instance doesn’t tell you much about the price per transaction, or any other real business or performance metric. You have to look closer.

For example, did you know that AWS* instances based on Intel® Xeon® Scalable processors can offer up to 4.15x higher performance per dollar for high-performance computing (HPC) workloads1, compared to instances based on AMD EPYC* processors, according to the High-performance Linpack* benchmark? They offer up to 2.19x higher performance per dollar according to the LAMMPS* benchmark.1 For database workloads on AWS, Intel® Xeon® Scalable processors can deliver up to 2.84x the higher performance per dollar2; and for memory bandwidth intensive workloads, they can enable up to 2.25x higher performance per dollar.3 If you’re running web-based workloads such as server-side Java* or Wordpress PHP/HHVM*, you might find they give you up to 1.74x higher performance per dollar running on Intel.4

If you’re already using Intel® processors, you could also make a saving by moving to a more modern instance, based on the Intel® Xeon® Scalable processor, too. TSO Logic delivers data-driven recommendations to right-size and right-cost compute across public and private cloud. It studied millions of data points across its 100,000-instance repository of anonymized AWS customer data. The conclusion? 19 percent of current instances could save money by moving to newer, smaller Amazon EC2* instance types that offer equivalent performance, at lower cost. For example, migrating from older C4.8XLarge to newer C5.4XLarge instances can save up to 50% of your cloud costs, over $3000 per instance.5 What’s more, the savings can add up fast if you’re licensing software per core. TSO Logic found that one workload could be delivered using 40 fewer cores running on newer instances based on the 2nd Generation Intel® Xeon® Scalable processor.5 If you run a commercial database licensed at $1,800 per core, you could save $72,000 per year by cutting the core count by 40.5

The Intel® Xeon® Scalable processors and 2nd Generation Intel® Xeon® Scalable processors have a number of optimizations built in to accelerate your workloads. The INT8 number format enables unnecessary detail to be discarded to accelerate machine learning; and Intel® Deep Learning Boost (Intel® DL Boost) provides a new processor instruction to speed up inference in applications such as image classification, speech recognition, language translation, and object detection. Intel® Advanced Vector Extensions 512 (Intel® AVX-512) provides 512-bit vector instructions to accelerate floating point calculations, including scientific simulations. Intel® Turbo Boost Technology enables you to run cores faster than the base operating frequency to give you extra performance when you need it most. To help protect your data, Intel® Advanced Encryption Standard New Instructions (Intel® AES-NI) provides processor instructions to accelerate encryption and decryption.

Notices and Disclaimers:

Software and workloads used in performance tests may have been optimized for performance only on Intel® microprocessors. Performance tests, such as SYSmark* and MobileMark*, are measured using specific computer systems, components, software, operations, and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more complete information visit www.intel.vn/benchmarks.

Performance results are based on testing as of the date set forth in the Configurations and may not reflect all publicly available security updates. See configuration disclosure for details. No product or component can be absolutely secure.
Intel does not control or audit third-party data. You should review this content, consult other sources, and confirm whether referenced data are accurate.

Cost reduction scenarios described are intended as examples of how a given Intel®-based product, in the specified circumstances and configurations, may affect future costs and provide cost savings. Circumstances will vary. Intel does not guarantee any costs or cost reduction.

Intel® technologies' features and benefits depend on system configuration and may require enabled hardware, software, or service activation. Performance varies depending on system configuration. Check with your system manufacturer or retailer or learn more at intel.vn.

Intel, the Intel logo, and Xeon are trademarks of Intel Corporation or its subsidiaries in the U.S. and/or other countries.

*Other names and brands may be claimed as the property of others. 
© Intel Corporation

Thông tin Sản phẩm và Hiệu năng

1

Kết quả do Intel tính toán bằng cách sử dụng cách định giá AWS (USD/giờ, thời hạn 1 năm tiêu chuẩn, không thanh toán trước) kể từ ngày 12 tháng 1 năm 2019.
Thử nghiệm hiệu năng mỗi USD được thực hiện trên các phiên bản AWS* EC2 M5 và M5a (https://aws.amazon.com/ec2/instance-types/), so sánh hiệu năng mỗi đô la của 96 vCPU bộ xử lý có khả năng thay đổi Intel® Xeon® với hiệu năng mỗi đô la của bộ xử lý AMD EPYC*.

Khối lượng công việc: LAMMPS*
Kết quả: hiệu năng mỗi đô la của AMD EPYC = cấu hình cơ bản là 1; hiệu năng mỗi đô la của bộ xử lý có khả năng thay đổi Intel® Xeon® = 2,19 lần (cao hơn là tốt hơn).
Khoa học vật liệu HPC – LAMMPS (cao hơn là tốt hơn):
Phiên bản AWS M5.24xlarge (Intel), phiên bản LAMMPS: 22/08/2018 (Mã: https://lammps.sandia.gov/download.html), Khối lượng công việc: Water – 512K Hạt, Intel ICC 18.0.3.20180410, Intel® MPI Library cho hệ điều hành Linux*, Phiên bản 2018 Bản cập nhật 3 Bản dựng 20180411, 48 cấp MPI, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=2, Điểm 137,5 bước nhảy thời gian/giây, do Intel đo vào ngày 31/10/2018.
Phiên bản AWS M5a.24xlarge (AMD), phiên bản LAMMPS: 22/08/2018 (Mã: https://lammps.sandia.gov/download.html), Khối lượng công việc: Water – 512K Hạt, Intel ICC 18.0.3.20180410, Intel® MPI Library cho hệ điều hành Linux*, Phiên bản 2018 Bản cập nhật 3 Bản dựng 20180411, 48 cấp MPI, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=2, Điểm 55,8 bước nhảy thời gian/giây, do Intel đo vào ngày 07/11/2018.
Các thay đổi để AMD hỗ trợ AVX2 (AMD chỉ hỗ trợ AVX2, do đó các thay đổi này là cần thiết):
sed -i 's/-xHost/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi
sed -i 's/-qopt-zmm-usage=high/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi

Khối lượng công việc: Linpack* hiệu năng cao
Kết quả: hiệu năng mỗi đô la của AMD EPYC = cấu hình cơ bản là 1; hiệu năng mỗi đô la của bộ xử lý có khả năng thay đổi Intel® Xeon® = 4,15 lần (cao hơn là tốt hơn).
HPC Linpack (cao hơn là tốt hơn):
Phiên bản AWS M5.24xlarge (Intel), HP Linpack phiên bản 2.2 (https://software.intel.com/en-us/articles/intel-mkl-benchmarks-suite Danh mục: benchmarks_2018.3.222/linux/mkl/benchmarks/mp_linpack/bin_intel/intel64), Intel ICC 18.0.3.20180410 với AVX512, Intel® MPI Library cho hệ điều hành Linux*, Phiên bản 2018 Bản cập nhật 3 Bản dựng 20180411, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=24, 2 quy trình MPI, Điểm 3152 GB/giây, do Intel đo vào ngày 31/10/2018.
Phiên bản AWS M5a.24xlarge (AMD), HP Linpack phiên bản 2.2, (Nguồn HPL: http://www.netlib.org/benchmark/hpl/hpl-2.2.tar.gz; Phiên bản 2.2; icc (ICC) 18.0.2 20180210 được sử dụng để biên dịch và liên kết đến thư viện BLIS phiên bản 0.4.0; https://github.com/flame/blis; Cờ trình biên dịch Addt’l: -O3 -funroll-loops -W -Wall –qopenmp; tạo arch=zen OMP_NUM_THREADS=8; 6 quy trình MPI.), Intel ICC 18.0.3.20180410 với AVX2, Thư viện Intel® MPI cho hệ điều hành Linux*, Phiên bản 2018 Update 3 Build 20180411, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=8, 6 tiến trình MPI, Điểm 677,7 GB/s, do Intel đo vào ngày 07/11/2018.

2

Kết quả do Intel tính toán bằng cách sử dụng cách định giá AWS (USD/giờ, thời hạn 1 năm tiêu chuẩn, không thanh toán trước) kể từ ngày 12 tháng 1 năm 2019.
Thử nghiệm hiệu năng mỗi USD được thực hiện trên các phiên bản AWS* EC2 R5 và R5a (https://aws.amazon.com/ec2/instance-types/), so sánh hiệu năng mỗi đô la của 96 vCPU bộ xử lý có khả năng thay đổi Intel® Xeon® với hiệu năng mỗi đô la của bộ xử lý AMD EPYC*.

Khối lượng công việc: HammerDB* PostgreSQL*
Kết quả: hiệu năng mỗi đô la của AMD EPYC = cấu hình cơ bản là 1; hiệu năng mỗi đô la của bộ xử lý có khả năng thay đổi Intel® Xeon® = 1,85 lần (cao hơn là tốt hơn).
Cơ sở dữ liệu: HammerDB – PostgreSQL (cao hơn là tốt hơn):
Phiên bản AWS R5.24xlarge (Intel), HammerDB 3.0 PostgreSQL 10.2, Bộ nhớ: 768GB, Phần mềm giám sát máy ảo: KVM; Loại bộ lưu trữ: EBS io1, Dung lượng đĩa 200GB, Tổng dung lượng bộ lưu trữ 200GB, Phiên bản Docker: 18.06.1-ce, Red Hat* Enterprise Linux 7.6, 3.10.0-957.el7.x86_64, 6400MB bộ nhớ đệm chung, 256 kho chứa, 96 người dùng. Điểm “NOPM” 439931, do Intel đo vào ngày 11/12/2018 - 14/12/2018.
Phiên bản AWS R5a.24xlarge (AMD), HammerDB 3.0 PostgreSQL 10.2, Bộ nhớ: 768GB, Phần mềm giám sát máy ảo: KVM; Loại bộ lưu trữ: EBS io1, Dung lượng đĩa 200GB, Tổng dung lượng bộ lưu trữ 200GB, Phiên bản Docker: 18.06.1-ce, Red Hat* Enterprise Linux 7.6, 3.10.0-957.el7.x86_64, 6400MB bộ nhớ đệm chung, 256 kho chứa, 96 người dùng. Điểm “NOPM” 212903, do Intel đo vào ngày 20/12/2018.

Khối lượng công việc: MongoDB*
Kết quả: hiệu năng mỗi đô la của AMD EPYC = cấu hình cơ bản là 1; hiệu năng mỗi đô la của bộ xử lý có khả năng thay đổi Intel® Xeon® = 2,84 lần (cao hơn là tốt hơn).
Cơ sở dữ liệu: MongoDB (cao hơn là tốt hơn):
Phiên bản AWS R5.24xlarge (Intel), MongoDB v4.0, không bật nhật ký, không bật đồng bộ vào hệ thống tập tin, wiredTigeCache=27GB, maxPoolSize = 256; 7 phiên bản MongoDB, 14 máy ảo khách, 1 máy khách YCSB mỗi máy ảo, 96 luồng mỗi máy khách YCSB, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, Điểm 1229288 thao tác/giây, do Intel đo vào ngày 10/12/2018.
Phiên bản AWS R5a.24xlarge (AMD), MongoDB v4.0, không bật nhật ký, không bật đồng bộ vào hệ thống tập tin, wiredTigeCache=27GB, maxPoolSize = 256; 7 phiên bản MongoDB, 14 máy ảo khách, 1 máy khách YCSB mỗi máy ảo, 96 luồng mỗi máy khách YCSB, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, Điểm 388596 thao tác/giây, do Intel đo vào ngày 10/12/2018.
Để biết thêm thông tin chi tiết, vui lòng truy cập www.intel.vn/benchmarks.

3

Phiên bản AWS M5.4xlarge (Intel), McCalpin Stream (phiên bản OMP), (Nguồn: https://www.cs.virginia.edu/stream/FTP/Code/stream.c); Intel ICC 18.0.3 20180410 với AVX512, -qopt-zmm-usage=high, -DSTREAM_ARRAY_SIZE=134217728 -DNTIMES=100 -DOFFSET=0 –qopenmp, -qopt-streaming-stores always -o $OUT stream.c, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS: 8, KMP_AFFINITY: proclist=[0-7:1], granularity=thread, explicit, Điểm 81216,7 MB/giây, do Intel đo vào ngày 06/12/2018.
Phiên bản AWS M5a.4xlarge (AMD), McCalpin Stream (phiên bản OMP), (Nguồn: https://www.cs.virginia.edu/stream/FTP/Code/stream.c); Intel ICC 18.0.3 20180410 với AVX2, -DSTREAM_ARRAY_SIZE=134217728, -DNTIMES=100 -DOFFSET=0 -qopenmp -qopt-streaming-stores always -o $OUT stream.c, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS: 8, KMP_AFFINITY: proclist=[0-7:1], granularity=thread,explicit, Điểm 32154,4 MB/giây, do Intel đo vào ngày 06/12/2018.
Tuyên bố miễn trừ trách nhiệm với OpenFOAM: Phần mềm này được cung cấp mà không được duyệt hoặc xác nhận bởi OpenCFD Limited, nhà sản xuất và phân phối phần mềm OpenFOAM thông qua www.openfoam.com và là chủ sở hữu của thương hiệu OPENFOAM® và OpenCFD®.

4

Kết quả do Intel tính toán bằng cách sử dụng cách định giá AWS (USD/giờ, thời hạn 1 năm tiêu chuẩn, không thanh toán trước) kể từ ngày 12 tháng 1 năm 2019.
Thử nghiệm hiệu năng mỗi USD được thực hiện trên các phiên bản AWS* EC2 M5 và M5a (https://aws.amazon.com/ec2/instance-types/), so sánh hiệu năng mỗi đô la của 96 vCPU bộ xử lý có khả năng thay đổi Intel® Xeon® với hiệu năng mỗi đô la của bộ xử lý AMD EPYC*.

Khối lượng công việc: Server-Side Java* 1 JVM
Kết quả: hiệu năng mỗi đô la của AMD EPYC = cấu hình cơ bản là 1; hiệu năng mỗi đô la của bộ xử lý có khả năng thay đổi Intel® Xeon® = 1,74 lần (cao hơn là tốt hơn).
Server-Side Java (cao hơn là tốt hơn):
Phiên bản AWS M5.24xlarge (Intel), Điểm chuẩn máy chủ Java không liên kết NUMA, 2JVM, OpenJDK 10.0.1, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, Điểm 101767 giao dịch/giây, do Intel đo vào ngày 16/11/2018.
Phiên bản AWS M5a.24xlarge (AMD), Điểm chuẩn máy chủ Java không liên kết NUMA, 2JVM, OpenJDK 10.0.1, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, Điểm 52068 giao dịch/giây, do Intel đo vào ngày 16/11/2018.

Khối lượng công việc: WordPress* PHP/HHVM*
Kết quả: hiệu năng mỗi đô la của AMD EPYC = cấu hình cơ bản là 1; hiệu năng mỗi đô la của bộ xử lý có khả năng thay đổi Intel® Xeon® = 1,75 lần (cao hơn là tốt hơn).
Web Front-End WordPress (cao hơn là tốt hơn):
Phiên bản AWS M5.24xlarge (Intel), oss-performance/wordpress phiên bản 4.2.0; phiên bản 10.2.19-MariaDB-1:10.2.19+maria~bionic; Phiên bản khối lượng công việc': u'4.2.0; Số luồng máy khách: 200; PHP 7.2.12-1; perfkitbenchmarker_version="v1.12.0-944-g82392cc; Ubuntu 18.04, Kernel Linux 4.15.0-1025-aws, Điểm 3626,11 TPS, do Intel đo vào ngày 16/11/2018.
Phiên bản AWS M5a.24xlarge (AMD), oss-performance/wordpress phiên bản 4.2.0; phiên bản 10.2.19-MariaDB-1:10.2.19+maria~bionic; Phiên bản khối lượng công việc': u'4.2.0; Số luồng máy khách: 200; PHP 7.2.12-1; perfkitbenchmarker_version="v1.12.0-944-g82392cc; Ubuntu 18.04, Kernel Linux 4.15.0-1025-aws, Điểm 1838,48 TPS, do Intel đo vào ngày 16/11/2018.
Để biết thêm thông tin chi tiết, vui lòng truy cập www.intel.vn/benchmarks.

5

Nguồn: Báo cáo nghiên cứu TSO Logic / Intel: "New Advances by Intel, Amazon Web Services, Drive Major Cloud Savings” (Tạm dịch: Những cải tiến mới của Intel, Amazon Web Services, thúc đẩy tiết kiệm quan trọng cho đám mây).