Phân tích nhiều dữ liệu hơn với thông lượng gấp 1,72 lần Khối lượng công việc Apache Spark với các phiên bản Amazon EC2 M5n có Bộ xử lý có khả năng thay đổi Intel Xeon thế hệ thứ 2

Apache Spark

  • Phân tích nhiều dữ liệu hơn với thông lượng gấp 1,57 lần trên các phiên bản nhỏ.

  • Thông lượng trên các phiên bản trung bình gấp 1,42 lần.

  • Thông lượng trên các phiên bản lớn gấp 1,72 lần.

author-image

Bởi

Tính năng phiên bản của phiên bản Amazon Web Services dòng M5n Intel® Xeon® có thể mở rộng

Tăng thông lượng cho Học máy với các phiên bản Amazon EC2 M5n Series dành cho bộ xử lý có khả năng Intel Xeon rộng

Khi Dữ liệu lớn tiếp tục phát triển, các tổ chức phải tìm cách sắp xếp và khai thác những bài học được thu được từ dữ liệu đó để duy trì tính nhanh nhạy trên thị trường. Chạy phân tích dữ liệu trong việc giảm tải đám mây khi có những phức tạp về quản trị prem, nhưng nó có thể khiến bạn khó phân biệt được tác động mà lựa chọn phiên bản có thể có trên hiệu suất của khối lượng công việc phân tích dữ liệu phức tạp. Đối với khối lượng công việc Apache Spark trên Amazon EC2, việc chọn phiên bản M5n được kích hoạt bởi bộ xử lý có khả năng thay đổi Intel Xeon thế hệ thứ 2 có thể cung cấp nhiều thông lượng hơn để sắp xếp nhiều dữ liệu hơn tại một thời điểm để cung cấp thông tin chi tiết nhanh hơn.

Trong các thử nghiệm về hai triển khai học máy so sánh các phiên bản Amazon EC2, các phiên bản dòng M5n mới hơn được hỗ trợ bởi hệ Intel Xeon.

Bộ xử lý có thể mở rộng hoạt động tốt hơn các phiên bản dòng M4 cũ hơn với bộ xử lý Intel Xeon E5 v4, cung cấp thông lượng dữ liệu lên đến 1,72 lần cho khối lượng công việc Apache Spark.

Cho dù khối lượng công việc học máy của bạn yêu cầu, quy mô phiên bản nhỏ, trung bình hay lớn, việc chọn các phiên bản dòng M5n có bộ xử lý có khả năng thay đổi Intel Xeon thế hệ thứ 2 so với các phiên bản M4 cũ có thể phân tích nhiều dữ liệu hơn và cung cấp thông tin chi tiết hữu ích nhanh hơn.

Cải thiện thời gian để hiểu rõ hơn về các phiên bản nhỏ

Tất cả dữ liệu mà tổ chức thu thập chỉ đáng giá nếu họ có thể nhanh chóng hiểu được điều đó. Ví dụ: dự đoán sở thích của khách hàng và các suy luận tương tự phải hoạt động trong thời gian thực để có tác động đến doanh nghiệp — và điều này đòi hỏi công nghệ cập nhật có thể mang lại kết quả nhanh hơn.

Hình 1. So sánh thông lượng tương đối trên các phiên bản nhỏ (8 vCPU/32GB RAM) để phân loại Nasve Bayesian và khối lượng công việc phân nhóm k có nghĩa là từ bộ tiêu chuẩn HiBench.

Các thử nghiệm so sánh các phiên bản nhỏ với tám vCPU cho thấy việc chọn các phiên bản Amazon EC2 M5n có bộ xử lý có khả năng thay đổi Intel® Xeon® thế hệ thứ 2 cung cấp thông lượng lên đến 1,57 lần thông lượng cho khối lượng công việc học máy Apache Spark của các phiên bản dòng M4 với bộ xử lý Intel Xeon E5 v4.

Cải thiện thời gian để hiểu rõ hơn về các phiên bản trung bình

Cũng như với các phiên bản nhỏ, các thử nghiệm so sánh các phiên bản trung bình với 16 vCKU cho thấy các phiên bản Amazon EC2 M5n có bộ xử lý có khả năng thay đổi Intel® Xeon® thế hệ thứ 2 đã cải thiện cả hai triển khai học máy trên Apache Spark— trong trường hợp này, mang lại thông lượng lên đến 1,42 lần của các phiên bản M4 cũ.

Hình 2. So sánh thông lượng tương đối trên các phiên bản trung bình (16 vCPU/64GB RAM) để phân loại Nasve Bayesian và khối lượng công việc phân nhóm k có nghĩa là từ bộ tiêu chuẩn HiBench.

Cải thiện thời gian để hiểu rõ hơn về các phiên bản lớn

Thử nghiệm cho thấy kích thước phiên bản lớn (với 64 vCPU) làm tăng đáng kể hiệu năng học máy, cung cấp thông lượng lên đến 1,72 lần thông lượng của các phiên bản chuỗi M4 cho khối lượng công việc cụm k có nghĩa là.

Hình 3. So sánh thông lượng tương đối trên các phiên bản lớn (64 vCPU/256GB RAM) để phân loại Nasve Bayesian và khối lượng công việc phân nhóm k có nghĩa là từ bộ tiêu chuẩn HiBench.

Điều này có nghĩa là các tổ chức đang tìm cách nhanh chóng có được thông tin chi tiết hữu ích từ dữ liệu có thể hưởng lợi từ việc chọn các phiên bản Amazon EC2 M5n đã được nâng cấp được kích hoạt bởi bộ xử lý có khả năng thay đổi Intel Xeon thế hệ thứ 2, bất kể kích thước của các phiên bản mà họ yêu cầu.

Tìm hiểu thêm

Để bắt đầu triển khai Apache Spark của bạn trên các phiên bản dòng Amazon EC2 M5n với bộ xử lý có khả năng Intel Xeon rộng thế hệ thứ 2, hãy truy cập http://intel.com/AWS.

Để biết thêm chi tiết thử nghiệm, hãy truy cập http://facts.pt/3Kjn66x.

Nội dung gốc bằng tiếng Anh trên trang này vừa do con người vừa do máy dịch. Nội dung này chỉ để cung cấp thông tin chung và giúp quý vị thuận tiện. Quý vị không nên tin đây là thông tin hoàn chỉnh hoặc chính xác. Nếu có bất kỳ mâu thuẫn nào giữa bản tiếng Anh và bản dịch của trang này, thì bản tiếng Anh sẽ chi phối và kiểm soát. Xem phiên bản tiếng Anh của trang này.