Ví dụ thiết kế nhân ma trận

Được đề xuất cho:

  • Thiết bị: Không xác định

  • Quartus: v17.1

author-image

Bởi

Ví dụ này chứa việc triển khai hiệu suất cao của hoạt động nhân ma trận cơ bản và chứng minh tối ưu hóa có thể được mô tả trong Ngôn ngữ Điện toán Mở (OpenCL™) để đạt được hiệu suất được cải thiện đáng kể. Ở cấp độ thuật toán, hạt nhân trong ví dụ này hướng dẫn cách mô tả sự ràng buộc vòng lặp để tận dụng lợi thế của việc tái sử dụng dữ liệu vốn có trong quá trình tính toán.

Ví dụ này cũng trình bày cách sử dụng tính năng mở khóa vòng lặp và tối ưu hóa trình biên dịch kiểu SIMD để dễ dàng tăng hiệu suất của kernel. Như một phần của gói ví dụ, các tham số cho mỗi nhị phân thiết bị được biên dịch sẵn đã được chọn để tối đa hóa hiệu suất trên bo mạch cụ thể đó. Các chi tiết bổ sung có sẵn trong gói ví dụ cho thấy việc tham số hóa hạt nhân dễ dàng như thế nào để nhắm mục tiêu các yêu cầu về hiệu suất và tài nguyên khác nhau.

Ngoài ra, ứng dụng máy chủ được thiết lập để tự động tận dụng nhiều thiết bị OpenCL bằng cách phân phối tính toán và đạt được sự song hành hơn nữa.

Hiệu suất nhân ma trận cao nhất

Tính năng

  • Triển khai tối ưu hóa hoạt động cơ bản
  • Bộ đệm bộ nhớ cục bộ
  • Tối ưu hóa trình biên dịch (mở vòng lặp, thuộc num_simd_work_items mềm)
  • Tối ưu hóa dấu hấp động
  • Thực thi nhiều thiết bị

Tải

Ví dụ thiết kế cung cấp mã nguồn cho thiết bị OpenCL (.cl) cũng như ứng dụng máy chủ. Để biên dịch ứng dụng máy chủ, gói Linux bao gồm một Makefile và gói Windows bao gồm một dự án Microsoft Visual Studio 2010.

Các bản tải xuống sau được cung cấp cho ví dụ này:

Việc sử dụng thiết kế này được điều chỉnh và tuân theo, các điều khoản và điều kiện của thỏa thuận cấp phép thiết kế tham chiếu phần cứng.

Yêu cầu phần mềm và phần cứng

Ví dụ thiết kế này yêu cầu các công cụ sau:

  • Intel FPGA mềm v17.1 hoặc mới hơn
  • Intel FPGA SDK cho OpenCL™ v17.1 trở lên
  • Trên Linux: GNU Make và gcc
  • Trên Windows: Microsoft Visual Studio 2010

Để tải xuống các công cụ thiết kế của Intel, hãy truy cập trang tải xuống OpenCL. Các yêu cầu đối với hệ điều hành cơ bản giống như của Intel FPGA SDK cho OpenCL.

OpenCL và biểu trưng OpenCL là thương hiệu của Apple Inc. được sử dụng với sự cho phép của Khronos.

* Sản phẩm dựa trên Thông số kỹ thuật Khronos được công bố và đã thông qua Quy trình kiểm tra tuân thủ Khronos. Có thể tìm thấy trạng thái tuân thủ hiện tại tại www.khronos.org/conformance.

Nội dung gốc bằng tiếng Anh trên trang này vừa do con người vừa do máy dịch. Nội dung này chỉ để cung cấp thông tin chung và giúp quý vị thuận tiện. Quý vị không nên tin đây là thông tin hoàn chỉnh hoặc chính xác. Nếu có bất kỳ mâu thuẫn nào giữa bản tiếng Anh và bản dịch của trang này, thì bản tiếng Anh sẽ chi phối và kiểm soát. Xem phiên bản tiếng Anh của trang này.