ID bài viết: 000057525 Loại nội dung: Bảo trì & Hiệu năng Lần duyệt cuối: 31/01/2023

Tại sao thời gian tải mẫu đến GPU dài hơn CPU?

Môi Trường

OpenVINO™ công cụ Trình cắm GPU Trình cắm CPU

BUILT IN - ARTICLE INTRO SECOND COMPONENT
Tóm tắt

Bước nhanh để cải thiện thời gian tải mẫu trên GPU

Mô tả

Việc tải Trình đại diện trung gian (IR) của mô hình đầu vào sang GPU mất nhiều thời gian hơn so với tải cùng một mô hình lên CPU.

Độ phân giải

Tạo thư mục cl_cache hành theo cách thủ công trong thư mục làm việc của ứng dụng của bạn.

Trình điều khiển sẽ sử dụng thư mục này để lưu trữ các đại diện nhị phân của các hạt nhân được biên dịch. Tính năng này sẽ hoạt động trên tất cả các OS được hỗ trợ.

Thông tin bổ sung

Tham khảo bài viết này để biết thêm thông tin về quản lý tài sản cl_cache.

Việc tải mô hình đầu vào của bạn ở định dạng Đại diện Trung gian (IR) sang GPU mất nhiều thời gian hơn việc tải cùng một mô hình vào CPU vì ngăn xếp GPU dựa trên OpenCL*. Thời gian tải phụ thuộc vào thời gian biên dịch của hạt nhân OpenCL*.

Khi bạn bật trình điều cl_cache, lần đầu tiên bạn tải model, nó sẽ mất nhiều thời gian vì openCL* kernel sẽ biên dịch. Tuy nhiên, mỗi lần tải tiếp theo của cùng một model sẽ nhanh hơn nhiều.

Các sản phẩm liên quan

Bài viết này áp dụng cho 2 sản phẩm

Nội dung gốc bằng tiếng Anh trên trang này vừa do con người vừa do máy dịch. Nội dung này chỉ để cung cấp thông tin chung và giúp quý vị thuận tiện. Quý vị không nên tin đây là thông tin hoàn chỉnh hoặc chính xác. Nếu có bất kỳ mâu thuẫn nào giữa bản tiếng Anh và bản dịch của trang này, thì bản tiếng Anh sẽ chi phối và kiểm soát. Xem phiên bản tiếng Anh của trang này.