Chuyển đến nội dung chính
Hỗ trợ cơ sở tri thức

Tại sao định dạng mẫu định lượng vẫn là FP32 thay vì INT8?

Loại nội dung: Thông tin sản phẩm & Tài liệu   |   ID bài viết: 000095064   |   Lần duyệt cuối: 13/06/2023

Mô tả

  • Mô hình ONNX định lượng với định dạng chính xác FP32.
  • Chạy chức compress_model_weights để giảm kích thước của tệp bin sau khi thực hiện Định lượng sau đào tạo.
  • Đã biên dịch mô hình và nhận thấy rằng đầu ra của mô hình là trong FP32 thay vì INT8.

Độ phân giải

Trong quá trình định lượng chỉ các hoạt động cần thiết trong quan điểm hiệu suất đã được định lượng. Các hoạt động còn lại sẽ vẫn là FP32 trong đầu ra.

Thông tin bổ sung

Các sản phẩm liên quan

Bài viết này áp dụng cho các sản phẩm 3.
Phần mềm bộ xử lý Intel® Xeon Phi™ OpenVINO™ toolkit Thư viện hiệu năng

Tuyên bố miễn trừ trách nhiệm

Nội dung gốc bằng tiếng Anh trên trang này vừa do con người vừa do máy dịch. Nội dung này chỉ để cung cấp thông tin chung và giúp quý vị thuận tiện. Quý vị không nên tin đây là thông tin hoàn chỉnh hoặc chính xác. Nếu có bất kỳ mâu thuẫn nào giữa bản tiếng Anh và bản dịch của trang này, thì bản tiếng Anh sẽ chi phối và kiểm soát. Xem phiên bản tiếng Anh của trang này.