Intel® Data Center Diagnostic Tool cho bộ xử Intel® Xeon® mềm

Tài liệu

Bảo trì & Hiệu năng

000058107

14/03/2022

Giới thiệu

Trình điều Intel® Data Center Diagnostic Tool là một công cụ phần mềm chẩn đoán có thể được chạy trên các nền tảng trung tâm dữ liệu của bạn để:

  • Xác minh chức năng của tất cả các lõi trong Bộ xử lý Intel® Xeon® mềm.
  • Được sử dụng như một phần của chương trình bảo trì hệ thống thông thường.

Độ tin cậy và tính khả dụng cao trong trung tâm dữ liệu đòi hỏi phải có các công cụ phù hợp và cam kết bảo trì. Intel tin rằng đây là phương pháp tốt nhất trong ngành để sử dụng các công cụ bảo trì như những công cụ này cho cả việc triển khai ban đầu và kiểm tra định kỳ để giúp đảm bảo trải nghiệm hệ thống tốt nhất.

    Lưu ý
    • Cơ sở hạ tầng máy tính hiện đại mang lại nhu cầu ngày càng tăng về sức mạnh xử lý kết hợp với kỳ vọng của doanh nghiệp về chất lượng dịch vụ và tính khả dụng cao (và đảm bảo về các thỏa thuận cấp độ dịch vụ [SÉC] nói chung). Những kỳ vọng này nhấn mạnh nhu cầu về các công cụ phần mềm mạnh mẽ có thể giúp dự đoán, xác định và giảm thiểu các lỗi hệ thống bất ngờ có thể ảnh hưởng đến chất lượng dịch vụ hoặc thời gian hoạt động. Đọc một bài báo từ IDC bao gồm nhu cầu về các công cụ chẩn đoán bao gồm các Intel® Data Center Diagnostic Tool.

    Yêu cầu hệ thống

    Phiên bản Intel Data Center Diagnostic Tool là một ứng dụng Linux* có thể được cài đặt và chạy trên nhiều bản phân phối Linux hiện tại. Không có phiên bản Windows* của công cụ này.

    Để có phạm vi bảo hành tốt nhất, chạy ứng dụng trong hệ thống gốc của máy chủ. Có thể chạy nó bên trong bộ chứa hoặc máy ảo, nhưng lưu ý rằng một số chức năng có thể bị vô hiệu hóa.

    Bộ xử lý được hỗ trợ:

    • Bộ xử lý có khả năng Intel® Xeon® rộng thế hệ thứ 3 (trước đây là Ice Lake và Cooper Lake)
    • Bộ xử lý có khả năng Intel® Xeon® rộng thế hệ thứ 2 (trước đây là Cascade Lake)
    • Bộ xử lý có khả Intel® Xeon® rộng thế hệ thứ 1 (trước đây là Skylake)
    • Intel® Xeon® xử lý dòng E5 v4 (trước đây là Broadwell)
    • Intel® Xeon® xử lý dòng E7 v4 (trước đây là Broadwell)
    Lưu ý
    • Đối với các nhà phát triển: Intel bắt đầu Dự án Chẩn đoán Trung tâm Dữ liệu Mở, mở khung Chẩn đoán Trung tâm Dữ liệu của Intel và cung cấp các bài kiểm tra chọn lọc. Điều này cung cấp cho các nhà phát triển một khung phát triển thử nghiệm nhất quán mời sự sáng tạo của cộng đồng Nguồn mở để tăng cường quản lý đội tàu đám mây thông qua việc phát triển các màn hình thử nghiệm độc đáo và các giải pháp sáng tạo khác. Để biết thêm thông tin và truy cập vào khung và thử nghiệm này

    Cài đặt

    Ghi chú
    • Các chi tiết bổ sung có sẵn trong tệp /usr/share/doc/dcdiag/README.rst được bao gồm trong cài đặt.
    • Chúng tôi khuyên bạn nên sử dụng các bước trong các phần dưới đây để liên kết đến kho lưu trữ, đảm bảo bạn nhận được phiên bản mới nhất của danh sách Intel® Data Center Diagnostic Tool. Tuy nhiên, nếu bạn yêu cầu tệp nhị phân có thể tải xuống, hãy sử dụng tệp RPM hoặc DEB.

     

    Ubuntu*/Ubuntu*

    Để cài đặt các Intel® Data Center Diagnostic Tool mềm đóng gói trên các bản phân phối dựa trên Nghệ Thuật*, thêm kho Intel software gói của bạn và cài đặt các gói phù hợp.

    Trước khi sao chép +dán vào bảng điều khiển của bạn, bạn có thể muốn chạy sudo ls và nhập mật khẩu của mình để ngăn các lệnh được sử dụng bởi lời nhắc mật khẩu sudo :

    Thiết lập khóa để xác minh tính xác thực của gói

    curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add -

    Thiết lập kho lưu trữ

    sudo apt-add-repository 'deb https://repositories.intel.com/dcdt/debian stable main'

    Cài đặt gói

    sudo apt-get update
    sudo apt-get install dcdiag

    Fedora*/CentOS*/RHEL*

    Để cài đặt các Intel Data Center Diagnostic Tool mềm đóng gói trên bản phân phối dựa trên Fedora, thêm kho Intel software hành và cài đặt gói.

    Lần đầu tiên bạn cài đặt, YUM hoặc DNF sẽ nhắc bạn chấp nhận khóa ký. Kiểm tra xem dấu vân tay có như sau không, sau đó chấp nhận:
    Userid: "CN=Release Key"
    Fingerprint: 6226 CA48 AAB6 0900 2093 C7C4 0A04 4B42 CF00 5B79

    Trước khi sao chép +dán vào bảng điều khiển của bạn, bạn có thể muốn chạy sudo ls và nhập mật khẩu của mình để ngăn các lệnh được sử dụng bởi lời nhắc mật khẩu sudo :

    Cài đặt tệp kho lưu trữ

    sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm

    Cài đặt gói

    sudo yum install dcdiag

    OpenSUSE*/SUSE Linux Enterprise*:

    Cài đặt tệp kho lưu trữ

    sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo

    Cài đặt gói

    sudo zypper install dcdiag

    Bạn sẽ được cảnh báo rằng respond.xml không có chữ ký. Trả lời có để tiếp tục. Bạn sẽ được trao một cơ hội khác để xác minh tính xác thực của gói sản phẩm. Kiểm tra xem dấu vân tay có như sau không, sau đó chấp nhận:

    Repository: dcdiag
    Key Name: CN=Release Key
    Key Fingerprint: 6226CA48 AAB60900 2093C7C4 0A044B42 CF005B79
    Key Created: Tue 24 Nov 2020 01:47:38 PM PST
    Key Expires: Sat 25 Nov 2023 01:47:38 PM PST
    Rpm Name: gpg-pubkey-cf005b79-5fbd7f7a

     

    Cách kiểm tra bộ xử lý Intel Xeon nhân

    Sau khi được cài đặt, trình điều Intel Data Center Diagnostic Tool tự động được bật để thực thi nền. Bạn có thể xác minh rằng điều này thành công với lệnh sau:

    # systemctl status dcdiag
    ● dcdiag.service - Intel® Data Center Diagnostic Tool
    Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
    Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
    Docs: file:///usr/share/doc/dcdiag/README.rst
    Main PID: 8777 (dcdiag)
    CGroup: /system.slice/dcdiag.service
    └─8777 /usr/bin/dcdiag --service

    Lưu ý

    Nếu bạn muốn tắt thực thi Intel Data Center Diagnostic Tool nền của trình điều khiển, hãy chạy:

    systemctl disable --now dcdiag

    Để biết thêm thông tin về việc sử dụng lệnh systemctl(1) , hãy tham khảo trang hướng dẫn sử dụng Linux*.

    Nếu phát hiện được bất kỳ lỗi nào Intel Data Center Diagnostic Tool thực hiện trong nền, công cụ sẽ đăng nhập vào nhật ký hệ thống. Công cụ cũng có thể truy vấn nếu phát hiện bất kỳ lỗi nào trong quét nền bằng cách sử dụng tham số --query.

    # dcdiag --query
    Intel® Data Center Diagnostic Tool Version 506
    Test completed successfully. No issues detected.

    Công cụ này cũng có thể được chạy thủ công ở nền trước bằng cách thực hiện tại dấu nhắc lệnh Linux:

    # dcdiag

    Bài kiểm tra thủ công chạy trong khoảng 45 phút và có mức sử dụng CPU cao.

    Khi chẩn đoán hoàn tất, hệ thống sẽ trả về một trong các thông báo sau:

    • Thử nghiệm đã hoàn thành thành công. Không phát hiện ra sự cố nào.
       
    • Thử nghiệm đã hoàn thành thành công. Đã xảy ra một hoặc nhiều lỗi kiểm tra máy. Vui lòng kiểm tra nhật ký hệ thống.
       
    • Phiên bản công cụ này không hỗ trợ bộ xử lý này.

      Kiểm tra mẫu và phiên bản bộ xử lý của hệ thống. Thông báo này xuất hiện nếu trình điều khiển Intel Data Center Diagnostic Tool phát hiện phiên bản sản xuất của bộ xử lý được hỗ trợ. Công cụ này không hỗ trợ các mẫu kỹ thuật.

      Tìm trợ giúp trong việc xác định bộ xử lý.
       
    • Đã hoàn thành thử nghiệm. Kết quả không có kết quả do phiên bản vi mã lỗi thời.

      Phiên bản mới nhất của vi mã giải quyết các vấn đề đã biết. Vui lòng cập nhật. Các bản cập nhật vi mã thường do nhà cung cấp phân phối Linux của bạn cung cấp cùng với các bản sửa lỗi bảo mật và các bản cập nhật chương trình cơ sở khác cho các thành phần khác nhau. Nếu hệ thống của bạn không bật các bản cập nhật này, chúng tôi khuyên bạn nên kích hoạt chúng. Vi mã này được nhân Linux tự động tải vào mỗi lần khởi động và có thể được tải lại khi chạy với lệnh dưới dạng gốc:

      echo 1 > /sys/devices/system/cpu/microcode
       
    • Đã hoàn thành thử nghiệm. Kết quả không có kết quả do hệ thống vượt quá giới hạn nhiệt độ

      Điều này có thể là do nhiều vấn đề với hệ thống không cung cấp đủ khả năng làm mát cho CPU hoạt động trong giới hạn nhiệt độ bắt buộc. Chúng tôi khuyên bạn nên kiểm tra hệ thống của mình để đảm bảo hệ thống làm mát cần thiết đang hoạt động chính xác. Điều này có thể bao gồm quạt bị lỗi, luồng không khí không chính xác hoặc một số vấn đề môi trường khác.
       
    • Đã hoàn thành thử nghiệm. Kết quả không có kết quả, một hoặc nhiều lỗi kiểm tra máy đã xảy ra.

      Kiểm tra nhật ký hệ thống.
       
    • Thử nghiệm không thành công. Liên hệ với nhà sản xuất hệ thống hoặc nhà cung cấp bộ xử lý của bạn để được hỗ trợ.

      Nếu kết quả kiểm tra cho thấy không thành công, hãy kiểm tra xem bộ xử lý của nút máy chủ của bạn có được bảo hành hay không:

      • Nếu bạn có Bộ xử lý đóng hộp Intel® Xeon® hành dưới 3 năm, hãy liên hệ với bộ phận Hỗ trợ khách hàng của Intel để được hỗ trợ.
      • Nếu bạn có bộ xử lý khay, hãy liên hệ với nhà cung cấp hệ thống hoặc nhà cung cấp bộ xử lý hoặc nơi mua của bạn để kiểm tra xem bộ xử lý có được bảo hành hay không.
        Lưu ýBộ xử lý khay được bán trực tiếp cho các nhà sản xuất hệ thống hoặc nhà phân phối được ủy quyền của Intel. Intel không cung cấp bảo hành trực tiếp cho người dùng cuối cho bộ xử lý khay trừ khi chúng được lắp sẵn trong hệ Khối Trung tâm Dữ liệu Intel® (Intel® DCB) của bạn. Trừ các Intel DCB hành khác, bảo hành của bộ xử lý khay là từ nhà cung cấp hoặc nơi mua bộ xử lý hoặc hệ thống nếu bộ xử lý được cài đặt sẵn. Intel khuyến nghị nên mua từ các Nhà phân phối được ủy quyền của Intel, Nhà cung cấp được chấp thuận của Intel và các đại lý bán lại các sản phẩm của Intel®.
      • Lưu ý rằng Intel không có chương trình thay thế hết bảo hành.
         
    • Thử nghiệm không thành công.

      Đã hoàn thành thử nghiệm và phát hiện một lỗi trên bộ xử lý vật lý có chứa /sys/devices/system/cpu/cpuXX.

      Liên hệ với nhà sản xuất hệ thống hoặc nhà cung cấp bộ xử lý của bạn để được hỗ trợ.

    • Thử nghiệm không thành công.

      Kiểm tra không thể xác định bộ xử lý vật lý nào gây ra sự cố.

      Liên hệ với nhà sản xuất hệ thống hoặc nhà cung cấp bộ xử lý của bạn để được hỗ trợ.
       

    Lịch sử phiên bản

    NgàyPhiên bảnMô tả
    Ngày 7 tháng 7 năm 2021540Phiên bản ban đầu

     

    Chủ đề liên quan
    Trang web Trung tâm hỗ trợ Intel® Xeon® trợ
    Hướng dẫn Bảo hành cho Bộ xử lý Intel®