Cận cảnh bàn tay robot đang hái quả cà chua bên cạnh cây cà chua có quả chín. Các hộp màu vàng với dòng chữ Ripe Tomato (Cà chua chín) và giá trị phần trăm cho độ chín được hiển thị xung quanh mỗi hộp, thể hiện công dụng của thị giác máy tính

Thị giác máy tính là gì?

Thị giác máy tính sử dụng trí tuệ nhân tạo (AI) để xem và diễn giải dữ liệu trực quan nhằm cải thiện quy trình, cho phép chủ động phản hồi tình huống với thời gian nhanh hơn đồng thời tăng làm tăng giá trị kinh doanh và khách hàng.

Những điều cần biết về Thị giác Máy tính

  • Thị giác máy tính là một loại hình AI cho phép máy tính và hệ thống hành động dựa trên thông tin chuyên sâu bắt nguồn từ hình ảnh và video.

  • Thị giác máy tính kết hợp điện toán biên, điện toán đám mây, phần mềm và mô hình học sâu AI để nhận dạng, phân loại, phân tích và hành động dựa trên dữ liệu hình ảnh đã thu thập.

  • Các tổ chức đang áp dụng thị giác máy tính vào nhiều trường hợp sử dụng để khai mở các khả năng tự động hóa, hiệu quả công việc và giá trị được cải thiện.

author-image

Bởi

Thị giác máy tính là gì?

Thị giác máy tính là một loại hình AI đào tạo máy tính để mô phỏng cách con người nhìn, hiểu những gì họ nhìn thấy và hành động dựa trên thông tin được xử lý và phân tích đó. Các tổ chức sử dụng thị giác máy tính có thể đạt được nhiều kết quả kinh doanh, bao gồm các quy trình hợp lý hóa, cải thiện hiệu năng, nâng cao trải nghiệm khách hàng và sự khác biệt cạnh tranh lớn hơn trên thị trường của họ.

Thị giác máy tính thường được sử dụng cho các tác vụ tốn thời gian, dễ bị lỗi hoặc gần như không thể thực hiện được, chẳng hạn như nhận dạng và phân loại bất thường, giám sát tình trạng máy, phân tích hình ảnh y tế tự động và phát hiện bệnh. Các loại tác vụ này đòi hỏi các tổ chức phải giám sát hoạt động, quy trình hoặc các bộ phận khác của doanh nghiệp từ nhiều điểm tiếp xúc, tạo ra một lượng dữ liệu hình ảnh được thu thập khổng lồ và, từ đó, phải trích xuất thông tin chuyên sâu—thường trong thời gian gần như thời gian thực—và thực hiện hành động dựa trên đó.

Cách Sử dụng Thị giác Máy tính

Hệ thống thị giác máy tính sử dụng học máy và mô hình học sâu để đào tạo hệ thống nhận ra các khía cạnh của hình ảnh hoặc video và đưa ra dự đoán về chúng. Các loại mô hình thị giác máy tính bao gồm:

 

  • Phân loại hình ảnh để kiểm tra hình ảnh và dán nhãn phân loại trên nội dung. Ví dụ: Mô hình phân loại hình ảnh có thể được sử dụng để dự đoán hình ảnh nào chứa một con chó, con mèo hoặc khách hàng đang tức giận.
  • Phân đoạn hình ảnh để xác định các vật thể và trích xuất chúng từ nền ảnh, chẳng hạn như tách riêng khối u khỏi các mô não xung quanh trong kết quả chụp X-quang.
  • Phát hiện đối tượng để quét hình ảnh hoặc video và tìm các đối tượng mục tiêu. Các mô hình phát hiện đối tượng thường làm nổi bật nhiều đối tượng cùng một lúc và có thể được sử dụng cho các tác vụ như xác định các mặt hàng trên kệ để cải thiện khả năng quản lý hàng tồn kho hoặc bất thường trong các mặt hàng trên dây chuyền sản xuất.
  • Theo dõi đối tượng để theo dõi chuyển động của các vật thể được phát hiện khi chúng di chuyển trong môi trường. Ví dụ: Theo dõi đối tượng có thể được sử dụng trong lái xe tự động để theo dõi người đi bộ trên vỉa hè hoặc khi họ băng qua đường.
  • Trích chọn thuộc tính để tách biệt các đặc điểm hữu ích được chụp trong hình ảnh hoặc video và chia sẻ chúng với thuật toán AI thứ hai, chẳng hạn như tìm kiếm và truy xuất kết hợp hình ảnh. Ví dụ: Trích chọn thuộc tính có thể được sử dụng để tự động hóa giám sát giao thông và phát hiện sự cố.
  • Nhận dạng ký tự quang học để trích xuất và chuyển đổi văn bản từ hình ảnh sang định dạng mà máy có thể đọc được. Mô hình này thường được sử dụng trong ngân hàng và chăm sóc sức khỏe để xử lý các tài liệu quan trọng và hồ sơ bệnh nhân.

Ứng dụng Thị giác Máy tính trong các Ngành công nghiệp

Thị giác máy tính tạo ra nhiều trường hợp sử dụng mới, giúp các công ty trong các ngành công nghiệp giải quyết các vấn đề trong thế giới thực như giảm chi phí vận hành, mở khóa tự động hóa hoạt động kinh doanh và tạo ra các dịch vụ hoặc dòng doanh thu mới. Dưới đây là những ngành công nghiệp hàng đầu sử dụng thị giác máy tính và những cách thú vị mà họ áp dụng công nghệ này.

Tự động hóa và Sản xuất Công nghiệp

Các nhà sản xuất sử dụng thị giác máy tính để kích hoạt tự động hóa, giúp quy trình sản xuất hiệu quả hơn, giảm lỗi nhân công, cải thiện sự an toàn cho người lao động và tạo ra sản lượng cao hơn với chi phí thấp hơn. Một số ứng dụng phổ biến của thị giác máy tính trong sản xuất bao gồm:

 

  • Kiểm tra sản phẩm tự động: Kiểm tra sản phẩm trực quan là bước rất quan trọng để kiểm soát chất lượng. Bằng cách tự động hóa việc kiểm tra quang học bằng camera trên dây chuyền sản xuất, mô hình AI để phân loại lỗi và phát hiện bất thường, và điện toán biên, các nhà sản xuất có thể cải thiện độ chính xác và tốc độ bảo đảm chất lượng.
  • Giám sát an toàn: Thị giác máy tính có thể được sử dụng để giám sát sàn nhà máy nhằm giúp đảm bảo an toàn cho nhân viên. Ví dụ: Phân tích video theo thời gian thực có thể giúp xác định và cảnh báo nhân viên về tai nạn hoặc tràn đổ hoặc phát hiện người xâm nhập vào các khu vực hạn chế, nguy hiểm.

Y tế

Từ chăm sóc phòng ngừa đến lập kế hoạch điều trị ung thư, thị giác máy tính được các tổ chức chăm sóc sức khỏe sử dụng theo nhiều cách khác nhau để giúp cải thiện kết quả của bệnh nhân, nâng cao độ chính xác, tăng tốc phát hiện bệnh và nhiều hơn nữa. Ví dụ về cách thị giác máy tính đang được áp dụng trong chăm sóc sức khỏe bao gồm:

 

  • Chụp ảnh y tế: Trang bị máy quét CT, hệ thống X-quang, camera nội soi và các công nghệ chụp ảnh y tế khác với hệ thống thị giác máy tính có thể giúp xử lý nhanh chóng lượng dữ liệu khổng lồ, quy trình làm việc hợp lý và đánh giá hình ảnh chính xác và hiệu quả. Công nghệ học sâu đang được áp dụng để hỗ trợ chụp ảnh toàn bộ tiêu bản trong bệnh học kỹ thuật số.
  • Giám sát bệnh nhân từ xa: Máy ảnh và cảm biến được trang bị các ứng dụng thị giác máy tính có thể được sử dụng để thu thập và phân tích dữ liệu về chuyển động của bệnh nhân, chẳng hạn như vị trí cổng hoặc cơ thể, để xác định độ lệch so với định mức đã được thiết lập và cảnh báo các thành viên trong nhóm chăm sóc trước các nhu cầu khẩn cấp có thể xảy ra.

Bán lẻ

Từ việc hiểu được nơi đặt sản phẩm đến thời gian tối ưu để sắp xếp lại hàng tồn kho đến theo dõi hành vi khách hàng tại cửa hàng, thị giác máy tính có thể giúp các nhà bán lẻ khám phá những thông tin chuyên sâu về hoạt động của họ để đưa ra quyết định kinh doanh sáng suốt hơn. Một số ứng dụng của thị giác máy tính trong bán lẻ bao gồm:

 

  • Phòng ngừa mất mát: Mô hình thị giác máy tính có thể phân tích dữ liệu từ các camera cửa hàng hiện có hoặc các quầy tự kiểm tra để xác định hành vi nghi ngờ và gửi cảnh báo theo thời gian thực cho các nhà quản lý để họ có thể can thiệp và giúp ngăn chặn gian lận.
  • Thiết bị đầu cuối tự thanh toán không cần cảm ứng: Các nhà bán lẻ muốn tăng hiệu quả và nâng cao trải nghiệm của khách hàng có thể tận dụng công nghệ quét thông minh 3D và mô hình thị giác máy tính để nắm bắt, phát hiện và nhận dạng các mặt hàng thực phẩm không mã hóa, cho phép thanh toán nhanh chóng và thuận tiện với sự can thiệp tối thiểu của nhân viên.

Thành phố thông minh

Các công nghệ thành phố thông minh có thể giúp thu thập nguồn cấp dữ liệu video từ camera đường phố để các nhà lãnh đạo thành phố có thể đưa ra quyết định hoạt động sáng suốt hơn nhằm giúp cải thiện sự an toàn, khả năng di chuyển và chất lượng cuộc sống của người dân. Dưới đây là một vài cách có thể áp dụng thị giác máy tính trong các thành phố thông minh:

 

  • Quản lý giao thông: Chính quyền thành phố có thể triển khai hệ thống thị giác máy tính để giám sát và phân tích các nút giao thông và mô hình giao thông, phát hiện và theo dõi phương tiện và người đi bộ để tối ưu hóa lưu lượng giao thông và giúp tăng cường an toàn tại các nút giao.
  • Bảo trì cơ sở hạ tầng: Các mô hình thị giác máy tính có thể được đào tạo để nhận ra các vấn đề về cầu đường như ổ gà hoặc vỉa hè bị nứt, trên khắp thành phố hoặc toàn bộ quận và thông báo cho các đội ngũ về các địa điểm cần bảo trì.

Cách Thị giác Máy tính Hoạt động

Thị giác máy tính kết hợp các thành phần như điện toán biên, điện toán đám mây, phần mềm và mô hình học sâu AI để cho phép máy tính “xem” dữ liệu được thu thập từ camera và video; nhanh chóng nhận ra các đối tượng, con người và mô hình cụ thể; đưa ra dự đoán về chúng và thực hiện hành động, nếu cần.

Vai trò của Mạng Thần kinh Tích chập

Hệ thống thị giác máy tính sử dụng các mô hình học sâu từ một dòng thuật toán được gọi là mạng thần kinh tích chập (CNN) để hướng dẫn xử lý và phân tích hình ảnh. Các mô hình học sâu này phân tích các giá trị RGB được nhúng trong các điểm ảnh của ảnh kỹ thuật số để phát hiện các mẫu có thể nhận dạng. CNN có thể được phát triển để đánh giá các điểm ảnh dựa trên nhiều tính năng—bao gồm phân phối màu sắc, hình dạng, kết cấu và chiều sâu—đồng thời nhận dạng và phân loại chính xác các đối tượng.

Đào tạo Mô hình Thị giác Máy tính

Trước khi hệ thống thị giác máy tính có thể hoạt động, các nhà khoa học và nhà phát triển dữ liệu phải đào tạo mô hình học sâu của hệ thống cho trường hợp sử dụng cụ thể. Điều này đòi hỏi phải nhập một lượng lớn dữ liệu dành riêng cho ứng dụng mà mô hình có thể sử dụng để nhận dạng những gì mô hình đã được phát triển để xác định. Ví dụ: Đối với ứng dụng thị giác máy tính được thiết kế để nhận dạng một chú chó, trước tiên mô hình phải tìm hiểu xem chú chó trông như thế nào. Mô hình thực hiện được điều này nhờ được huấn luyện bằng hàng ngàn, thậm chí có thể là hàng triệu, hình ảnh của các chú chó thuộc nhiều giống loài, kích cỡ, màu sắc và đặc điểm khác nhau.

Thông thường nhất, đào tạo diễn ra trong các trung tâm dữ liệu hoặc môi trường đám mây. Đối với các sáng kiến đào tạo đặc biệt phức tạp, GPU và bộ gia tốc AI có thể được áp dụng để đẩy nhanh quá trình và xử lý tốt hơn số lượng tham số ngày càng tăng. Sau khi hoàn thành giai đoạn đào tạo, mô hình đã có kiến thức cần thiết để diễn giải và suy luận thông tin từ hình ảnh kỹ thuật số. Mô hình cũng có thể được tinh chỉnh thêm hoặc đào tạo lại theo thời gian.

Cũng cần lưu ý rằng những người đang tìm cách xây dựng các giải pháp thị giác máy tính có thể sử dụng các mô hình nền tảng có sẵn làm điểm khởi đầu để tinh chỉnh nhằm tăng tốc thời gian phát triển và tránh phải bắt đầu từ đầu.

Triển khai các Mô hình Thị giác Máy tính

Sau khi được đào tạo, các mô hình thị giác máy tính có thể được triển khai cho hệ thống máy tính để thực hiện suy luận và diễn giải các điều kiện trong lĩnh vực này—liên tục cung cấp dữ liệu hình ảnh và video để trích xuất thông tin chuyên sâu và thông tin. Trong khi các giải pháp thị giác máy tính có thể chạy khối lượng công việc suy luận trong đám mây hoặc trung tâm dữ liệu, nhiều tổ chức ngày nay đang khám phá các ứng dụng AI biên, nơi các mô hình thị giác máy tính chạy gần hơn với nơi dữ liệu được tạo ra trên phần cứng biên nhẹ và được tối ưu hóa hoặc các thiết bị nhúng.
Di chuyển các khả năng suy luận AI gần hơn có thể mang lại một số lợi ích chính sau đây:

 

  • Tăng tốc độ và độ trễ thấp hơn: Việc di chuyển việc xử lý và phân tích dữ liệu đến nơi dữ liệu được tạo ra giúp tăng tốc độ phản hồi của hệ thống, cho phép các giao dịch diễn ra nhanh hơn và có trải nghiệm tốt hơn, điều quan trọng trong nhiều ứng dụng thị giác máy tính.
  • Cải thiện khả năng quản lý lưu lượng mạng: Giảm thiểu lượng dữ liệu được gửi qua mạng lên đám mây có thể giảm băng thông và chi phí truyền tải và lưu trữ khối lượng dữ liệu lớn.
  • Độ tin cậy cao hơn: Lượng dữ liệu mà mạng có thể truyền đồng thời bị hạn chế. Đối với các địa điểm có kết nối internet phụ, việc lưu trữ và xử lý dữ liệu ở biên sẽ cải thiện độ tin cậy.
  • Bảo mật nâng cao: Với việc triển khai đúng cách, giải pháp điện toán biên có thể tăng cường bảo mật dữ liệu bằng cách hạn chế truyền dữ liệu qua internet.
  • Yêu cầu tuân thủ quyền riêng tư: Một số chính phủ, khách hàng hoặc ngành công nghiệp có thể yêu cầu dữ liệu đang được sử dụng cho các ứng dụng thị giác máy tính vẫn nằm trong thẩm quyền nơi dữ liệu được tạo ra. Điện toán biên có thể giúp các doanh nghiệp tuân thủ các quy tắc và quy định như vậy.

Bắt đầu với Thị giác Máy tính

Thị giác máy tính, giống như các loại hình AI khác, đang tác động đến tất cả các khía cạnh của việc kinh doanh. Thị giác máy tính giúp các công ty thuộc nhiều ngành công nghiệp khác nhau giảm chi phí vận hành, mở khóa tự động hóa kinh doanh và xác định các dịch vụ hoặc luồng doanh thu tiềm năng mới. Các doanh nghiệp có thể khai thác sức mạnh của thị giác máy tính để mở khóa các trường hợp sử dụng, khả năng và đổi mới mới sẽ vươn lên thành những người dẫn đầu trong ngành.
Khi doanh nghiệp của bạn bước lên hành trình AI thị giác máy tính, Intel luôn sẵn sàng hỗ trợ để các sáng kiến AI của bạn được thành công.

Tìm các giải pháp AI có thể mở rộng, sẵn sàng triển khai được tối ưu hóa với phần cứng và phần mềm Intel®

Những câu hỏi thường gặp

Những câu hỏi thường gặp

Thị giác máy tính là một loại hình AI cho phép máy tính “xem” dữ liệu được thu thập từ hình ảnh và video. Hệ thống thị giác máy tính được sử dụng trong nhiều môi trường và ngành công nghiệp khác nhau, chẳng hạn như robot, thành phố thông minh, sản xuất, chăm sóc sức khỏe và các cửa hàng bán lẻ truyền thống.

Thị giác máy tính kết hợp camera, điện toán biên, điện toán trên đám mây, phần mềm và các mô hình AI để giúp hệ thống "xem" và xác định vật thể. Thị giác máy tính sử dụng học sâu để hình thành mạng lưới thần kinh hướng dẫn việc xử lý và phân tích hình ảnh hệ thống, giúp dạy cho máy tính nhận ra các khía cạnh của hình ảnh hoặc video và đưa ra dự đoán về chúng.

Các kỹ thuật mạng thần kinh tích chập (CNN) cho phép suy luận học sâu để phân loại hình ảnh và phát hiện đối tượng. Sau khi đã được đào tạo đầy đủ, các mô hình thị giác máy tính có thể tiến hành nhận dạng đối tượng, phát hiện và nhận diện người, đồ vật hoặc các chi tiết hình ảnh; thậm chí là theo dõi chuyển động.

Thị giác máy tính được sử dụng trong nhiều ngành công nghiệp—bao gồm sản xuất, bán lẻ, chăm sóc sức khỏe và thành phố thông minh—để giúp các doanh nghiệp phản ứng và phản hồi với các tình huống gần như theo thời gian thực. Điều này cho phép cải thiện quy trình và tự động hóa, phát hiện sớm các vấn đề tiềm ẩn, phản hồi nhanh chóng với các tình huống quan trọng và cải thiện trải nghiệm của khách hàng.