Mục đích
Phân lớp hình ảnh dựa trên tập hình ảnh đã được gán nhãn.
AutoML Vision hoạt động như thế nào?
Bước chuẩn bị tập dữ liệu huấn luyện:
AutoML Vision cho phép chúng ta có thể huấn luyện mô hình máy học để phân lớp hình ảnh theo tập nhãn đã được định nghĩa trước.
Yêu cầu tối thiểu của AutoML Vision là 10 hình/nhãn. Khả năng phân lớp thành công phụ thuộc vào số lượng hình ảnh có độ phân giải cao. Google khuyên cáo nên dùng ít nhất 100 hình/ nhãn để đạt được kết quả tốt. Các định dạng ảnh hỗ trợ bao gồm JPEG, PNG, WEBP GIF, BMP, TIFF, ICO với dung lượng tối đa 30MB cho tập huấn luyện và định dạng JPEG, PNG, GIF với dung lượng tối đa 1.5MB cho hình ảnh dùng để dự đoán.
Hình ảnh có thể được gán 1 hoặc nhiều nhãn tại thời điểm tạo bộ dữ liệu (dataset) huấn luyện
Huấn luyện mô hình máy học:
Mặc định, AutoML Vision sẽ chia bộ dữ liệu thành 3 tập:
- TRAIN - 80% được sử dụng để huấn luyện.
- VALIDATION - 10% được sử dụng để lựa chọn parameter phù hợp để tối ưu hóa thuật toán hoặc/và quyết định khi nào sẽ kết thúc quá trình huấn luyện.
- TEST - 10% được sử dụng để kiểm tra model.
Google sử dụng parameter “computer hours” để cải thiện độ chính xác của model với giá như sau:
- 1 computer hour: miễn phí 10 model trong 1 tháng
- N computer hour: 1 < n<=24, 20$/hour, với điều kiện bộ dữ liệu lớn hơn 1000 hình
Trong giai đoạn training, Google dùng ngưỡng mặc định (score threshold) là 0.5 để kiểm tra độ chính xác của mô hình. Với ngưỡng 0.5, kết quả Precision và Recall như sau
Đánh giá mô hình huấn luyện:
Sau khi training, chúng ta có thể hiệu chỉnh score threshold để xem sự thay đổi của Precision và Recall và quyết định giá trị score threshold phù hợp với bài toán.
AutoML hiển thị confusion matrix cho chúng ta biết lớp nào được phân loại đúng nhiều nhất và dữ liệu thuộc lớp nào thường bị phân loại nhầm vào lớp khác
Transfer learning: với bộ dữ liệu trên 1000 hình ảnh, chúng ta có thể sử dụng kết quả vừa train để train model mới với độ chính xác cao hơn.
Kiểm tra mô hình huấn luyện:
- Trên Google Cloud Portal
- Với Python API
Giải pháp đề xuất
Demo