Quy trình phát hiện đối tượng có trong ảnh dựa trên thuật toán xử lý đồng thời HOG-SVM giúp tăng tốc độ xử lý của phần cứng bằng cách sử dụng bộ xử lý nhanh giá trị của lược đồ gradient có hướng kết hợp xử lý 8 điểm ảnh song song, đồng thời không phải chờ giá trị chuẩn hóa được xử lý xong nên giảm được tổng thể thời gian xử lý.
Thuật toán nhận dạng đối tượng sử dụng lược đồ gradient có hướng (Histogram of Oriented Gradient - HOG) kết hợp với thuật toán máy véc-tơ hỗ trợ (SupportVectorMachine - SVM) được ứng dụng phổ biến trong lĩnh vực nhận biết đối tượng. Khái niệm lược đồ gradient có hướng HOG đầu tiên được đề xuất vào năm 1986, sau đó được phổ biến rộng rãi qua báo cáo “Histogram so foriented gradients for human detection” của nhóm tác giả N. Dalal và B. Triggs, tại hội nghị IEEE Computer Society Conferenceon Computer Visionand Pattern Recognition (CVPR’05). Tuy nhiên, các hệ thống, thiết bị thực thi hiện nay đều phải đợi kết quả chuẩn hóa rồi mới tiến hành phân loại bằng thuật toán SVM. Hơn nữa, khi áp dụng thuật toán HOG-SVM lên phần cứng, công đoạn chuẩn hóa và SVM tốn quá nhiều tài nguyên. Điều này làm chậm đáng kể tốc độ quá trình phát hiện đối tượng có trong ảnh. Để khắc phục hạn chế này, các nhà nghiên cứu ở Phòng thí nghiệm trọng điểm Hệ thống tích hợp thông minh (SISLAB), Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội đã đề xuất giải pháp phát hiện đối tượng có trong ảnh dựa trên thuật toán xử lý đồng thời HOG-SVM đểgiúp tăng tốc độ xử lý theo quy trình được mô tả dưới đây.
Quy trình phát hiện đối tượng trong ảnh sử dụng HOG-SVM ứng dụng cho các thiết bị, hệ thống hiện nay thực hiện theo các công đoạn đoạn sau:
• Khung ảnh màu đầu vào, giá trị điểm 3 chiều RGB, được xử lý, biến đổi thành ảnh xám.
• Khung ảnh xám sẽ được chia thành các khối ảnh nhỏ hình vuông hoặc hình chữ nhật.
• Xử lý từng khối ảnh để trích xuất và chuẩn hóa các đặc tính HOG.
• Phân biệt từng khối ảnh có đối tượng hay không nhờ thuật toán SVM.
Khi áp dụng thuật toán HOG-SVM lên phần cứng, bước chuẩn hóa HOG và phân loại SVM tốn quá nhiều tài nguyên như phép nhân, chia, phép căn bậc hai, phép bình phương, phép biến đổi lượng giác. Với các phương thức chuẩn hóa khác như L1-Norm hay L1-Sqrt-Norm, tuy có thể làm giảm thiểu được phép bình phương hoặc phép căn bậc hai nhưng phần cứng vẫn không thể tránh khỏi việc sử dụng nhiều phép chia. Hơn hết, các thiết bị, hệ thống thực thi thuật toán HOG-SVM hiện nay đều phải đợi kết quả chuẩn hóa rồi mới tiến hành phân loại nhờ thuật toán SVM. Điều này làm chậm đáng kể tốc độ quá trình phát hiện đối tượng trong ảnh.
Với mong muốn khắc phục những nhược điểm trên, PGS.TS. Trần Xuân Tú, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội cùng các cộng sự đã tiến hành nghiên cứu để tìm ra quy trình phát hiện đối tượng có trong ảnh dựa trên thuật toán xử lý đồng thời HOG-SVM giúp tăng tốc độ xử lý của phần cứng bằng cách sử dụng bộ xử lý nhanh giá trị của lược đồ gradient có hướng kết hợp xử lý 8 điểm ảnh song song, đồng thời không phải mất thời gian chờ giá trị chuẩn hóa được xử lý xong nên thời gian xử lý tổng thể được giảm.
Hình 1. Quy trình phát hiện đối tượng có trong ảnh dựa trên thuật toán xử lý đồng thời HOG-SVM.
Bằng phương pháp này, thay vì phải đợi các giá trị của lược đồ gradient có hướng được chuẩn hóa thì các giá trị này sẽ được tiến hành xử lý và phân loại bằng thuật toán SVM luôn. Kết quả xử lý SVM sẽ là giữa các giá trị của các lược đồ gradient có hướng chưa được chuẩn hóa với các hệ số SVM được huấn luyện từ trước đó. Đồng thời, các giá trị của lược đồ gradient có hướng này sẽ được áp dụng xử lý tiền chuẩn hóa HOG bằng cách đi qua các bước tiền chuẩn hóa HOG lần một và tiền chuẩn hóa HOG lần hai. Cuối cùng, kết quả phân loại sẽ là kết quả tích lũy các giá trị chuẩn hóa cộng với ngưỡng phân loại b.
Hình 2. Biểu đồ thực hiện các bước cho quy trình xử lý phát hiện đối tượng có trong ảnh dựa trên thuật toán xử lý đồng thời HOG-SVM
Các bước trên được thực hiện tuần tự theo lược đồ thời gian như mô tả trong Hình 2. Trong đó, bước xử lý nhanh lược đồ gradient có hướng là bước cần thiết cho việc phát hiện đối tượng dựa trên thuật toán HOG-SVM. Tuy nhiên, khác với các phương pháp thông thường, để đáp ứng được lược đồ thời gian đề xuất, nhóm nghiên cứu đã sử dụng phương pháp xử lý lược đồ gradient có hướng mới bằng cách xử lý song song 8 điểm ảnh. Mặt khác, tại bước chuẩn hóa, xử lý và phân loại dựa vào thuật toán SVM thông thường sẽ được tiến hành tuần tự, tiếp nối nhau. Qua đó, quy trình này đề xuất phương án tiến hành xử lý đồng thời chuẩn hóa HOG và phân loại SVM các giá trị của lược đồ gradient có hướng. Kết quả nhận biết đối tượng trong cửa sổ phát hiện sẽ là tổng của ngưỡng phân loại b với tổng tích lũy các giá trị chuẩn hóa HOG.
Nhận thấy tiềm năng và hiệu quả mang lại của Quy trình phát hiện đối tượng có trong ảnh dựa trên thuật toán xử lý đồng thời HOG-SVM cũng như khả năng áp dụng của quy trình này, Trung tâm Thống kê dữ liệu và Phân tích sáng chế - Viện Nghiên cứu sáng chế và Khai thác công nghệ đã tiến hành trao đổi với tác giả, tra cứu để đánh sơ lượcvề tính mới sau đó tư vấn cho nhóm tác giả quy trình, thủ tục và các thông tin để tiến hành đăng ký bảo hộ sáng chế cho nghiên cứu này.
Với sự hỗ trợ rất nhiệt tình và nhanh chóng của Trung tâm Thống kê dữ liệu và Phân tích sáng chế - Viện Nghiên cứu sáng chế và Khai thác công nghệ, nhóm nghiên cứu đã xây dựng, hoàn thiện bản mô tả sáng chế, các hồ sơ thủ tục liên quan, tiến hành đăng ký bảo hộ độc quyền sáng chế và đã có quyết định về việc chấp nhận đơn hợp lệcủa Cục Sở hữu trí tuệ.
(Bản tin này đã được tác giả đọc và đồng ý cho phép đăng tải)
***
Mọi nhu cầu hỗ trợ đăng ký sáng chế/giải pháp hữu ích, khai thác sáng chếsáng chế/giải pháp hữu íchvà các nhu cầu có liên quan, xin vui lòng liên hệ:
Trung tâm Thống kê dữ liệu và Phân tích sáng chế - Viện Nghiên cứu sáng chế và Khai thác công nghệ
Địa chỉ: 39 Trần Hưng Đạo, Hoàn Kiếm, Hà Nội.
Điện thoại: 024 38 228 875 Fax: 024 39 439 663
Hotline: 0931 224 369
E-mail: niptex@most.gov.vn;
Website: niptex.gov.vn