Ảnh từ CS231
Mục tiêu của ngành nghiên cứu này là viết ra những chương trình có thể hiểu được với hình ảnh.
Khởi đầu của môn học này là một project hè ở MIT.
Vậy những loại data nào có thể trích xuất từ một hình ảnh:
- Ma trận 3D
- Ngữ nghĩa của một hình ảnh
Ví dụ về Image Captioning
Một bức ảnh bao gồm rất nhiều pixel. Một pixel có thể thể hiện cường độ của 3 màu: đỏ, xanh lục và xanh dương (R - Red, G - Green, B - Blue).
Một bức ảnh là một hàm chạy từ cho đến
-
Được giới hạn trong một hình chữ nhật hữu hạn các cạnh a, b, c, d. Mỗi một pixel trong miền giới hạn đó có giá trị dao động từ 0 đến 255.
Hình ảnh từ Lecture 4 - CS131 - Stanford
Các bạn có thể thấy mỗi pixel có thể là một hàm độc lập, và tập hợp các hàm độc lập này tạo nên một bức ảnh.