Skip to content

Latest commit

 

History

History
 
 

computer-vision

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 

Thị giác Máy tính (Computer Vision - CV)

1. Thị giác máy tính là gì?

Ảnh từ CS231

Mục tiêu của ngành nghiên cứu này là viết ra những chương trình có thể hiểu được với hình ảnh.

Khởi đầu của môn học này là một project hè ở MIT.

Vậy những loại data nào có thể trích xuất từ một hình ảnh:

  • Ma trận 3D
  • Ngữ nghĩa của một hình ảnh

Ví dụ về Image Captioning

2. Pixel và bộ lọc

2.1. Bức ảnh giống như một hàm

Một bức ảnh bao gồm rất nhiều pixel. Một pixel có thể thể hiện cường độ của 3 màu: đỏ, xanh lục và xanh dương (R - Red, G - Green, B - Blue).

Một bức ảnh là một hàm chạy từ cho đến

  • trả về cường độ tại vị trí

  • Được giới hạn trong một hình chữ nhật hữu hạn các cạnh a, b, c, d. Mỗi một pixel trong miền giới hạn đó có giá trị dao động từ 0 đến 255.

2.1. Biểu diễn ảnh bằng Ma trận

Hình ảnh từ Lecture 4 - CS131 - Stanford

Các bạn có thể thấy mỗi pixel có thể là một hàm độc lập, và tập hợp các hàm độc lập này tạo nên một bức ảnh.