Type of Credit: Elective
Credit(s)
Number of Students
本課程旨在介紹電腦視覺及影像處理之基本概念,相關技術與最新應用,透過基本原理之說明,數學工具之解析,配合專題之實作,期使學生能獲得此一領域之基礎訓練,從而應用於相關之研究課題。因應本領域之發展趨勢,課程內容與實作將以深度學習框架為主.
能力項目說明
理解電腦視覺之基本理論,熟悉相關開發工具(含OpenCV 函式庫,TensorFlow 或PyTorch深度學習框架),並尋求適切之實際應用。
Week 1
課程主題:課程簡介與進度說明, Chapter 1: Introduction
課程內容與指定閱讀:從影像處理到電腦視覺 http://www.cs.nccu.edu.tw/~whliao/cv2018/9201-02.pdf
教學活動與作業:講授課程大綱與第一章
學習投入時數:課前預習:閱讀從影像處理到電腦視覺文章 (1 hour)
課後複習:熟悉影像處理軟體ImageJ之基本功能 (2 hours)
1. ImageJ: http://rsb.info.nih.gov/ij/
2. 教科書網站: http://www.imageprocessingplace.com/
Week 2
課程主題:數學工具
課程內容與指定閱讀:Review of mathematical concepts, Fourier Transform
教學活動與作業:講授線性系統,傅立葉轉換
學習投入時數:課前預習:閱讀線性代數、機率與線性系統之投影片(3 hours)
課後複習:熟悉Fourier transform與 convolution 之基本概念 (3 hours)
1. Wolfram Mathworld http://mathworld.wolfram.com/
2. Joy of convolution: http://pages.jh.edu/~signals/convolve/
Week 3
課程主題:影像成像原理,OpenCV函式庫
課程內容與指定閱讀:Image formation,
OpenCV: Introduction and Tutorial, Object recognition
教學活動與作業:講授影像成像原理,OpenCV函式庫簡介
學習投入時數:課前預習:閱讀課程投影片(2 hours)
課後複習:作業一:安裝並測試OpenCV函式庫 (3 hours) http://opencv.org/
Week 4
課程主題:Spatial domain processing
課程內容與指定閱讀:空間域之影像處理
教學活動與作業:講授空間域之影像處理技術
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:作業二:直方圖等化(6 hours)
Week 5
課程主題:Frequency domain processing
課程內容與指定閱讀:頻率域之影像處理
教學活動與作業:講授頻率域之影像處理技術
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:熟悉傅立葉轉換與相關工具(4 hours)
1. 傅立葉轉換 http://www.cs.nccu.edu.tw/~whliao/cv2018/fourier.pdf
Week 6
課程主題:Image Restoration, Image Inpainting
課程內容與指定閱讀:影像復原與影像綴補
教學活動與作業:講授影像復原與影像綴補技術
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片(3 hours)
Week 7
課程主題:Hough Transform
課程內容與指定閱讀:霍夫轉換
教學活動與作業:講授霍夫轉換原理
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片、作業三(6 hours)
Week 8
課程主題:Introduction to object recognition
課程內容與指定閱讀:物件辨識簡介
教學活動與作業:講授物件辨識之原理與方法
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片、作業三(6 hours)
Week 9
Midterm (期中考)
Week 10
課程主題:Morphological Image Processing
課程內容與指定閱讀:影像處理中的形態學
教學活動與作業:講授影像處理中的形態學原理
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片,使用 ImageJ測試各項morphological filter功能(4 hours)
Week 11
課程主題:Image Segmentation, 題末專題提案
課程內容與指定閱讀:影像切割
教學活動與作業:講授影像切割方法,題末專題提案報告
學習投入時數:課前預習:閱讀課程投影片, Proposal 準備(6 hours)
課後複習:複習課程投影片(3 hours)
Week 12
課程主題:Representation and Description
課程內容與指定閱讀:影像描述
教學活動與作業:講授各類影像描述方法
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片(3 hours)
Week 13
課程主題:Feature Descriptors
課程內容與指定閱讀:影像描述子
教學活動與作業:講授各類影像描述子的原理與應用
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片,作業四(8 hours)
Week 14
課程主題:Object Classification
課程內容與指定閱讀:物件分類
教學活動與作業:講授物件分類的原理
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片(3 hours)
Week 15
課程主題:電腦視覺與深度學習(1/3)
課程內容與指定閱讀:電腦視覺與深度學習框架
教學活動與作業:講授電腦視覺與深度學習技術
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片(3 hours)
Week 16
課程主題:電腦視覺與深度學習(2/3)
課程內容與指定閱讀:電腦視覺與深度學習框架
教學活動與作業:講授電腦視覺與深度學習工具
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片,熟悉開發工具(6 hours)
Week 17
課程主題:電腦視覺與深度學習(3/3)
課程內容與指定閱讀:電腦視覺與深度學習框架
教學活動與作業:講授電腦視覺與深度學習工具
學習投入時數:課前預習:閱讀課程投影片(3 hours)
課後複習:複習課程投影片,熟悉開發工具(6 hours)
Week 18
Final Project Presentation
30%: Assignment and mini-projects
30%: Midterm
40%: Final project
Textbook:
*R. Gonzalez and R. Woods Digital Image Processing, 4th edition, Prentice Hall, 2018.
http://www.imageprocessingplace.com/DIP-4E/dip4e_main_page.htm
*R. Szeliski, Computer Vision: Algorithms and Applications, Springer-Verlag, 2nd Edition (2020).
https://szeliski.org/Book/
* Dive into Deep Learning: https://d2l.ai/
References:
*Mastering OpenCV with Practical Computer Vision Project, by Baggio et al., 2012.
*Learning OpenCV: Computer Vision with the OpenCV Library by Gary Bradski and Adrian Kaehler, O.Reilly Press, 2008.
*Multiple View Geometry in Computer Vision by Jain et. al, Machine Vision McGraw Hill, 1995
*M. Shah, Fundamentals of Computer Vision, (available online).
*Introductory Techniques for 3-D Computer Vision by Emanuele Trucco, Alessandro Verri, Prentice Hall, 1998.
*V. Nalwa, A Guided Tour of Computer Vision, Addison-Wesley, 1993.
*L. Shapiro and G. Stockman, Computer Vision Prentice Hall, 2001.
*M. Sonka et. al, Image Processing, Analysis, and Machine Vision, Brooks/Cole Pub Co., 3rd edition, 2008.
*D. Forsyth and Ponce, Computer Vision - A modern approach Prentice Hall, 2002.
*R. Haralick and L. Shapiro, Computer and Robot Vision (Vol. I and II)
http://www.cs.nccu.edu.tw/~whliao/cv2022