01 Introduction
- ์ ํธ์ฒ๋ฆฌ, ๋จธ์ ๋ฌ๋, ํต๊ณ, ๋ก๋ด, ๊ทธ๋ํฝ์ค๋ฑ ๋ค์ํ ๋ถ์ผ์ ๊ด๋ จ์ด ์์
- 2000๋ ๋์ ์์์ผ ๋์คํ๋จ
- ์ปดํจํฐ๋น์ ์ ๋ ๋ฒจ๋ณ๋ก ๋ถ๋ฅํ ์ ์์
- ๋ก์ฐ๋ ๋ฒจ: stereopsis, optical flow, image segmentation
- ๋ฏธ๋๋ ๋ฒจ: object tracking, human motion analysis
- ํ์ด๋ ๋ฒจ: object recognition, event detection
02 Human Visual Perception
- ๋ณดํต์ ์ธ๊ฐ์ trichromacy(์์ถ์ธํฌ๊ฐ r,g,b ์ธ๊ฐ์์. ์ธ๊ฐ์ง ์์ถ์ธํฌ๋ก ๋ฌผ์ฒด์ ์๊น์ ์ธ์ํจ)
- monochromacy~pentachromacy์ ๋ค์ํ ์๋ฌผ๋ค์ด ์์
- cone(์์ถ์ธํฌ)๊ฐ ์๋ ์์ญ์ ์๊ตฌ ๋ด๋ถ์์ ๊ทนํ ์ผ๋ถ(fovea)๋ฅผ ์ฐจ์งํจ. ๋๋จธ์ง๋ rod(๋ช ์, ํํ ๋ฑ์ ์ธ์ํ๋ ์ธํฌ)
- perceptual organization(์ง๊ฐ์ ์กฐ์งํ)
- subjective contour(์ฃผ๊ด์ ์ค๊ณฝ)
- stomatopod: ํน์ดํ ๋์ ๊ฐ์ก์
03 Basic Mathematical Concepts
- ์ ํ๋์
- p-norm
- ๋ด์
- ์ธ์ ์ ์ธ์ผ์์
- ํ๋ ฌ(ํฉ, ๊ณฑ, transpose)
- rank: number of linearly independent rows/columns
- linearly independent: ๋ค๋ฅธ row/column์ linear combination์ผ๋ก ๋ง๋ค ์ ์๋๊ฒ
04 Basic Image Processing
- ์ด๋ฏธ์ง ํ๋ก์ธ์ฑ์ด๋?
- I -> Iโ
- ํ๋์ ์ด๋ฏธ์ง๋ฅผ ๋ฃ์ด์ ์๋ก์ด ์ด๋ฏธ์ง๋ฅผ ๋ฝ์
- PIL: Python Imaging Library
- box ๋ํ๋ด๋ ๋ฐฉ๋ฒ ๋๊ฐ์ง
- (left, upper, right, lower)
- (left, upper, width, height)
- Image Operations
- array(Image.open(โimages/empire.jpgโ).convert(โLโ))
- ๋ถ๋ฌ์จ image ๊ฐ์ฒด๋ฅผ ๋ฐฐ์ด๋ก ๋ณํ
- Displaying Images
- contour(im, origin=โimageโ)
- ๋ฐ๊ธฐ ๊ตฌ๊ฐ์ ๋๋ ์ ๋ณด์ฌ์ค
- Image Histogram
- hist(im.flatten(), 128)
- flatten(): 2์ฐจ์ ๋ฐฐ์ด์ 1์ฐจ์ ๋ฐฐ์ด๋ก ๋ฐ๊ฟ
- ํด๋น ๊ฐ์ ๊ฐ์ง๊ณ ์๋ ํฝ์ ์ด ๋ช๊ฐ์ธ์ง ๋ณด์ฌ์ค(a distribution of pixel values)
- Array Image Representation
- print im.shape, im.dtype # (800, 569, 3) uint8
- im์ด Image ๊ฐ์ฒด์ ๋ฐฐ์ด์ผ ๊ฒฝ์ฐ
- (width, height, depth)
- Pixel Value Transforms
- im2 = 255 - im
- ํ๋ฐฑ ๋ฐ์
- im4 = 255.0 * (im/255.0)**2
- pixel value๋ฅผ ์ ๊ณฑํจ(๋ฐ์ ๋ถ๋ถ์ ๋ ๋ฐ๊ฒ ๋ณด์ฌ์ค)
- Histogram Equalization
- Flattens the histogram so that all intensities are as equally common as possible. (histogram์ ๋ถํฌ๋ฅผ ๊ณ ๋ฅด๊ฒ ํจ)
- def histeq(im, num_bins=256)
- cdf = imhist.cumsum() # cumulative distribution function
- histogram์ ๋์ ๋ถํฌํจ์๋ฅผ ์ด์ฉํ์ฌ normalize -> ์๋ ์ด๋ฏธ์ง์ linear interpolation
- ๋ฐ๊ธฐ์กฐ์ ๊ธฐ๋ฅ(๋๋ฌด ๋ฐ๊ฑฐ๋ ์ด๋ก๊ฒ ์ฐํ ์ฌ์ง์ ์ ๋นํ๊ฒ ๋ฐ๊ฟ ์ ์์)
- ํ์ง๋ง ํ์ง๊ตฌ์ง๊ฐ๋ ์์์
- Image Filtering
- f(x, y) * h(x, y) = g(x, y)
- ์ด๋ค n*n patch(=kernal=mask)๋ฅผ ๊ฐ์ง๊ณ ์๋ณธ image์ convolutionํจ
- correlation operator, convolution operator๊ฐ ์์
- Padding
- filtering์ ํ ๊ฒฝ์ฐ ๊ฐ์์ด์ ์์ธ์ํฉ์ด ๋ฐ์ํจ(convolutionํ ํฝ์ ๊ฐ์ด ์กด์ฌํ์ง ์๋ ๋ฌธ์ )
- ๋ฐ๋ผ์ padding์ ์ค์ ํด์ค (zero padding, wrap padding, clamp padding, mirror padding๋ฑ)
- ํจ๋ฉ์ ์ค์ ํด์ ํ๋์ ์ด๋ฏธ์ง๋ก ๋ง๋ค์ด์ convolutionํ ์๋ ์๊ณ ์๋๋ฉด ๊ทธ๋๊ทธ๋ ๊ฐ์ ๊ฐ์ ธ์์ convolutionํ ์๋ ์๋ค(memory issue์)
- Blurring Images
- ๋ณดํต ๊ฐ์ฐ์์ ์ปค๋์ ์ฌ์ฉ
- ์๊ทธ๋ง ๊ฐ์ด ํด ์๋ก ๋ธ๋ฌํจ๊ณผ ์ฆ๊ฐ
- Image Derivative
- = Image gradient
- gradient angle = arctan2(Ix, Iy)
- Filter ์ข ๋ฅ: Prewitt/Sobel/Gaussian ๋ฑ๋ฑ
- ํฌ๋ linear filter๋ separableํจ(n*n => (n*1)*(1*n))
- ๋๋ ์ ์์ผ๋ฉด ๋ฌด์กฐ๊ฑด ๋๋์ด ํ๋ ๊ฒ์ด ๋น ๋ฆ(n^2 operations > 2n operations)
- morphology
- binary image๋ก ๋ง๋๋๊ฒ(๋ชจ์์ด ์ค์)
- convert(โLโ): Luminance
- original/dilation(ํ์ฅ)/erosion(์ถ์)/majority(kernel ๋ด์ max(|0|, |1|))/opening(erosion->dilation)/closing(dilation->erosion)
- connected components
- 4-neighbor(์ํ์ข์ฐ)/8-neighbor(+๋๊ฐ์ )
- ๊ตฌํ๋ ๋ฐฉ๋ฒ
- two-pass algorithm: horizontal run -> connect vertically adjacent runs
- recursive algorithm
- distance transform
- ์ค์ฌ์ถ ๊ตฌํ ๋ ์ฌ์ฉ
- forward sweep: ์ผ์ชฝ๊ณผ ์์ ํฝ์ ์ ๋ณด๊ณ ๋์ค์ ์์๊ฑฐ ์ ํ
- backward sweep: ์ค๋ฅธ์ชฝ + ์๋ + (์์ ์ ํฝ์ + 1)์ ๋ณด๊ณ ์์๊ฒ
05 Edges and Lines
- Origin of Edges
- edge: discontinuity๊ฐ ์กด์ฌํ๋ ๋ถ๋ถ
- surface normal discontinuity/depth discontinuity/surface color discontinuity/illumination discontinuity
- human boundary detection๊ณผ ์ต๋ํ ๋น์ทํ๊ฒ ํ๋๊ฒ์ด ๋ชฉํ
- edge์ ์ฌ์ ์: intensity์ rapidํ ๋ณํ๊ฐ ๋ฐ์ํ๋ ๋ถ๋ถ -> gradient operator๋ฅผ ์ด์ฉ
- ์ค์ data์๋ noise๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ smoothing์ ๋จผ์ ํ๋ค
- canny edge detector
- ์ฌ๋ฌ ๋ฐฉํฅ์ผ๋ก ์๋ผ๋ณธ ํ ๊ธฐ์ธ๊ธฐ๊ฐ ๊ฐ์ฅ ํฐ๊ฒ์ ์ ํ
- hysteresis thresholding
- local max์์ ์์ํด์ ์์ชฝ ๋ฐฉํฅ์ ๋ฐ๋ผ ์งํ
- threshold: edge์ ์ต์ ๊ธฐ์ค
- threshold๋ฅผ ๋๊ฐ ์ค์
- Thigh, Tlow: Thigh์์ ์์ํ์ฌ Tlow๊น์ง๋ง ๋ฐ๋ผ๊ฐ
- scale selection
- gaussian filtering์ ์ ๋
- ์์ฆ์ ๊ฐ๋ฅํ ๊ฒฝ์ฐ ๋ค ๋ฅ๋ฌ๋์ผ๋ก ํจ. ์๋๊ฐ ์ค์ํ ๊ฒฝ์ฐ ๋นผ๊ณ
- Line Detection
- successive approximation
- ๋ ์ ์ ๊ณจ๋ผ์ line์ ๋ง๋ฌ -> ๋ ์ ์ฌ์ด์ ์ ๋ค์์ line๊น์ง์ ๊ฑฐ๋ฆฌ๋ฅผ ์ผ -> ๋ชจ๋ ๊ฑฐ๋ฆฌ๊ฐ threshold๋ณด๋ค ์์ ๋๊น์ง ๊ฐ์ฅ ๋จผ ์ ์ ์ฐพ์ ๋๊ฐ๋ก ๋๋
- hough transform
- ์ด๋ค ์ด๋ฏธ์ง์์ x, y๋ฅผ ์ง๋๋ ๋ชจ๋ line์ r, ์ธํ ์ขํ๊ณ์์ ๋ํ๋ -> voting
- ๋ฌธ์ ์ : ์๊ฐ + ๋ฉ๋ชจ๋ฆฌ(3d๊ฐ ๋์ด๊ฐ๋ฉด ์ข ํ๋ค์ด์ง), ์งง์ edge๋ detection์ด ์ด๋ ค์
- ํด๊ฒฐ์ฑ : ๋ชจ๋ line๋ง๊ณ ์ค์ edge์ ๋น์ทํ ๋ฐฉํฅ์ line๋ง ๊ณ ๋ ค
06 Local Image Descriptors
- ์๋ก ๋ค๋ฅธ ์ด๋ฏธ์ง(e.g. ๋ค๋ฅธ ๊ฐ๋์์ ๊ฐ์ ์ฅ์๋ฅผ ์ฐ์ ์ฌ์ง)์์ ๋์๋๋ ์ /์ง์ญ์ ์ฐพ๋ ๊ฒ
- invariant local feature
- geometric invariance: translation, rotation, scale โฆ => ํ์ , ์ด๋, ํ๋/์ถ์ ๋ฑ์ ๊ฐ์ํ์ฌ ํ๋จ(ํ์ ํ๋๋ผ๋ ๊ฐ์ feature๊ฐ ๋ฝํ)
- photometric invariance: brightness, exposure, contrast => ๋ฐ๊ธฐ, ๋ ธ์ถ, ๋๋น๋ฅผ ๊ฐ์ํ์ฌ ํ๋จ
- advantages of local features
- locality: robust to occlusion and clutter
- distinctiveness: should differentiate a large set of images(์ฅ์ ๋ณด๋ค๋ local feature๊ฐ ๊ฐ์ ธ์ผ ํ ๋๋ชฉโฆ)
- quantity: hundreds of thousands in a single image(๋ง์์๋ก ์ข์)
- efficiency: real-time performance
- generality
- what makes a good feature?
- uniqueness: ํ ์ด๋ฏธ์ง ๋ด์์ uniqueํด์ผ ํ๋ค. ๋๋ ๋น์ทํ feature๊ฐ ๋ง์ผ๋ฉด ์ข์ feature๋ผ๊ณ ํ ์ ์์
- ๊ทธ๋ผ uniqueness๋ ์ด๋ป๊ฒ ํ๋จํ๋๊ฐ? ์ด๋ฏธ์ง๋ฅผ ๋ค scanํ ์๋ ์์์
- ๊ทผ์ฒ์์ shiftํด์ ๋น์ทํ๊ฒ ๋์ฌ ๊ฒฝ์ฐ x. ์๋์ฌ ๊ฒฝ์ฐ ์ข์ feature
- corner detection: compare the changes of pixels by summing up the squared differences(SSD)
- 2์ฐจ์์์ ๋์ค๋ ๋ eigenvector๋ ์๋ก ์์ง์
- n์ฐจ์์์ eigenvector๋ n๊ฐ => ๋ชจ๋ ์์ง
- Shi-Tomasi corner detector: ๋๋ค ๋ง์ด๋์ค๋ฅผ ๊ธฐ์ค์ผ๋ก corner๋ฅผ ํ๋จ
- Harris and Stephens: ๋ ๋ณต์กํ ๊ณต์
- harris๋ scale invariantํ์ง ์์(์๋ํ๋ฉด patch ์ฌ์ด์ฆ๊ฐ ๋ฐ๋๋๊น) + translation invariantํจ
- gaussian filtering์ ํ ๊ฒฝ์ฐ์๋ rotation invariantํจ
- ๊ฐ์ฅ ์ ์ ํ scale์ ์ฐพ๋ ๋ฐฉ๋ฒ
- scale์ ๋ฐ๊ฟ๊ฐ๋ฉด์ local maximum cornerness response๋ฅผ ๊ฐ์ง๋ scale์ ์ฐพ์!
- ํ์ง๋ง ์๊ฐ์ด ๋๋ฌด ๋ง์ด ๊ฑธ๋ฆผ
- automatic scale selection
- FAST
- ์ด๋ค ์ ์ ์ค์ฌ์ผ๋ก ๋ฐ์ง๋ฆ์ด r์ธ ์์ ๊ทธ๋ฆผ -> ์ค์ฌ์์ ์์ ๋๋ ๊น์ง์ ๋ฒกํฐ๊ฐ r^2๋งํผ ์๊น -> ๋ฒกํฐ๋ค์ ๋ฐ๊ธฐ๊ฐ ์ฐ์์ ์ผ๋ก ๋ช๊ฐ ์ด์์ผ ๊ฒฝ์ฐ corner๋ผ๊ณ ํ๋จ
- ๋น ๋ฆ
- SIFT
- very popular โhigh-endโ detection/ description algorithm
- high-end: ์ค๋ ๊ฑธ๋ฆผ
- ํ๋์ ๋ฌผ์ฒด๋ฅผ ๋ค๋ฅธ ๊ฐ๋์์ ์ฐ์์ ๋๋ ์ด๋์ ๋ ์ด์์ด๋ฉด ์ ์๋จ(3d invariant)
- ์๊ทธ๋ง๊ฐ ๋ค๋ฅธ, ๊ฐ์ฐ์์ ์ฒ๋ฆฌ๋ ์ด๋ฏธ์ง์ ์ฐจ -> Difference of Gaussian(DOG)
- ๋ผํ๋ผ์์ ํจ์๋ ๋น์ทํ๊ฒ ์๊ฒจ๋จน์ => ๋น์ทํ ํจ๊ณผ๋ฅผ ์ป์ ์ ์์
- MOPS(Multiscale Oriented Patches)
- ๋ค์ํ scale์์ ๋ฐฉํฅ์ ๊ณ ๋ คํด์ ๋ฝ์
- ์์๋จ
- SURF
- Speed-Up Robust Features
- image๋ฅผ integral image๋ก ๋ง๋ค์ด์ ๊ณ์ฐ -> computation time ๊ฐ์
- ์ปค๋์ฌ์ด์ฆ์ ์๊ฐ์ด ์ํฅ ๋ฐ์ง ์์(๊ณ์ฐ ์ด์ฌ์ฏ๋ฒ ํ๋๊ฑด ํญ์ ๊ฐ์) -> scale space building์ ํ ํ์๊ฐ ์์
- Binary Descriptors
- pixel value๋ฅผ ์ด์ฉํ์ง ์๊ณ ๋ value์ ๋์๋ง ๋น๊ตํจ
- BRIEF, BRISK, ORB
- ์ ํ๋๊ฐ ์ค์ํ ๊ฒฝ์ฐ: SIFT, SURF, KAZE
- ์๋๊ฐ ์ค์ํ ๊ฒฝ์ฐ: BRIEF, ORB
- feature matching(ํจ์น ๋น๊ต)
- ncc: normalized cross-correlation
- one-sided
- ๊ฐ๊ฐ์ i์ ๋ํด์ ์ด๋ค j์ ๊ฐ์ฅ ์ ๋ง๋์ง
- two-sided
- one-sided + ๊ฐ๊ฐ์ j์ ๋ํด์ ์ด๋ค i์ ๊ฐ์ฅ ์ ๋ง๋์ง
07 Image Transformation
- 2d image transformations
- translation, euclidean, similarity, affine, projective
- forward warping
- ์๋ณธ ์ด๋ฏธ์ง๋ฅผ ๊ทธ๋๋ก warpํ๋ ๊ฒ
- ํ๋ํ ๊ฒฝ์ฐ ๋น์ด์๋ ํฝ์ ์ด ๋ฐ์ํ๋ ๋ฑ ๋ฌธ์ ๊ฐ ์๊น
- inverse warping
- f์ ์ญํจ์ ์ด์ฉ
- linear interpolation
- ๊ฒฐ๊ณผ๋ก ์ ์๊ฐ ์๋ ๊ฐ์ด ๋์ฌ ๊ฒฝ์ฐ ๊ฐ์ฅ ๊ฐ๊น์ด pixel์ ์ ํ
- DoF(Degree of Freedom)
- ํด๋น transformation์ ํํํ๊ธฐ ์ํด ํ์ํ parameter ๊ฐ์
- svd(singular value decomposition)
- A=USV^T
- A: n*m, U: n*m, S: n*m, V^T: m*m
- U๋ orthonormal, S๋ diagonal(๋๊ฐ์ ๋นผ๊ณ 0)
- feature๋ฅผ ๋ชจ๋ ์ธ ์ ์์. outlier/noise๊ฐ ์์ ๋ ๊ฒฐ๊ณผ๊ฐ ์ ๋๋ก ์๋์ด
- RANSAC(Random Sample Concensus)
- ์๋ชป๋ feature(outlier)๋ฅผ ๊ฑฐ๋ฅด๊ธฐ ์ํจ
- ์ฌ๋ฌ๊ฐ์ feature์ค ๋๋ค์ผ๋ก ์ํ์ ๋ฝ์์ ์ฌ๋ฌ๋ฒ ๋ง์ถ์ด ๋ณด๊ณ inlier(outlier์ ๋ฐ๋๋ง. ์ผ์นํ๋ feature๋ฅผ ์๋ฏธ)์ ๊ฐฏ์๊ฐ ์ต๋๊ฐ ๋๋ p๋ฅผ ๊ตฌํจ
- 93์ชฝ: h.o.t = high order term์ ๋ฌด์ํ๋ค
- Levenberg-Marquadt Algorithm(LM)
- ์๋ฌ๊ฐ ๊ฐ์ํ๋ ๋ฐฉํฅ์ผ๋ก ์์ง์ผ ๋ step size๋ฅผ ์ค์ฌ์ค => minimum์ ์ง๋์ณ๋ฒ๋ฆฌ๋ ๊ฒฝ์ฐ์ธ overshooting์ ๋ฐฉ์ง
- Summary: noise-free data์ ๊ฒฝ์ฐ DLT, outlier/noise๋ฅผ filterํด์ผ ํ ๊ฒฝ์ฐ RANSAC, ์ถ๊ฐ์ ์ผ๋ก optimization์ด ํ์ํ ๊ฒฝ์ฐ robust norm
08 Image Formation
- camera: ๋น์ ์ฌ๋ ๋๊ตฌ
- cx, cy => center ์ขํ
- ์ฌ๋ ๋์ focal length๋ ๋๋ต 50mm
- focal length๊ฐ ๊ธธ๋ฉด ํ๊ฐ์ด ๊ฐ์ -> ์ข์ ๋ฒ์๋ฅผ ์ ๋ฐํ๊ฒ ์ธก์
- ์งง์ผ๋ฉด ํ๊ฐ ์ฆ๊ฐ -> ๋์ ๋ฒ์
- crop body: ํ๋ฆ๋ณด๋ค ์์ ccd -> ๊ฐ์ ๋ ์ฆ๋ผ๋ ์์ ๋ฒ์๊ฐ ์ฐํ
- full body: ํ๋ฆ๋งํ ccd
- camera intrinsics: ์นด๋ฉ๋ผ ์์ฒด์ parameter(focal length, image center๋ฑ)
- camera extrinsics: ์นด๋ฉ๋ผ์ ์์น
- pinhole camera์์ pinhole์ด ๋๋ฌด ํด ๊ฒฝ์ฐ ๋น์ด ๋๋ฌด ๋ง์์ ํ๋ฆฟํจ. ๋๋ฌด ์์ ๊ฒฝ์ฐ ๋น์ ํ๋์ฑ๋๋ฌธ์ ํ์ ์ด ์ผ์ด๋์ ํ๋ฆฟํจ
- ๋ ์ฆ๊ฐ ํ์ํ ์ด์ : ๋น์ ์์ ํค์ฐ๊ธฐ ์ํจ, ํ ์ ์์ ์ถ๋ฐํ ๋น์ ์ ํํ ํ ์ ์ผ๋ก ๋ชจ์ ์ ์์
- ๋จ์ : ๊ฑฐ๋ฆฌ๊ฐ ์ ํํ ๋ง์ง ์์ผ๋ฉด ์ ํํ ํ ์ ์ผ๋ก ๋ชจ์์ง์ง ์์ => circle of confusion
- depth of field: pinhole camera์๋ ์๋ ๊ฐ๋ . ๋ ์ฆ๊ฐ ์๊ธฐ ๋๋ฌธ์ ์๊ธด ๊ฐ๋ ์
- lens model์ geometrical aberrations
- distortion
- spherical aberration
- astigmatism
- coma
- chromatic aberrations: ์ฌ๋ฌ ํ์ฅ์ ๋น์ด ๋ค์ด์ฌ ๊ฒฝ์ฐ ๋ชจ๋ ๊ตด์ ๋ฅ ์ด ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ ๋ฐ์
09 Structure from Motion
- ํ ๋ฌผ์ฒด์ ๋ํ ์ฌ๋ฌ์ฅ์ ์ด๋ฏธ์ง๋ฅผ ํตํด ํด๋น ๋ฌผ์ฒด์ ๋ํ structure๋ฅผ ์์๋
- Triangulation, P3P, Epipolar Geometry
- Triangulation: ๋ ์ฅ ์ด์์ ์ด๋ฏธ์ง๊ฐ ์๊ณ , ์นด๋ฉ๋ผ์ pose(Rt), image(2d)์์์ ๋ฌผ์ฒด์ pixel ์ขํ๊ฐ ์ฃผ์ด์ก์ ๋ ํด๋น ๋ฌผ์ฒด์ 3d ๊ณต๊ฐ์์์ ์์น๋ฅผ ์์๋
- P3P: 3๊ฐ์ 3์ฐจ์ ์ขํ + ์ขํ๋ค์ image์์์ ์ขํ๊ฐ ์ฃผ์ด์ก์ ๋ ์นด๋ฉ๋ผ์ pose๋ฅผ ์์๋
- Epipolar Geometry: ๋๊ฐ์ ์นด๋ฉ๋ผ๊ฐ 3d ๊ณต๊ฐ์ ์ขํ๋ฅผ ๊ด์ฐฐ
- epipolar plane: 3d๊ณต๊ฐ์์ ์ธ ์ (3d๊ณต๊ฐ์ ํ ์ขํ, ์นด๋ฉ๋ผ 1์ ์์น, ์นด๋ฉ๋ผ 2์ ์์น)์ ํฌํจํ๋ ํ๋ฉด
10 Dense Stereo and Depth Estimation
- stereo rectification
- original image pair์์์ epipolar lines๋ฅผ horizontally & vertically correspond ํ๋๋ก ์ด๋ฏธ์ง ์์ฒด๋ฅผ transformํจ
- disparity(์์ฐจ)
- ๋ ์นด๋ฉ๋ผ์์๋ถํฐ ๋ฌดํ๋์ ๊ฑฐ๋ฆฌ์ ์๋ ๋ฌผ์ฒด์ ๋ํ ๋ ์นด๋ฉ๋ผ์ disparity๋ 0
- ํญ์ 0์ด์์ ๊ฐ์ ๊ฐ์ง
- depth estimation
- ๋น์ ์ง์ ์๋์ง ์ฌ๋ถ์ ๋ฐ๋ผ active/passive๋ก ๋๋จ
- time-of-flight์ ๊ฒฝ์ฐ ๋น์ ์๋๊น active ๋ฐฉ์
- stereo์ ๊ฒฝ์ฐ passive
- lens array(integral imaging)
- ํ ์ ์ ํต๊ณผํ๋ ๋น์ captureํ๋ pinhole camera์ ๋ฌ๋ฆฌ ํ๋ฉด์ ์ง๋๋ ๋ชจ๋ ๋น(light field)์ captureํจ => focus๋ฅผ ์์ ๋กญ๊ฒ ๋ฐ๊ฟ ์ ์์
- normal sensor
- surface์ normal์ ๊ตฌํ ์ ์์
- structured light
- ๊ฐ์ฅ ๋ง์ด ์ฐ์ด๋ ๊ธฐ์ . stereo ์๋ฆฌ์ ๋น์ทํ์ง๋ง ์นด๋ฉ๋ผ ํ๋์ projector ํ๋๋ฅผ ์ฌ์ฉํ๋ค๋ ์
- baseline(์นด๋ฉ๋ผ-projector๊ฐ ๊ฑฐ๋ฆฌ)์ด ๋์์๋ก ์ธก์ ํ ์ ์๋ depth range๊ฐ ๊น์ด์ง
- time-of-flight
- ๋น์ ์์ ๋ ~ ๋ฐ์ฌ๋์ด ๋์์ฌ ๋๊น์ง์ ์๊ฐ์ ๊ณ์ฐํ์ฌ ๊ฑฐ๋ฆฌ๋ฅผ ๋์ถํด๋
- kinect
11 Visual Tracking
- image ๋ด์์ ํด๋น object๊ฐ ์์ ํ๋ฅ ์ด ๊ฐ์ฅ ๋์ ๊ณณ์ ์ ํ
- mean-shift algorithm
- search window์ mean๊ณ์ฐ -> ๊ณ์ฐํ mean์ ์ค์ฌ์ผ๋ก search window๋ฅผ ์ฎ๊น -> converge ํ ๋๊น์ง ๋ฐ๋ณต
- camshift
- window size๋ ์กฐ์
- tracking vs detection
- tracking: time-continuous estimation of object states
- detection: finding the targets from scratch in a given scene
- prediction-correction
- ์ด์ ๊น์ง์ object trackingํ ๊ฒฐ๊ณผ๋ฅผ ์ด์ฉํด์ ํด๋น object๊ฐ ์ด๋์ ์์ ์ง predictionํ ํ ํ์ฌ ์ํ๋ฅผ ๋ฐ์ํ์ฌ correctionํจ
- kalman filtering
- estimates the internal states of a linear dynamic system from a series of noisy measurements
- ๊ธฐ๊ณ๋ฑ ๋ค๋ฅธ ๋ถ์ผ์์ ๋ง์ด ์
- particle filtering
- condensation: particle filtering์ implementation ์ค ํ๋
โ
- spectral clustering
- cluster๋ง๋ค ํฌ๊ธฐ๊ฐ ์ด๋์ ๋ ์ผ์ ํ๊ธฐ ๋๋ฌธ์ ๋ฐฐ๊ฒฝ์ด ํ์ ์ด์์ผ๋ก ์ชผ๊ฐ์ง ์ ์์
- minimum cut
- normalized cut
12 Detection and Recognition
- PCA(Principal Component Analysis) & FLD(Fisher Linear Discriminant)
- Generative model: ํ๊ฒ์ผ๋ก ์ต์ ์ ๋ชจ๋ธ์ ๋ง๋ฆ
- Discriminative model: classifier๋ฅผ ํ์ตํ์ฌ ํ์ผ์ ๊ตฌ๋ถํจ
- PCA: orthogonal linear transform. the greatest variance by any projection of the data comes to lie on the first coordinate, the second greatest on the second coordinate, and so on
- FLD: linear discriminant analysis
- maximizes the distinctness between classes of data
- approximation(PCA, max. variance) vs. classification (LDA)
- AdaBoost
- ์ฌ๋ฌ๊ฐ์ weak classifier(vertical/horizontal half plane)๋ฅผ ํฉ์ณ ํ๋์ final classifier๋ฅผ ๋ง๋ฌ
- Cascaded Classifier
- 10๋ฐฐ ๋น ๋ฆ - only positive examples are considered์ด๊ธฐ ๋๋ฌธ
13 Neural Network
- algorithms that try to mimic the brain
- activation functions
- sigmoid, ReLU, Leaky ReLU, tanh, Maxout, ELU
- sigmoid: ๋ฏธ๋ถ๊ฐ๋ฅ, x์ domain์ด ๋ฌดํํจ ํ์ง๋ง vanishing gradient problem ๋ฐ์
- Deep NN
- hidden layer๊ฐ ์ฌ๋ฌ๊ฐ
'CS > Lecture' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ง๋ฅํ์๋ฌผ์ ๋ณดํ (0) | 2017.09.13 |
---|---|
์ด์์ฒด์ (0) | 2017.09.13 |
์ธ๊ณต์ง๋ฅ (3) | 2017.09.12 |
์ปดํจํฐ๊ทธ๋ํฝ์ค (0) | 2017.09.12 |
๋ฐ์ดํฐ์ฌ์ด์ธ์ค (0) | 2017.09.12 |