01 Intro
The Turing test is a test, developed by Alan Turing in 1950, of a machine's ability to exhibit intelligent behaviour equivalent to, or indistinguishable from, that of a human.
- Unintelligent human behavior - ๊ธฐ๋๊ฐ์ด -์์๋ ๋ถ๊ตฌํ๊ณ ๋ณต๊ถ์ ์ฌ๋ ํ์
- AI๋ ์ด๋ป๊ฒ ๋ณด๋ฉด moving target์ด๋ค - OS๊ฐ AI๋ก ๋ถ๋ฆฌ๋ ์์ ๋ ์๋ค.
- lisp: programming language
- ์ฌ๋ฌ technology์ collaboration ๊ฒฐ๊ณผ๊ฐ ๋ฐ๋ก deep learning์ด๋ผ๊ณ ํ ์ ์๋ค - ์ํํธ์จ์ด, ํ๋์จ์ด..
- Modeling -> Algorithms์ ๋ ๋จ๊ณ๋ก real-world task๋ฅผ tackleํ๋ค.
- ๋ฌด์์ ํ์ง ์ ํ๊ณ , ์ด๋ป๊ฒ ํ์ง ์ ํ๋ค. ๊ทธ ๊ณผ์ ์์ ์ด๋ ์ ๋์ abstraction์ด ํ์ํจ.
- reflex-based model < state-based model < variable-based model < logic-based model ๋ฑ ์ฌ๋ฌ๊ฐ์ง ๋ชจ๋ธ์ด ์๋ค (low-level -> high-level ์)
- ๊ฐ ๋ชจ๋ธ๋ง๋ค ํ ์ ์๋/ํ๊ธฐ ์ฌ์ด ๋ฌธ์ ์ ์ข ๋ฅ๊ฐ ๋ค๋ฆ
- what์ ์ ํ ๋ computing์ด ๊ฐ๋ฅํ ์ง ์ํ ์ง ๊ณ ๋ คํด์ผ ํจ. ๋ฐ๋ผ์ how๋ณด๋ค๋ what์ด ๋๊ฐ ๋ ์ด๋ ค์ด ๋ฌธ์ ์ด๋ค
- Learning algorithm๋ด์์ example์ ํ์ตํ๊ณ generalization์ ํด์ผ ์๋ฏธ๊ฐ ์๋ค. ๊ทธ๋ฅ ์์๋ง ํ์ต(๋จ์ ์๊ธฐ)ํ๋ฉด ๋จธ์ ๋ฌ๋์ด ์๋. ์๋ฏธ๊ฐ์๋ค.
- 31์ชฝ ๊ทธ๋ฆผ์์ node ํ๋ํ๋๋ฅผ ๊ฐ๊ฐ์ state๋ผ๊ณ ํ๋ค
- ํ๋์ state์์ ๋ค์ state๋ก ๊ฐ๋ ์์๊ฐ ์ค์ํ ๊ฒฝ์ฐ์ state-based model์ ์ฌ์ฉํ๋ค. sudoku์ ๊ฒฝ์ฐ์๋ ๊ทธ๋ ์ง ์์. ๊ทธ๋์ variable ์ธก๋ฉด์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ด ๋ฐ๋์งํจ.
- 37์ชฝ hard constraints์ ์๋ฏธ: ๋ฐ๋์ ๋ง์กฑํด์ผ ํ๋ ๊ฒ์ผ๋ก ํ๋๋ผ๋ ๋ง์กฑํ์ง ์์ผ๋ฉด solve๋ ๊ฒ์ด ์๋.
- ๋ฐ๋ฉด Bayesian network์์ soft dependencies์ ์๋ฏธ: H1์ 1๋ถ๋ง๋ค ์ฐจ์ ์์น๋ผ๊ณ ํ๋ฉด, ์ฌ๊ธฐ์ ์์น๋ ๋ฐ๋์ ๋ง์กฑํ๋ ๊ฒ์ด ์๋ ๋จ์ง ํ๋ฅ ์ ๋ฌธ์ ์ผ ๋ฟ์ด๋ค
- 40์ชฝ: ํด๋น ๋ฌธ์ ๋ฅผ variable-based ๋ชจ๋ธ๋ก ํด๊ฒฐํ๋ ค๋ฉด student๋ฅผ ํ๋ํ๋๋ฅผ variable๋ก ํํํด์ผํ๊ธฐ ๋๋ฌธ์ ๋นํจ์จ์ ์ด๋ค.
- ๋ชจ๋ธ๋ผ๋ฆฌ concept์ ํฉ์ณ์ ๊ตฌํํ๋ ๊ฒฝ์ฐ๋ ์๋ค
02 Reflex
- feature๋ฅผ ์ด๋ป๊ฒ ์ค๊ณํ๋๋์ ๋ฐ๋ผ ์ ์ฒด ์ค๊ณ์ ์ฑ๋ฅ์ด ๋ฌ๋ผ์ง๋ค. ๊ฐ์ฅ ์ค์ํ ๋ถ๋ถ
- raw data๋ณด๋ค feature๋ฅผ ๋ ํฌ๊ฒ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ๋ ์๋ค ์๋ํ๋ฉด raw data๊ฐ ์ฃผ์ด์ง ๋ฐ์ดํฐ์ ์ด๋์ด๊ธฐ ๋๋ฌธ
- production system: production rules๋ก ์ด๋ฃจ์ด์ง ์์คํ .
- if-then์ผ๋ก ์ด๋ฃจ์ด์ ธ์๋ค
03 Search
- ์ซ์ํ ๋ฌธ์ ์์ ๊ฐ๋ฅํ 9!๊ฐ์ ์ํ๋ฅผ ํ๋์ ๋ ธ๋๋ก ์๊ฐ ํ๋ฉด 9!๊ฐ์ ๋ ธ๋๋ฅผ ๊ฐ์ง ๊ทธ๋ํ๋ผ๊ณ ์๊ฐํด์ ํ๋ฉด ๋จ - ์คํ ์ดํธ ๋ง๋ค ๊ฐ๊ฐ ์ฐ๊ฒฐํ ์ ์๊ธฐ ๋๋ฌธ - ํ์ง๋ง ์ฌ๊ธฐ์ ๋ฌธ์ ๋ 3*3, 4*4๋ ๊ฐ๋ฅํ์ง๋ง 5*5๋ ๋ถ๊ฐ๋ฅํ๋ค. ๋๋ฌด ํฌ๊ธฐ ๋๋ฌธ์
- ์ซ์๊ฐ ์์ง์ด๋๋/blank๊ฐ ์์ง์ด๋๋ ์ ์ฐจ์ด: 32๊ฐ์ ์ก์ / 4๊ฐ์ ์ก์
- 9!๊ฐ ๋ ธ๋๊ฐ ์๋ ๊ทธ๋ํ๋ฅผ ์คํํฑํ๊ฒ ๊ณ์ ๊ฐ์ง๊ณ ์์ผ๋ฉด ๋นํจ์จ์ ์. ๋ค์ด๋ด๋ฏนํ๊ฒ ๊ทธ๋๊ทธ๋ ํ์ํ ๋ถ๋ถ๋ง ๋น๋ํด์ ์ฐ๋๊ฒ ์ค์ํ๋ค -> implicit representation
- start state๋ ์ฃผ์ด์ง ์๋ ์๋์๋ ์๋ค. ๋ฐ๋ผ์ ์๊ณ ๋ฆฌ์ฆ ๋ด์์ start state๋ฅผ ์ ์ํ ์ ์์ด์ผ ํจ
- state๋ฅผ expandํ๋ค: ํ๋์ ์ํ์์ ๋ค์ ์ํ๋ก ๊ฐ๋ฅํ ์ํ๋ค์ ๊ณ์ฐํ๋ ๊ฒ
- 15์ชฝ์ ์๋์ฝ๋๋ expand๋ง ํ๊ณ ์ง์ฐ๋๊ฒ ์์.
- 20์ชฝ์ ์๋์ฝ๋๋ ์ข ๋ refined๋ ๋ฒ์
- fringe: expand๋์ง ์์์ง๋ง expand๋๊ธฐ ์ํด ๋๊ธฐํ๊ณ ์๋ ๋ ธ๋๋ค์ ์งํฉ
- goal์ธ์ง ์๋์ง๋ fringe์ ๋ค์ด๊ฐ ๋๊ฐ ์๋ dequeue ๋ ๋(ํด๋น ๋ ธ๋๋ฅผ expand ํ ๋) ํ๋จํ๋ค
- state์ node๋ฅผ ํผ์ฉํด์ ์ฐ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
- โnode๋ ์ด๋ค state๋ฅผ ๋ํ๋ด๊ธฐ ์ํ ๊ฒโ
- search stretegy์ ํ๊ฐ ๊ธฐ์ค
- time complexity: ๋ง๋ค์ด์ง๋ ๋ ธ๋์ ์ด ์
- space complexity: ์ด๋ ํ โ์๊ฐโ์ ๋ฉ๋ชจ๋ฆฌ์ ์๋ ์ต๋ ๋ ธ๋์ ์. ์ ์ฒด ํ๋ก์ธ์ค์์ ๋ง๋๋ ์ด ๋ ธ๋์ ์๊ฐ ์๋
- ๋๊ฐ์ง complexity๋ b,d,D์ ์ธ๊ฐ์ง ๋ณ์๋ก ๊ณ์ฐํ ์ ์๋ค
- b๋ ํธ๋ฆฌ์ ์ฐจ์
- 23~ 26์ชฝ fringe์ queue (breadth-first search)
- A
- BC
- CDE
- DEFG
- ๊ฐ์ ๋ ๋ฒจ์ ๋ ธ๋๋ค(successor)๊ฐ์ ์์๋ ์๊ด ์๋ค
- 28์ชฝ
- time?: b(b^d-1) ์ ํธ๋ฆฌ์ d๋ ๋ฒจ์ ๋ง์ง๋ง๋ ธ๋๊ฐ goal์ผ ๊ฒฝ์ฐ์ด๋ค.
- ๊ทธ๋ผ goal test๋ฅผ fringe์ ๋ค์ด๊ฐ ๋ ํ๋ฉด ์๋๋? ๋๋ค. ๋ ํจ์จ์ ์ breadth-first search์์๋ง. ์ผ๋ฐ์ ์ธ ๊ฒฝ์ฐ์๋ fringe์์ dequeue๋ ๋ goal test๋ฅผ ํด์ผ ํธํ๋ค => exponential
- space?: ๊ฐ ๋ ๋ฒจ์์์ ๋ ธ๋๋ค๋ง ์ ์ฅํ๊ณ ์์ผ๋ฉด ๋๋ค. ๋ถ๋ชจ ๋ ธ๋๋ค(goal test๊ฐ ๋๋ ๋ ธ๋๋ค)์ ์์ด๋ ๋จ => exponential
- optimal?: ๊ฐ์ฅ shallowํ ๋ ธ๋์ ๋ํด goal test๋ฅผ ๋จผ์ ํ๊ธฐ ๋๋ฌธ์ yes.
- 29~40์ชฝ fringe์ stack (depth-first search)
- A
- BC
- DEC
- HIEC
- IEC
- EC
- JKC
- KC
- C
- so on
- ๊ฐ์ ๋ ๋ฒจ ๋ ธ๋ ์์ ์ญ์ ์๊ด ์๋ค
- ๋ ๋ฒจ์ ๊ณ์ ๋ด๋ ค๊ฐ๋ค๊ฐ ๋ ์ด์ ๊ฐ ๊ณณ์ด ์์ผ๋ฉด ๋ค์๊บผโฆ ๋ฐ๋ณต
- ๊ทธ๋ฆผ์์๋ ๋ชจ๋ ๋ ธ๋๊ฐ ์์ง๋ง ๊น๋ง์์ผ๋ก ์์น ๋ ๋ ธ๋๋ค์ ์คํ์์ ๋น ์ ธ๋๊ฐ๊ธฐ ๋๋ฌธ์ ์ค์ ๋ฉ๋ชจ๋ฆฌ์์๋ ์กด์ฌํ์ง ์๋๋ค.
- 41์ชฝ
- complete?: infinite loop์ ๋น ์ง ๊ฐ๋ฅ์ฑ ์กด์ฌ
- time?: ์ต์ ์ ๊ฒฝ์ฐ ํ๋ฒ์ ์ฐพ์์๋ ์์ง๋ง ์ต์ ์ ๊ฒฝ์ฐ ๋ชจ๋ ๋ ธ๋๋ฅผ ์ฐพ์๋ด์ผ ํ ์๋ => exponential
- space?: ์ต์ ์ ๊ฒฝ์ฐ - ํ๋์ ๊ฒฝ๋ก(D) * ๋์ sibling(b-1) (๊ฐ์ฅ ๊น์ ๋ ๋ฒจ์ ์ฒซ๋ฒ์งธ ๋ ธ๋์์) => linear
- depth-first์ ์ฅ์ (๋ฉ๋ชจ๋ฆฌ)์ ์ด๋ฆฌ๋ฉฐ ๋จ์ (optimality)์ ๋ณด์ํ๋ ๋ฐฉ๋ฒ: depth-limited search
- 42์ชฝ
- limit l์ optimal depth๋ก ์ ํ๋ ๊ฒ์ด ๊ฐ์ฅ ์ข๋ค
- ํ์ง๋ง optimal depth๋ ํญ์ ์๋ ค์ง ๊ฒ์ด ์๋๊ธฐ ๋๋ฌธ์ ๊ทธ๋ฐ ๊ฒฝ์ฐ์๋ l์ ์๊ฒ ํด๋ณด๊ณ ์ ์ ๋๋ ค๋๊ฐ๋ฉด ์ฐพ์ ์ ์๋ค -> iterative deepening
- limited search๋ฅผ ํ ๋ l์ ๋ฒ์ ๋ด์์ ์ฐพ์ง ๋ชปํ๋ฉด ๋งจ ์์ ๋ ธ๋๋ถํฐ (๋งจ ์ฒ์๋ถํฐ) ๋ค์ ํ๋ค. overhead๊ฐ ๋ฐ์ํ ์๋ ์์ง๋ง overhead๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด ๊ทธ ๋ ๋ฒจ์ ๋ ธ๋๋ฅผ ๋ชจ๋ ์ ์ฅํ๋ฉด ๊ฒฐ๊ตญ depth-first์ ์ฅ์ ์ธ linear ๋ฉ๋ชจ๋ฆฌ์ ์๋ฏธ๊ฐ ์์ด์ง
- 43์ชฝ
- ์ด ๊ทธ๋ฆผ์๋ ์ญ์ ์คํ์์ ๋น ์ ธ๋๊ฐ ๋ ธ๋๋ค์ด ๊ทธ๋ ค์ ธ ์์. ์ค์ ๋ฉ๋ชจ๋ฆฌ์๋ ์๋ค!
- backtracking: ํ๋๊ฒ ์ฒ๋ผ ๋ณด์ด์ง๋ง, ์ค์ ๋ฉ๋ชจ๋ฆฌ๋ ๊ทธ๋ ์ง ์์
- 44์ชฝ
- chronological backtracking: ์์ ํ expand๋์ง ์์์ง๋ง ์๊ฐ์ ๊ฐ์ฅ ์ต๊ทผ์ ๋ง๋ค์ด์ง(์คํ์ ๋ค์ด๊ฐ) ๋ ธ๋๋ก backtrackํ๋ ๊ฒ
- 50์ชฝ Nids = O(b^(d+1))
- time์์ 11%์ ์ค๋ฒํค๋๊ฐ ๋ฐ์ํ์ง๋ง ๊ทธ๋งํผ ๋ฉ๋ชจ๋ฆฌ๋ผ๋ ์ฅ์ ์ ์๊ณ ๊ฐ๋ค๋ ๊ฒ์ ์๋ฏธ๋ฅผ ๋๋ค
- 51์ชฝ expandํ ๋ goal test๋ฅผ ํด์ผํ๋ ์ด์ . link๋ง๋ค cost๊ฐ ์์ผ๋ฉด ๋ ๊น์ node๊ฐ optimal goal์ผ ์ ์๊ธฐ ๋๋ฌธ
- complete?: step cost๊ฐ ์์๋ 0์ธ ์ด์ ๋ 0์ธ ๋ฃจํ๊ฐ ์์ผ๋ฉด infinite loop๊ฐ ์๊ธธ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค
- time?: C*/e ์ธ ์ด์ ๋ link ๊ทธ๋๋ก ๋ฐ์ง์ง ์๊ณ step cost๋ก ๋๋์ด์ ๋จ์ ๋จ๊ณ๋ก ์๊ฐ. (5๋ฉด 1+1+1+1+1 ์ด๋ฐ์)
- 54์ชฝ ๊ธฐ์กด ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ค๋ฅธ ์ ์ closed์ ๊ธฐ์กด ๋ ธ๋๋ค์ ์ ์ฅ. ์ด์ ์๊ณ ๋ฆฌ์ฆ๋ค์์ ์ง๋๊ฐ ๋ ธ๋๋ค์ ๊ธฐ์ตํ ํ์๊ฐ ์์์
04 Heuristic Search
- heuristic function: ๋ด๊ฐ ์ผ๋ง๋ ๋นจ๋ฆฌ goal์ ๋๋ฌํ ์ ์๋์ง ๋ํ๋ด๋ ํจ์. cost๊ฐ ์ผ๋ง๋ ๋จ์๋์ง. ์ง๋์จ ๊ธธ์ ์๊ฐํ์ง ์์.
- ๋์ ์๋ฏธ์ heuristic function์ evaluation function์ด๋ผ๊ณ ํ ์ ์๋ค.
- ์ซ์ํ ์์์์์ heuristic์ ๋จ์ง ์ถ์ ๊ฐ์ด๊ณ ์ ํํ๊ฒ ์ค์ โ์์ผ๋ก ์ผ๋ง ๋จ์๋์งโ๋ ์ ์ ์๋ค. ์ค์ ๋ก ๋ณด๋ฉด 7์ชฝ์์ ๋ณด๋ฉด 5์์ 6์ผ๋ก ๊ฐ๋ค. ๋ฐ๋ผ์ ๊ทธ๊ฑธ ๋ฐ๋ผ๊ฐ์ ๋ฐ๋์ goal์ ์ฐพ๋๋ค๋ ๋ณด์ฅ์ ์๋ค.
- 8์ชฝ์์์ fringe๋ min heap๋ผ๊ณ ์๊ฐํ๋ฉด ๋จ
- 9์ชฝ Greedy best-first search
- goal์ ๊ฐ์ฅ ๊ฐ๊น์ด๊ฒ ๊ฐ์ node๋ฅผ ๋ฐ๋ผ๊ฐ
- Not complete๋ผ๋ ๋ง ๋ฌด์. ๋ค์ ๋ณด๋ฉด completeํ๋ค๊ณ ๋์์์!
- ์ฌํ๊น์ง ๋ณธ๊ฒ์ค์ ๊ฐ์ฅ ๋นํจ์จ์ ์ธ ์๊ณ ๋ฆฌ์ฆ ๊ฐ์ ๋ณด์ธ๋ค. time๊ณผ cost๋ฅผ ๋ณด๋ฉด
- A* search
- gb-f search๊ฐ ์ ๋นํจ์จ์ ์ด๋๋ฉด ์ฌํ ์จ๊ฑฐ์ ๋ํด์๋ ๋ค ๊น๋จน๊ธฐ ๋๋ฌธ. ๋ฐ๋ผ์ ๊ทธ๊ฒ๋ ๊ณ์ฐ์ ํฌํจํ๋ฉด ๊ฝค ํจ์จ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ ์ฐพ์ ์ ์์๊ฒ์ด๋ค ๊ทธ๊ฒ ๋ฐ๋ก a*: f = g + h
- h๋ฅผ 0์ผ๋ก ์ก์ผ๋ฉด UFS์ ๋์ผ => heuristic search๋ผ๊ณ ์ํ๋ค
- 11์ชฝ ๋ง์ง๋ง ์กฐ๊ฑด: h*๋ ์ค์ ๊ฑฐ๋ฆฌ. ์ด ์กฐ๊ฑด์ ๋ง์กฑํ๋ ๊ทธ๋ํ๋ฅผ admissible heuristic์ด๋ผ๊ณ ํ๋ค
- 9์ชฝ์ ๊ทธ๋ํ์์ ์ค๋ฅธ์ชฝ์ (h=4) ๋๋ฌธ์ a* search๋ฅผ ์ธ ์ ์์
- 19์ชฝ ์์ ํํฐ์ ๊ฐ์ ์๊ณ ๋ฆฌ์ฆ์ธ๋ฐ expand๋ถ๋ถ์ด ์ข ๋ ๋ณต์ก
- successor๊ฐ ์ฒ์ ๋ง๋๋ ์ ๋ฉด ๊ฐ์ ๊ทธ๋๋ก ์ ์ฅ
- ์ด๋ฏธ ์์ผ๋ฉด ์๋ก ๊ณ์ฐํด์ minimumํ ๊ฒ์ ์ ์ฅ
- goal state์ h*๊ฐ์ ํญ์ 0
- 21์ชฝ G๋ 9+0์ด๊ณ C๋ 8+3=11์ด๋ฏ๋ก ๋์ ๋น๊ตํจ. G๋ฅผ ๋จผ์ expandํ๋ ค๊ณ ํ๋ ์ค goal test๋ฅผ ํ๋๋ฐ goal์ด๋๊น C๋ expand ์ํ๊ณ ๋๋จ
- h*๋ ์ฐ๋ฆฌ๊ฐ ์๋ ๊ฐ. h๋ ์ ํํ ์์ง ๋ชปํ๊ณ ๋จ์ง ์ถ์ ํ๋ ๊ฐ์ผ ๋ฟ์ด๋ค
- g๋ expandํ๋ฉด์ ๊ตฌํ๋๊ฒ์ด๋ค. ์ฒ์๋ถํฐ ์๋ ค์ง๊ฒ ์๋
- 23์ชฝ์ gbf์์น๋ฅผ ์ด์ฉํ์ฌ optimal path๋ฅผ ์ฐพ์ง ๋ชปํ ์์ด๋ค
- 24์ชฝ์ a*๋ฅผ ์ด์ฉํ์ฌ optimal path๋ฅผ ์ฐพ์
- 25์ชฝ์ OPEN์ fringe์
- ๋์งธ์ค์์ h๊ฐ admissible(h* >= h)ํ๋ค๊ณ f* >= f๋ผ๊ณ ํ ์ ์์.
- ์ ๋ ๊ฒ ๋งํ ์ ์๋ ์ด์ ๋ f๊ฐ ๋จ์กฐ์ฆ๊ฐ ํ๊ธฐ ๋๋ฌธ
- admissibleํ๋ฉด ๋จ์กฐ์ฆ๊ฐํ๋ค(์ผ๊ฐํ ๊ณต์)
- ์ด๋ค ๋ ธ๋๋ expandํ ๋(fringe์์ ๋ฝํ ๋)์๋ ๊ทธ ๋ ธ๋์ g๊ฐ optimalํ๋ค.
- 28์ชฝ IDA*๋ cutoff(limit)์ f๋ก ํ๋ค
- A*๋ ์ข์๋ณด์ด๋๋ฐ๋ก ๊ฐ๋ฉด์ ๋ค ํผ์ณ๋ณธ๋ค๋ฉด RBFS๋ ๊ฐ๋ค๊ฐ ์๋๊ฒ๊ฐ์ผ๋ฉด backtrackํด์ ๊ทธ ๊ฒฝ๋ก์ ๋ํ ์ ๋ณด๋ฅผ ๊ธฐ๋กํจ
- RBFS๋ IDA*๋ณด๋ค ์๊ฐ์ ์กฐ๊ธ ๋ ๋ง์ด ์ฐ๋ ๋์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ ๊ฒ ์ด๋ค
- SMA*: simple memory bounded a*
- ๋ด๊ฐ ์ฌ์ฉํ ์ ์๋ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ค ใ ์ฌ์ฉํจ. ๋จ ๊ทธ ์ด์์ด ๋๋ฉด RBFS์ฒ๋ผ backtrackํจ(๊ฐ์ฅ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ง์ด ์ฐจ์งํ๋๊ฒ์)
05 Local Search
- ๊ทธ๋ญ์ ๋ญ ๊ด์ฐฎ์ ์๊ณ ๋ฆฌ์ฆ
- 3์ชฝ์์ hill์ ๊ฐ์ฅ ๋์ ๊ณณ(evaluation ๊ฐ์ด ํฐ ๊ณณ)์ผ๋ก ์ฌ๋ผ๊ฐ๋ ๊ฒ์ด ๋ชฉํ
- ์ง๊ธ๋ณด๋ค ๋ฎ์ ๊ณณ์ผ๋ก๋ ๊ฐ์ง ์๊ณ , ๊ฒฝ์ฌ๊ฐ ๊ฐ์ฅ ๋์ ๊ณณ์ผ๋ก ๊ฐ
- ๋ฐ๋ผ์ ๋ด ์ฃผ๋ณ์ ๋ฎ์ ๊ณณ๋ง ์์ ๋ ์ข ๋ฃ๋จ -> local optimal์ ์ฐพ์ ์ ์์ง๋ง global optimal์ ๋ชป์ฐพ์ ์๋ ์์.
- random restart: ํ๋ฒ search๊ฐ ๋๋๋ฉด randomํ ์์น์์ ๋ค์ search๋ฅผ ์งํํจ (์กด์ฌํ ์๋ ์๋ global optimal๋ฅผ ์ฐพ๊ธฐ ์ํด)
- 7์ชฝ simulated annealing search
- hill climbing search์ฒ๋ผ ๋ฎ์ ๊ณณ์ ์์ ์ ์ธํ๋๊ฒ ์๋๋ผ ํ๋ฅ ์ ์ผ๋ก ๋ฎ์ ๊ณณ์ผ๋ก ๊ฐ ์๋ ์์
- T = f(t)
- T๋ temperature, t๋ time, f(x)๋ ์ ํ๋ ๊ฒ
- next ์์น๋ฅผ ๋๋ค์ผ๋ก ์ค์ ํ์ฌ ํ์ฌ๋ณด๋ค ๋์ผ๋ฉด ๊ฐ๊ณ , ๋ฎ์ผ๋ฉด ํ๋ฅ ์ ๋ฐ์ ธ์ ๊ฐ๊ฑฐ๋ ๊ฐ์ง ์์
- ํ๋ฅ ๊ณต์์ ๋ณด๋ฉด ์จ๋๊ฐ ๋ฎ์์๋ก optimal์์ ๋ฉ์ด์ง ํ๋ฅ ์ด ์ ๊ฒ ์ค๊ณ๋์ด์์. ๊ทธ๋ฆฌ๊ณ e์ ๋ํด exponentialํ๋๊น ์ฒ์์๋ ๋ง์ด ํค๋ฉ๊ณ ํ ๋จ์ด์ ธ์ ์ค๋ซ๋์ ์กฐ๊ธ์ฉ ํค๋งค๊ฒ ํจ (๊ผญ ๋์์๋ ๊ณต์๋๋ก ์ธ ํ์๋ ์์. design issue!)
- ์จ๋๋ฅผ ์ฒ์ฒํ ๋ฎ์ถ๋ฉด global optimal์ ์ฐพ์ ํ๋ฅ ์ด ๋์
- ์ด๋ก ์ ์จ๋๋ฅผ ๋ฌดํํ ์ฒ์ฒํ ๋ฎ์ถ๋ฉด global optimal์ ์ฐพ์ ์ ์๋ค
- ๋๋ฌด ๋ณต์กํ ๋ฌธ์ ๊ฐ ์์ ๋ ์ด๋ ค์ด ์๋ฃจ์ ์ ์ฐพ๋ ๋์ ์งํธ๋ผ๊ธฐ ์ก๋ ์ฌ์ ์ผ๋ก ์์ฃผ ๋จ์ํ ์์ ์๊ณ ๋ฆฌ์ฆ์ ์ด์ฉํ ์ ์๋ค
- propositional satisfiability: ์ฃผ์ด์ง ๋ ผ๋ฆฌ์์ 0 ๋๋ 1์ ๋์ ํ์ฌ ๊ฒฐ๊ณผ๊ฐ 1์ด ๋์ฌ์ ์๊ฒ ํ ์ ์๋์ง ์ฌ๋ถ -> SAT solver๋ฅผ ์ด์ฉํด์ ํด๊ฒฐํ ์ ์์
06 Game
- ์์์ ๋ฐฐ์ด๊ฒ๋ค๊ณผ ๋ฌ๋ฆฌ ์์ธก ๋ถ๊ฐ๋ฅํ ์์๊ฐ ์กด์ฌํ๋ค: ์๋์ ์์ง์, chance
- ply: ํ๋ ์ด์ด ํ๋์ ์ฐจ๋ก. 2 ply = 1 move. move๊ฐ ํ๋์ ์๋ฏธ์๋ ๋จ์์
- utility: ํ๋์ terminal state๋ง๋ค์ ํจ์ฉ์ฑ(์น๋ฆฌ/ํจ๋ฐฐ ํน์ ์ป์ ๋/์์ ๋)
- ๋ณดํต ์ฒซ ํ๋ ์ด์ด๋ฅผ max๋ผ๊ณ ํจ. utility๋ฅผ max์ ์ ์ฅ์ ๋ฐ๋ผ ์ ํ๊ธฐ ๋๋ฌธ
- Minimax: min๊ณผ max ๋ชจ๋ best play๋ฅผ ํ๋ค๊ณ ๊ฐ์ . ์ฆ max์ ์ ์ฅ์์ ์๋์ธ min์ ๊ฐ์ฅ ๋ถ๋ฆฌํ play๋ฅผ ํจ
- dfs
- b: branching factor/m: maximum depth
- ab pruning
- 18์ชฝ doubles solvable depth์ ์๋ฏธ: depth๋ m, branching factor๋ฅผ ๋ฃจํธb๋ก ์ค์ด๋ฌ. ๊ทธ๋ฅ minimax์ ๊ฐ์ ์๊ฐ(b^m)์ผ๋ก ๊ณ์ฐ ํ๋ค๋ฉด depth๋ฅผ 2m๋งํผ searchํ ์ ์๋ค.
- random ordering์ ๊ฐ์ ์๊ฐ ์์ (4/3)m๋งํผ searchํ ์ ์๋ค
- heuristics: ๊ฐ์ depth์ node๋ค์ ๋ํด์ ํด๋น ๋ ๋ฒจ์์์ max/minํ ํด๋ฅผ ๊ธฐ์ตํ๊ณ ์๋ค
- DFIDํ ๋ ์ด์ iteration์์์ max/min๊ฐ์ ๊ธฐ์ตํ๊ณ ์์
- 19์ชฝ: quiescence search - eval๊ฐ์ด dynamicํ๊ฒ ๋ณํ๋ ์ํฉ ๋ง๊ณ ์ ์ ํ ์ํฉ์์ cut off๋ฅผ ํ๋ค. (๋ณ์ฌ ์กํ๊ณ ๋ค์์์ ๋ง์ ๋จน์ ์ ์๋ ์ํฉ/๋ณ์ฌ๋ฅผ ๋จน๊ณ ๋ค์์์ ๋ง์ ์กํ๋ ์ํฉ)
- ์ ํํ ๊ฐ์ผ ํ์ ์์
- Expectiminimax
- ์ ํํ ๊ฐ์ด ํ์
- TDGammon์ ์ํ๊ณ ๊ฐ์ ๋ฐฑ๊ฐ๋จผ ๊ฒ์ ํ๋ก๊ทธ๋จ์. ๋ ์ ์์ ๋ด๋ค๋ณธ๋ค
- Games of imperfect information
- ์นด๋๊ฒ์์ฒ๋ผ ์๋์ ํจ๋ฅผ ๋ชจ๋ฅด๋ ๊ฒฝ์ฐ์๋ ๋ชจ๋ ๊ฐ๋ฅ์ฑ์ ๋ํ ํ๋ฅ ์ ๊ตฌํ ์ ์๋ค.
07 CSP
- CSP๊ฐ ์๋ constraint๊ฐ ์๋ ์ผ๋ฐ์ ์ธ dfs์์๋ pruning์ ํ์ง ์์
- CSP๋ dfs์ ์ค๊ฐ ๋จ๊ณ์์ constraint๋ฅผ ๋ง์กฑํ๋์ง ์ฌ๋ถ๋ฅผ ํตํด pruning์ด ๊ฐ๋ฅํ๋ค๋ ์ ์ด ๊ธฐ์กด์ ์ผ๋ฐ์ ์ธ dfs์ ๋น๊ตํด์ ํ๋์ ์ฅ์ ์ด ๋ ์ ์๋ค
- expandํ์ง ์๊ณ constraint๋ฅผ ๋ง์กฑํ๋ ์ ๋ค๋ง ์์์ผ๋ก ์ผ๋๋ค
- optimization์ ํ ๋ ์ฃผ๋ก local search๋ฅผ ์ด๋ค
- 10์ชฝ์์ root๋ ธ๋์ 4๊ฐ์ ์์์ ๋ค ํ์ง ์๋ ์ด์ : symmetricํ๊ธฐ ๋๋ฌธ์ ๋๊ฐ๋ง ํด๋ณด๋ฉด ๋๋ค
- ๋ฐ์ ์์์์๋ ๋ ์ด variable, color๊ฐ value
- Minimum remaining values
- ์์์ ๋ฐฐ์ด heuristic์ฒ๋ผ value๋ฅผ ์ ํํ๋ ๊ฒ์ด ์๋๋ผ MRV๋ฅผ ๊ฐ์ง โvariableโ์ ์ ํํจ
- ๊ฐ์ฅ ๋จ์ ๊ฐ์ด ์ ์ variable์ ์ ํ
- Most constraining variable
- ๋ค๋ฅธ variable์ ๋ํด ๊ฐ์ฅ ๋ง์ ์ํฅ์ ๋ฏธ์น๋ ์ ๋ฅผ ์ฐ์ ์ ์ผ๋ก ์ ํ
- 13์ชฝ์ ์์์๋ ๋ค๋ฅธ ๋ฉด๊ณผ ๊ฐ์ฅ ๋ง์ด ๋ง๋ฟ์ ์๋ ์
- Least constraining value
- ๋จ์ variable์ด ์ต๋ํ ๋ค์ํ value๋ฅผ ๊ฐ์ง ์ ์๊ฒ ํ๋ ๊ฐ์ ๊ฐ์ง ์
- variable์ failure๋ฅผ ๋นจ๋ฆฌ ์ฐพ๋ ๋ฐฉํฅ(๊น๋ค๋กญ๊ฒ), value๋ constraint๋ฅผ ๋ง์กฑํ๋ ๋ฐฉํฅ์ผ๋ก ์ด๋
- Backtracking ํจ์จ์ ์ผ๋ก ํ๊ธฐ ์ํ ๊ฒ๋ค
- Forward checking
- ๋จ์ variable์ด ๊ฐ์ง ์ ์๋ value๋ค์ ๊ธฐ๋กํจ -> ์ด๋ ํ๋๋ผ๋ ๊ณต์งํฉ์ด ๋๋ฉด backtrackํจ(๊ฐ์ฅ ์ต๊ทผ์ ํ assignment๋ฅผ undo)
- Constraint propagation: ๊ณต์งํฉ์ด ๋์ง๋ ์์์ง๋ง ์ธ์ ํ ๋๊ฐ๊ฐ ๊ฐ์ ์(ํ๋)์ด ๋จ์์ผ๋ฏ๋ก failure๋ฅผ detectํ๊ฒ ํจ
- Arc consistency: ๋ชจ๋ vi์ ๋ํด ์ด๋ค vj๊ฐ constraint๋ฅผ ๋ง์กฑํ๋ค๋ฉด vi->vj๋ consistentํ๋ค๊ณ ํ๋ค
- preprocessor์ด๋ postprocessor๋ก ์ด์ฉ๋ ์ ์์
- ๋ฐ๋ผ์ assignment๊ฐ ๋ฐ์ํ๋ฉด ๋๋ฅผ ์ณ๋ค๋ณด๋ unassigned๋ ์ ๋ค์ด constraint๋ฅผ ๋ง์กฑํ๋์ง ๋ชจ๋ ์ดํด๋ด์ ์๋๋ฉด ์๋๋ value๋ฅผ ์ง์์ consistentํ๊ฒ ๋ง๋ค์ด์ผํ๋ค.
- time complexity: O(n^2 * d^3) -> ์ต๋ n^2๊ฐ์ edge๊ฐ ์์ ์ ์์ * edge๋ queue์ ์ต๋ d๋ฒ ๋ค์ด๊ฐ * valueํ๋์ ๋ํด constraint๋ฅผ ๋ง์กฑํ๋์ง ํ์ธํ๋ ํ์(RM-Inconsistent-Values)๋ d^2
- SAT๋ ๊ฐ์ฅ ๋ํ์ ์ธ CSP๋ฌธ์ ์ด๋ค: variable์ด ๊ฐ์ง ์ ์๋ value๋ 0๋๋ 1, constraint๋ ์์ ๊ฒฐ๊ณผ๊ฐ 1์ด์ด์ผ ํ๋ค๋ ๊ฒ
- ๊ฒฝ๋ก๋ฌธ์ ์์ ์ด๋ค ๊ฒฝ๋ก์ ๋ํด consistentํ๋ค๋ ๊ฒ(path consistency)์ ๋ณด์ฅํ ์ ์์. pair-wise๋ก ๊ณ์ฐํ๊ธฐ ๋๋ฌธ์.
- map coloring์ ๊ฒฝ์ฐ์๋ preprocessor์ ์๋ฏธ๊ฐ ์์: ๋งจ ์ฒ์์ ์๋ฌด๊ฒ๋ ์์น ๋์ง ์์ ์ํ์์๋ inconsistentํ ๊ฐ์ด ์์ผ๋๊น
- chronological backtracking: ๊ฐ์ฅ ์ต๊ทผ์ ํ๋ ๊ฒ์ undoํ๋ ๋ฐฉ์
- 26์ชฝ: local search์ ๋น์ทํด ๋ณด์ด์ง๋ง backtracking์ ํ๋ฉด heuristic repair์ด๊ณ ํ ์ํ๋ง ๊ฐ์ง๊ณ ์์ผ๋ฉด local search์
- CSP๋ก ํ ์ ์๋๊ฑด ๋๋ถ๋ถ local search๋ก ํ ์ ์์
//์ค๊ฐ๊ณ ์ฌ CSP๊น์ง
TF
A* ์๋์ฝ๋ ์๋ชป๋ ๊ฒ
ํ๋ฅ Minimax
NQueens forward checking + Arc consistency
Forward Checking + Arc Consistency
08 Learning Intro & Decision Tree
- ์์ ์ ๋ฒ์ญ๊ธฐ: ์ด๋ค ์ธ์ด๋ฅผ ํ๋์ ์ธ์ด๋ก ๋ฐ๊พผํ ๊ทธ๊ฒ์ ๋ชฉํ ์ธ์ด๋ก ๋ฐ๊ฟ
- ํ์ฌ์ ๋ฒ์ญ๊ธฐ: ๋ชฉํ ์ธ์ด๋ก ๋ฐ๋ก ๋ฐ๊ฟ
- ์ด๋ค ๋ ๋ฆฝ์ ์ธ ๊ธฐ๋ฅ์ ์ํํ๋ ๋จ์๋ฅผ agent๋ผ๊ณ ํ๋ค. ์ฌ๋์ผ์๋ ๋ก๋ด์ผ์๋
- 3์ชฝ
- Performance Standard๋ ๊ณ ์ ํ๋๊ฒ์ด ์ผ๋ฐ์ .
- Problem generator: ์ค์ ๋ฌธ์ ๊ฐ ์๋ ์๊ธฐ๊ฐ ์ค์ค๋ก ๋ฌธ์ ๋ฅผ ๋ง๋ค์ด๋ณด๊ณ ํ๊ธฐ์ํ ๋ ธ๋ ฅ์ ํจ. ์ฌ๊ธฐ์๋ ๋ฌด์
- 4์ชฝ
- representation: ์ด๋ค ์๊ณ ๋ฆฌ์ฆ์ ์ด์ฉํ์ฌ ํ์ตํ ๊ฒ์ธ๊ฐ์ ๋ฌธ์
- ํผ๋๋ฐฑ์ ์ข ๋ฅ ์ธ๊ฐ์ง: supervised - ๊ฐ๊ฐ์ ์์ ์ ๋ํด ์ ๋ต์ด ์ฃผ์ด์ง, unsupervised - ์์ ์ ๋ํ ๋ต์ด ์์, reinforcement - ์์ ์ ๋ํด ์๊ณผ ๋ฒ์ ์ค occasionally
- supervised learning์ ๋๋ถ๋ถ inducted learning์ด๋ค
- data์ pair(์ ๋ ฅ๊ณผ ์ถ๋ ฅ)์ ๋ณด๊ณ f์ ์ต๋ํ ๊ทผ์ ํ๋ ํจ์(h)์ ์์๋ด๋ ๊ฒ์ด ๋ชฉํ
- f๋ฅผ ์ ํํ ์์๋ด๋ ค๋ฉด ๋ชจ๋ x์ ๋ํด์ y๊ฐ ์ผ์นํด์ผ ํ๋๋ฐ ์ค์ ์ํฉ์์ x๊ฐ ์ ํํ์ง ์๊ธฐ ๋๋ฌธ์ ๋ชจ๋ x์ ๋ํด์ ํ์ธํ ์ ์์
- training set์ ์๋ x์ ๋ํด์๋ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋๊ฒ -> generalization
- ๋ญ๊ฐ ์ค์ํ๋ค๊ณ ์๊ฐํ๋๋(outlier๊ฐ ์๋ค๊ณ ์๊ฐํ๋๋ ์๋ค๊ณ ์๊ฐํ๋๋ ๋ฑ)์ ๋ฐ๋ผ 8์ชฝ์ ์ธ๊ฐ์ง ๊ทธ๋ํ ์ค ์ด๋ค์์ผ๋ก ํ๋๊ฒ ๋ฐ๋์งํ์ง ๋ฌ๋ผ์ง ์ ์๋ค. ํ๋์์ด 100% ๋ค ๋ง์ท๋ค๊ณ ๋ฌด์กฐ๊ฑด ์ข๋ค๊ณ ํ ์ ์์
Decision Trees
- ํ ์คํธ๋ฐ์ดํฐ์ ๋์์ ผํธ๋ฆฌ ๊ฐ์๋ ๋ ผ๋ฆฌ์ ์ธ ๋น์ฝ์ด ์กด์ฌํ๋ค
- 18์ชฝ: ํํ๋ ฅ๊ณผ space๊ฐ์ balance๊ฐ ์ค์
- 19์ชฝ: default๊ฐ -> ๋ง์ฝ ์ด๋๊ฒ์๋ ํด๋นํ์ง ์์ผ๋ฉด ์ค์
- DTL์ greedy(hill climbing)๊ณผ ๊ฐ์ด ํ๋ํ๋ค
- backtracking ์ํจ
- ํ์ฌ ์ํ์์ Gain์ด ๊ฐ์ฅ ํฐ ์ ๋ฅผ ์ ํ
- ํ๋์ state๋ฅผ partial decision tree๋ก ๋ํ๋
- 24์ชฝ: ํธ๋ฆฌ์ ์๋ attribute์ domain์ ๋ํด์๋ donโt care๋ก ๋์๊ฒ์
- Performance Measurement(h๊ฐ f์ ์ผ๋ง๋ ๊ฐ๊น์ด์ง)
- test set์ ์ด์ฉํ์ฌ ๊ฒ์ฆ(training set๊ณผ ๋ฌ๋ผ์ผํจ)
- nonrealizable -> training set์ด ๋๋ฌด ์์ ๊ฒฝ์ฐ/์ ํธ๋ฆฌ๋ทฐํธ๊ฐ ์์ ๊ฒฝ์ฐ
- redundant -> ์ธ๋ฐ์๋ ์ ํธ๋ฆฌ๋ทฐํธ๊ฐ ๋๋ฌด ๋ง์ ๊ฒฝ์ฐ. overfitting
09 Linear Predictors
- linear predictor์ ๋ํด ๋ฐฐ์ -> neural network
- 10์ชฝ์์ 0์ผ๊ฒฝ์ฐ์๋ +1/-1 ์ค ํ๋๋ก ๋ถ์ด๋ฉด ๋๋ค
- 2์ฐจ์: ์ง์ , 3์ฐจ์: ํ๋ฉด, n์ฐจ์: hyperplane
Loss minimization
- optimization
- margin = (w*phi)*y
- ๋๊ฐ์ด positive๋ผ๋ 0.5์ 1์ confidence๋ ๋ค๋ฅด๋ค๊ณ ์๊ฐํ๋ค.
- ์์๊ฐ์ด๋ฉด ํ๋ฆผ, ์์๊ฐ์ด๋ฉด ๋ง์. ์ ๋๊ฐ์ด ํด์๋ก ์ผ๋ง๋ ๋ง์๊ณ ์ผ๋ง๋ ํ๋ ธ๋์ง ์ ์ ์์
- 16์ชฝ: 1[์ด์ฉ๊ตฌ]๋ ์ด์ฉ๊ตฌ๊ฐ ๋ง์ผ๋ฉด 0, ํ๋ฆฌ๋ฉด 1์ ๋ฆฌํดํ๋ ํจ์
- residual: ์ค์ ๊ฐ๊ณผ ์์ธก๊ฐ๊ณผ์ ์ฐจ์ด
- square loss: residual ์ ๊ณฑ
- classificationํ ๋๋ regressionํ ๋ ๋ฌด์์ ์ค์ฌ์ผ๋ก error๋ฅผ ์ ํ ์ง ๋ฌ๋ผ์ง(margin/residual)
- 22์ชฝ์์ squared loss๋ฅผ ์ฌ์ฉํ๋ฉด y๊ฐ ์ต์๊ฐ ๋๋ w๊ฐ์ 0, 2, 1000์ ํ๊ท ์ด๊ณ absolute deviation์ ์ฌ์ฉํ๋ฉด y๊ฐ ์ต์๊ฐ ๋๋ w๊ฐ์ 2(0, 2, 1000์ median)
Stochastic gradient descent
- squared loss๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ w๊ฐ ํ๋์ผ๋๋ ๋ฏธ๋ถํด์ 0๋๋๊ฐ ์ฐพ์ผ๋ฉด ๋จ. ์ฌ๋ฌ๊ฐ์ผ๋๋ ๋ณ์ ํ๋๋น ํธ๋ฏธ๋ถํด์ 0๋๋๊ฐ ์ฐพ์
- gradient: ๊ธฐ์ธ๊ธฐ
- gradient descent: continuous space์์ ํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์.
- initialize์ ์๋ฏธ: ๋ค 0์ผ๋ก ํ๋ผ๋๊ฒ ์๋๋ผ ๋๋ค๊ฐ ๋ฃ์ผ๋ผ๋๋ง
- hill climbing๊ณผ ๋ค๋ฅธ์ ์ ๋ชจ๋ ๋ฐฉํฅ์ ๊ณ ๋ คํ๋๊ฒ ์๋๋ผ training data๊ฐ ์๋ ค์ฃผ๋ ๋ฐฉํฅ์ผ๋ก ๊ฐ
- step size๊ฐ ํฌ๋ฉด ํด์๋ก ํ์ต์ ์ผ๋ง๋ ๊ณผ๊ฐํ๊ฒ ์งํํ๋๋๊ฐ ๋ฌ๋ผ์ง -> learning rate๋ผ๊ณ ๋ถ๋ฅด๊ธฐ๋ ํจ
- 27์ชฝ ๊ณต์์์ ๋ณ์๋ w๋ฟ์ด๋ค(x, y๋ ์ฃผ์ด์ง๋๊ฒ) ๋ฐ๋ผ์ objective function์ w์๋ํด ๋ฏธ๋ถํ ๊ฒ์ด gradient์
- gradient descent์ ๋ฌธ์ ์ : data๊ฐ ์์ฒญ ๋ง์ผ๋ฉด ํ iteration์ ํ ๋ data๋ฅผ ํ๋ฒ ์ค์บํด์ผํ๋๋ฐ ์์ฒญ ์ค๋๊ฑธ๋ฆฐ๋ค. ๋ฐ๋ผ์ ๋ชจ๋ ๊ณ์ฐํ ๋ค์ iteration์ ํ์ง ์๊ณ tupleํ๋ํ๋ ๋ณผ ๋๋ง๋ค iteration์ ํจ(๊ฒฐ๊ณผ๊ฐ ๋๊ฐ์ง๋ ์์) -> stochastic gradient descent
- decreasing step size: simulated annealing์์ temperature๊ณผ ๋น์ทํ ๊ฐ๋
- zero-one loss
- gradient๊ฐ ํญ์ 0์ด๊ธฐ ๋๋ฌธ์ SGD๋ฅผ ์ด์ฉํ ์ ์์. optimization์ loss์ ๋น๋กํด์ ์งํ๋๋๊น
- ์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด hinge loss function์ ์ด์ฉ
- hinge loss๋ zero-one loss์ upper bound์ด๋ฏ๋ก zero-one๊ณผ ์ถ๊ตฌํ๋ ๋ฐฉํฅ์ ๊ฐ์
- 0<x<1 ๊ตฌ๊ฐ์์๋ ํ์ต์ด ๋ฐ์ํจ
- loss๊ฐ ํด์๋ก loss๋ฅผ ์ค์ด๋ ค๋ ๋ ธ๋ ฅ์ ๋ ๋ง์ดํจ. zero one์ ๊ฒฝ์ฐ์๋ ์ค์ด๋ ค๋ ๋ ธ๋ ฅ์ด ๊ฐ์ ํญ์ 1์ด๋๊น
- logistic regression
- ๋ชจ๋ ๊ตฌ๊ฐ์์ ๋ฏธ๋ถ ๊ฐ๋ฅํจ
- ํญ์ upper bound๋ ์๋์ง๋ง ์ ์ฒด์ ์ผ๋ก ๋ฌธ์ ๋ ์์
- margin์ด 1์ ๋์ด๋ ํ์ต์ ์งํํจ
- SGD์ terminal condition
- ๊ณ ์ ๋ iteration ํ์๋ฅผ ๋๊ธธ ๊ฒฝ์ฐ
- weight update๊ฐ ๋ฉ์ถ ๊ฒฝ์ฐ(๋ฏธ๋ฏธํ ๊ฒฝ์ฐ)
10 Neural Network
- ์ฌ๋ฌ๊ฐ์ง linear predictor๋ฅผ ํฉ์ณ์ ํ๋์ predictor๋ฅผ ๋ง๋๋ ๊ฒ. ๋จ ํฉ์น ๊ฒ์ด nonlinearํ ์ ์๊ฒ ํ๋ ์์๋ฅผ ์ถ๊ฐ
- 2์ชฝ์์ ํ๋จ๊ณ๋ก ํ์ตํ๋ ๊ฒ(x -> y)์ 3์ชฝ์์๋ ๋๋จ๊ณ๋ก ํ์ตํจ(x -> h1 + h2 -> y)
- >=๊ฐ ๋ฐ๋ก NN์ nonlinearํ๊ฒ ๋ง๋๋ ์์(thresholding)
- NN์์๋ง ํ ์ ์๋ ์ผ์ด ์์. XOR์ ๋จ์ผ linear classification์ผ๋ก ํ์ตํ ์ ์๋ค
- sigmoidํจ์: zero-oneํจ์๋ฅผ ๋ชจ๋ ์ ์์ ๋ฏธ๋ถ๊ฐ๋ฅํ๊ฒ ํ๋ด๋ธ ๊ฒ
- 8์ชฝ: 1.5, -0.5, 0.5๋ threshold value๋ฅผ ๋ํ๋ธ๋ค. 1, -1์ weight.
- NN์์๋ gradient descent๋ฅผ backpropagation method๋ผ๊ณ ๋ถ๋ฅธ๋ค
- d: desire (์ํ๋ ๊ฐ)
- s: weighted sum
- f: sigmoid ํจ์
- ฮต: error
- error๊ฐ ์ํ๋๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ ์ ๊ณฑ์ด๋ผ๊ณ ํ๋ฉด error๋ฅผ s์ ๋ํด ๋ฏธ๋ถํ ๊ฒ์ -2(d-f)
- ๊ฒฐ๊ณผ์ ์ผ๋ก gradient๋งํผ์ error๋ฅผ ๊ณ ์นจ
- 10์ชฝ: layer๊ฐ์ connection์ ๋ชจ๋ complete bipartiteํ๋ค
- k-layer feedforward network๋ผ๊ณ ํจ(feedback ๋์ง ์์)
- ํ์๋ถ๋ถ์ hidden layer์ด๋ค
- j๋ฒ์งธ ๋ ์ด์ด์ i๋ฒ์งธ unit์ ๋ํ๋ด๋ ค๋ฉด j๋ฅผ ์์ i๋ฅผ ๋ฐ์ ์ด๋ค
- thresholdํจ์๋ฅผ ์ ํ๊ธฐ ์ํด dimension์ ํ๋ ์ถ๊ฐํ์ฌ 1๋ก ๋ -> 11์ชฝ์์ m(j-1)+1์์ ํ๋ฌ์ค 1์ด ๋๋ ์ด์ . 1์ ์ํด unit์ด ๋ฐ๋ก ๋ง๋ค์ด์ฃผ๋๊ฑด ์๋
- 14: j+1๋ฒ์งธ ๋ ์ด์ด์ unit๋ค์ ๋ธํ๋ฅผ ์ด์ฉํ์ฌ j๋ฒ์งธ ๋ ์ด์ด์ i๋ฒ์งธ unit์ ๋ธํ๋ฅผ ๊ตฌํจ
- ๋ค์์๋ถํฐ ์์ผ๋ก ๊ฐ๋ฉด์ ๋ธํ๊ฐ์ ๊ฒฐ์ => backpropagation
- 15: 0์ธ ์ด์ ๋ ๊ฐ์ ๋ ์ด์ด์ unit๋ค์ ์๋ก์๊ฒ ์ํฅ์ ๋ผ์น์ง ์๊ธฐ ๋๋ฌธ
- train instance ํ๋์ ๋ํด์ ๊ฐ unit๋ณ๋ก ๊ฒฐ๊ณผ๋ฅผ ๊ณ์ฐ -> backpropagation์ผ๋ก weight๋ฅผ ์ ๋ฐ์ดํธ
- generalization: ์ ํํ train set์ ํตํด ๋์จ ๋คํธ์ํฌ๋ก ๋ฌดํํ ๊ฒฝ์ฐ์ ๋ํ ์ถ์ ๊ฐ์ ๊ตฌํ ์ ์๋ค
- 18: ์ผ๊ณฑ๊ฐ์ ์ ์ ๋ํด ํจ์๋ฅผ ๊ตฌํ๋ค๊ณ ๊ฐ์
- ๋ฌด์กฐ๊ฑด ์๋ฌ๊ฐ ์ ์ ๊ฒฝ์ฐ(high-degree)๊ฐ ์ข์๊ฐ?
- ์๋. noise๊ฐ ์กด์ฌํ ์ ์๊ณ , train data๋ ์ผ๋ถ์ ๋ถ๊ณผํ๊ธฐ ๋๋ฌธ. ๋ฐ๋ผ์ train set์ผ๋ก ํจ์์ accuracy๋ฅผ ์ธก์ ํ๋ ๊ฒ์ ์๋ชป๋๊ฒ.
- ๊ทธ๋ผ ์ ์ฒด๋ฅผ ๋ชจ๋ฅด๋ ์ํฉ์์ ์ด๋ค ํจ์๊ฐ ๋ฐ๋์งํ์ง ์์ ์๋๊ฐ?
- ์ฃผ์ด์ง training set์ ๋๊ฐ๋ก ๋๋: training set๊ณผ validation set -> cross validation
- k-fold cross validation: ์ ์ด๋ ๋ช๋ฒ ์ด์์ ํด์ผ ์๋ฏธ๊ฐ ์๋ค. ํ๋ฒ ํ๋๊ฑด ์๋ฏธ ์์
- overfitting: ๋น์ทํ ์๋ฌ๋ฅผ ๋ธ๋ค๋ฉด ๋ฎ์ ์ฐจ์์ ํจ์(2์ฐจ์๋ณด๋ค๋ 1์ฐจ์ ํจ์)๋ฅผ ์ด์ฉํ์ฌ์ผ ๋ฐฉ์งํ ์ ์๋ค
- underfitting: ๋ฐ์ดํฐ์ ๋ณต์ก๋๋ฅผ ์ถฉ๋ถํ ๋ณด์ฅํ์ง ์์ ๋๋ฌด ๋ฎ์ ์ฐจ์์ ํจ์๋ก ๋ํ๋ด๋ ค๊ณ ํ๋๊ฒ
- 21: validation set error ๊ฐ์ํ๋ ๋ถ๋ถ์ ์ธ๋ํผํ ์์ ์ ์์ผ๋ก ๊ฐ๋ ๋ถ๋ถ, ์ฆ๊ฐํ๋ ๋ถ๋ถ์ ์ ์์์ ์ค๋ฒํผํ ์ผ๋ก ๊ฐ๋ ๋ถ๋ถ
- ์์ ๋ชจ๋ธ(NN, decision tree, linear predictorโฆ)์ parametric model(๋ฐ์ดํฐ์ ์๋ง์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋ ํ์ต).
- nearest neighbor์ non-parametric
- regression์ด ์๋ classification์ ์ฌ์ฉ
- ๊ทธ๋ฅ ๋ด๊ฐ ๊ฐ์ง train set์ค ๊ฐ์ฅ ๊ฐ๊น์ด ์ ์ class๋ฅผ ๋ฆฌํด
- generalization์ ํ๋ค๊ธฐ ๋ณด๋ค๋ storage์ ๋ฌธ์
//๊ณผ์
sigmoidํจ์๊ฐ 1์ด์ -1์ดํ์ผ๊ฒฝ์ฐ ๊ทธ๋๋์ธํธ ๊ฐ์ด ์๊ธฐ ๋๋ฌธ์ convergence๊ฐ ์ ์ด๋ฃจ์ด์ง์ง ์๋๋ค. ์ด๊ฒ์ ๊ณ ์น๊ธฐ. (= thresholding ํจ์๋ฐ๊พธ๊ธฐ) ๋ฐ๊พธ๋ฉด ๊ฐ์ด ์ ๋๋ก ์๋์ฌํ ๋ฐ ์ด๋ค ํ๋ผ๋ฏธํฐ๋ฅผ ์ด๋ป๊ฒ ๋ฐ๊พธ๋ฉด ์๋ ๊ฒ์ด๋ค ์์ผ๊น ์๊ฐํด๋ณด๊ธฐโฆโฆโฆโฆโฆ..
11 Supervised Learning
- binary classification์ ์ด์ฉํ์ฌ multi-classification์ ํ ์ ์๋ค
- 1์ธ๊ฒ์ classifyํ ๋๋ 1์ธ๊ฒ๊ณผ 1์ด ์๋๊ฒ์ผ๋ก classifyํ๋์์ผ๋ก
- 5์ชฝ์์ a์ ์ธ๊ฐ ๋ชจ๋ธ์ ๊ฒฝํฅ์ด ๋น์ท, c๋ ์ธ๊ฐ์ ๊ฒฝํฅ์ด ๋ชจ๋ ๋ค๋ฅด๋ค. ๊ฒฝํฅ์ด ๋ค๋ฅผ์๋ก variance๊ฐ ํฌ๋ค๊ณ ํ๋ค
- variance๋ averagingํ๋ฉด ์ฌ๋ผ์ง. bias๋ averagingํด๋ ์ฌ๋ผ์ง์ง ์์
- averagingํด๋ variance๊ฐ ๋ฎ์์ง์ง ์์ผ๋ฉด underfittingํ๊ณ ์๋ค๊ณ ์๊ฐํ ์ ์๋ค -> ์ฐจ์๋ฅผ ๋์ฌ์ ํด๋ณธ๋ค
- ๋ชจ๋ธ์ด ๋ complexํ๋ฉด bias๊ฐ ์๊ณ ๋ complexํ๋ฉด variance๊ฐ ์์ -> bias-variance๊ฐ tradeoff๊ฐ ์กด์ฌ
- Ensemble method
- ํธ๋ ์ด๋ ๋ฐ์ดํฐ์ ๋ฐ๋ผ ๋์์ ผ ํธ๋ฆฌ์ variance๊ฐ ํฌ๊ฒ ๋ฌ๋ผ์ง๋๊ฒ์ ์์ ๊ธฐ ์ํด ์ฌ๋ฌ๊ฐ์ง ํธ๋ฆฌ๋ฅผ averagingํจ (ํ์ง๋ง bias ๊ฐ์ํจ๊ณผ๋ ๋ฏธ๋ฏธ)
- ํธ๋ฆฌ๋ ํธ๋ ์ด๋ ๋ฐ์ดํฐ์ ๋ฐ๋ผ ํธ๋ฆฌ๊ฐ ๋ง์ด ๋ฌ๋ผ์ง
- ํ์ง๋ง ๋ค๋ฅธ ๋ชจ๋ธ(๋ด๋ด๋คํธ์ํฌ ๋ฑ)์๋ ensemble์ ์ฌ์ฉํ ์ ์์
- Bagging๊ณผ Boosting์ด ์์
- bagging์ literally sum์ ์๋ฏธ๊ฐ ์๋.. ๊ทธ๋ฅ ์ฌ๋ฌ๊ฐ์ง ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์ข ํฉํ์ฌ ์ฌ์ฉํ๋ค๋ ์๋ฏธ
- 12: I{~}์ ์๋ฏธ - ~๊ฐ ์ฐธ์ด๋ฉด 1 ๊ฑฐ์ง์ด๋ฉด 0
- ์ก์ค๋ก ๊ณผ ์ํ๋ ๋ฐ๋น๋ก
- z๋ normalize ํ๊ธฐ ์ํ ์์
- ์ก์ค๋ก ์ด 0.5๋ณด๋ค ์์๋๋ง ์ด ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋๋ก ๋์๊ฐ. ๊ทธ๋์ผ ํ๋ฆฐ๊ฒ ๋ง์ด ๋ฝํ๊ณ ๋ง์๊ฒ ์ ๊ฒ ๋ฝํ
12 Genetic Algorithm
- genotype: ์ ์ ์ ์์ฒด์ collection
- phenotype: genotype์ด ๋ฐํ๋์ด ๋ํ๋๋๊ฒ์ collection
- mutation: ์ ์ ์์ ์ ์ ์๊ฐ ์ฌ์กฐํฉ๋์ด ๋ฐ์ํ๋ ๋ณ์ด
- fitness: ์๋ฌผ์ด ์ผ๋ง๋ ์์กด์ ์ ํฉํ์ง
- ์ ๋คํฑ ์๊ณ ๋ฆฌ์ฆ: ๋๋ค ์๋ฃจ์ ์ ์ ์ ๋ง๋ค๊ณ ํ ์คํธ -> ๋น๊ต์ ์์ข์ ์๋ฃจ์ ์ ์์ ๊ณ ์ข์ ์๋ฃจ์ ์ ์กฐ๊ธ ๋ณํ๋ฅผ ์ฃผ์ด ์๋ก์ด ์ ์ ๋ง๋ค๊ณ ํ ์คํธ. ๋ฒ ์คํธ ์๋ฃจ์ ์ด ์ถฉ๋ถํ ์ข์๋๊น์ง ๋ฐ๋ณตํ๋ค
- 19: program, fitness, crossover, mutation์ ์ ํด์ฃผ์ด์ผํจ
- ์ด๋ป๊ฒ ์ ํ๋๋์ ์์ ๋๊ฐ ํผ
- 8: IF(x,y,z) => x?y:z
- 9: ๊ฐ์ฅ ๋ฐ๋์งํ wall following program
- 10: ๋ถ๋ชจ๊ฐ ๋ ๊ฐ์ฒด๋ฅผ ๊ณ ๋ฅด๋ ๋ฐฉ๋ฒ ๋๊ฐ์ง(๊ฐ์ ๊ฐ์ฒด๊ฐ ์ฌ๋ฌ๋ฒ ๋ฝํ ์๋ ์๋ค)
- tournament
- proportional
- crossover rate: ๋ช๊ฐ๋ฅผ ๊ทธ๋๋ก ๋ณต์ฌํ ๊ฒ์ธ์ง ๋ช๊ฐ๋ฅผ ๋ถ๋ชจ์์ ๋ฌผ๋ ค๋ฐ์ ๊ฒ์ธ์ง ๋น์จ
- crossover: ํ ๋ถ๋ชจ์ ๋๋คํ subtree๋ฅผ ๊ณจ๋ผ ๋ค๋ฅธ ๋ถ๋ชจ์ ๋๋คํ subtree๋ก ๋ฐ๊พธ๋๊ฒ
- ๊ณ ๋ฅด๋(๋ฐ๊พธ๋) subtree๊ฐ ํ๊ฐ๋ฉด 1-point, ์ฌ๋ฌ๊ฐ๋ฉด n-point
- ์ ์ ํ crossover operation์ ๋ถ๋ชจ์ fitness๋ฅผ ์ ์ ํ ๋ฌผ๋ ค๋ฐ๊ฒ ํด์ ์์๋ fitness๊ฐ ์ข๊ฒ ๋์ค๊ฒ ํ๋๊ฒ. ๋ฌผ๋ ค๋ฐ์์ fitness๊ฐ ๋ค ํํธ๋ฌ์ง๋ฉด ์๋ฏธ๊ฐ ์๋ค
- mutation: ๋ถ๋ชจ์ ๋๋คํ subtree๋ฅผ ๊ณจ๋ผ โ์๋ก์ดโ ๋๋ค subtree๋ก ๋ฐ๊พธ๋ ๊ฒ
- 18: ํด๋น ์ธ๋์์ ๊ฐ์ฅ fitํ ๊ฐ์ฒด์ fitness๋ฅผ ๋ํ๋ธ ๊ทธ๋ํ
- ์ฅ์ : ์ด๋ค ๋ฌธ์ ์์๋ ์์ฉ ๊ฐ๋ฅํ๋ค. development cost๊ฐ ๋ฎ๋ค. ๊ฒฐ๊ณผ๊ฐ interpretableํ๋ค(๋ด๋ด๋คํธ์ํฌ์ ๋ฌ๋ฆฌ)
- ๋จ์ : ๋๋ฆฌ๋ค. optimal์ด ๋์จ๋ค๋ ๋ณด์ฅ์ด ์์
//์ค๊ฐ2 genetic algorithm๊น์ง
13 Logic
- knowledge base: database๋ก๋ถํฐ ์ป์ด์ง ์ข ๋ high level์ ์ ๋ณด(์ ๋ณด์ ์์ค์ด ๋ ๋์)
- inference engine์ domain independentํ๊ฒ ์ฌ์ฉํ ์ ์๋ค - ๋ฐ์ดํฐ์ ์ข ๋ฅ/์ป์ด์ผ ํ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ๋ค๋ฅด๊ฒ ๋ง๋ค ํ์๊ฐ ์๋ค.
- ex) watson(์ฒ์์๋ ํด์ฆํธ๋์ ๋ก ๋ง๋ค์์ง๋ง knowledge base๋ฅผ ๋ฐ๊ฟ์ ์์ง๋จํ๋์ ๋ก๋ ์ด์ฉ)
- knowledge base๋ง ๋ฐ๊ฟ ๋ผ์ฐ๋ฉด ๋๋ค
- wumpus world
- ๊ฒ์์ ๊ท์น๊ณผ fact(๋์๋ค๋๋ฉด์ ์ป๋ ์ ๋ณด)์ ์กฐํฉ์ด knowledge base
- ์ถ๋ก (logic)์ด inference engine (์ผ๋ฐ์ ์ธ ๊ณผ์ )
- logic
- syntax: sentence์ validity๋ฅผ ๊ตฌ๋ถํ๋ ๊ฒ
- semantics: sentence์ meaning์ ์ ์ํ๋ ๊ฒ
- x+2>y๋ ์ธ์ด์ง๋ฆฌ ์์ด์๊ฒ๋ ๋จ์ํ symbol 5๊ฐ์ ๋์ด์ผ ๋ฟ์. symbol ๊ฐ๊ฐ์ ์๋ฏธ๋ฅผ ์๋ ค์ฃผ๋๊ฒ
- ์ด๋ค world๊ฐ ์ฃผ์ด์ง ๋ sentence๊ฐ ์ฐธ์ธ์ง ๊ฑฐ์ง์ธ์ง ํ๋จํ๊ธฐ ๋ ์ฌ์. ๋ฐ๋ผ์ ํญ์ world์ค์ฌ์ผ๋ก ๋ฌธ์ฅ์ ํด์ํ๋ค
- entailment
- KBโจฮฑ = โKB entails alphaโ = โalpha follows from KBโ
- KB๊ฐ ์ฐธ์ธ world์์ ์ํ๊ฐ ๋ฐ๋์ ์ฐธ์ด๋ค๋ผ๋ ์๋ฏธ
- ์ด๋ฐ ๊ด๊ณ๋ฅผ ๋ง์กฑํ๋ ์ํ๋ฅผ ์ฐพ๋๊ฒ์ด ๋ชฉ์ ์
- inference
- entailment๋ฅผ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ
- KB โขi ฮฑ = i์ ์ํด ์ํ๊ฐ KB์์ ๊ณ์ฐ๋ ์ ์๋ค
- model
- = ์ฐธ๊ฑฐ์ง์ ํ๋จํ ์ ์๋ formally structured world
- ์ข์์๋ฏธ: m์์ ์ํ๊ฐ ์ฐธ์ผ ๊ฒฝ์ฐ -> m์ ์ํ์ ๋ชจ๋ธ์ด๋ผ๊ณ ํ๋ค
- entailment <-(sound) inference
- entailment ->(complete) inference
- 37: ์ฌ๋ฌ๊ฐ์ง inference rule
- Modus Ponens: A๊ณผ B๊ฐ ์์ ๋ A->B์ด๋ฉด B๋ฅผ ์ถ๋ ฅ์ผ๋ก ๋ด๋ ๋๋ค๋ ์๋ฏธ
- resolution์ ๊ฑฐ์ completeํ rule์ด๋ค(resolution๋ง ๊ฐ์ง๊ณ ๊ณ์ฐํ ์ ์๋ rule์ด ์์ฃผ ๋ง์)
- literal = propositional variable or its negation
- 39: KB์ KB in CNF๋ ๋์น์
- *์์ *: New KB: [ยฌPโจQ , ยฌQโจR , ยฌQโจS , ยฌPโจR , ยฌPโจS]
- 41: 3๋ฒ์์ negation์ ๊ฐ์ฅ ์์ชฝ์ ๊ดํธ๊น์ง ์ง์ด๋ฃ์
- KBโจฮฑ์ด๋ฉด KBโ๋ inconsistentํ๋ค -> KBโ๊ฐ inconsistentํ๋ฉด KBโจฮฑ์ด๋ค
- {P}, {Pโ}๊ฐ ํจ๊ป ์์ผ๋ฉด inconsistency๋ฅผ ์ฆ๋ช ํ ์ ์๋ค. ๋์ resolution์ ์ ์ฉํ๋ฉด ๊ณต์งํฉ์ด๊ธฐ ๋๋ฌธ
14 Prop. Logic II
- 2์ชฝ: ์ธ๊ฐ์ง KB์ ์์ ๋๊ฐ๋ค. ์๋ํ๋ฉด ๊ทธ ์์์ ์ฐพ์ ์ ์๋ ๊ฒ๋ค๋ง ์ถ๊ฐ๋์๊ธฐ ๋๋ฌธ
- 3์ชฝ: modus ponens๋ก ๋ชจ๋ knowledge๋ฅผ ์ป์ด๋ผ ์ ์๊ธฐ ๋๋ฌธ์ incompleteํ ๊ฒ์. completeํ๊ฒ ํ๋ ค๋ฉด
- ๋ค์์ฅ์ ๋์ค๋ ๊ฒ์ฒ๋ผ rule์ resolution์ผ๋ก ๋ฐ๊พธ๋ฉด ๋จ.
- ๋ง์ฝ modus ponens๋ฅผ ์ฌ์ฉํ๋ค๋ฉด horn clause๋ฅผ ์ด์ฉํ์ฌ forward chaining์ ํ๋ฉด ๋จ
- horn clause = definite clauses or goal clause
- a^b^c -> d๊ฐ์ ๋ชจ์
- forward chaining = forward checking
- CSP๋ฌธ์ ๋ก ์๊ฐํ๋ค๋ฉด ๋ณ์ -> propositional logic, ๋ณ์๊ฐ ๊ฐ์ง ์ ์๋ ๊ฐ -> t/f, constraint -> clause
- ๊ธฐ๋ง๊ณ ์ฌ์ CSP์ ์ด๊ฑธ ๊ด๋ จ์์ผ์ ๋ฌธ์ ๊ฐ ๋์ฌ ์ ์๋ค
- backward chaining
- q๊ฐ ์ฐธ์ด๋ ค๋ฉด ๋ฌด์์ด ์ฐธ์ด์ด์ผํ๋๊ฐ? p. p๊ฐ ์ฐธ์ด๋ ค๋ฉด? m๊ณผ l. ์ด๊ฒ์ ๋ฐ๋ณต
- forward backward ๋ชจ๋ linear ์๊ฐ ์์ ๊ฐ๋ฅ
- a->b = !a v b
- disjunction์ ์ฌ์ฉํ๋ฉด ๋ชจ๋ negation์ด ๋ถ๊ณ ํ๋๋ง positive์ธ ํํ๋ก ๋์ด
- resolution์ refutation-completeํ๋ค. ๊ทธ๋ฅ complete ํ์ง๋ ์์
- 38์ชฝ์ฒ๋ผ ํ์๋ ์๊ณ 39์ชฝ์ฒ๋ผ ๊ตฌ๊ตฌ์ ์ ํ ์๋ ์๋ค..39์ชฝ์ bfsํ๊ณ ์๋๊ฑฐ์. 4๋ฒ๊น์ง ์ด์ฉํด์ 11๋ฒ๊น์ง ๊ตฌํ๊ณ , ๋ 11๋ฒ๊น์ง ์ด์ฉํด์ ๊ทธ ๋ค์์ ๊ตฌํ๊ณ . ๊ฒฐ๊ณผ์ ์ผ๋ก search๋ฅผ ์ด๋ป๊ฒ ํ๋๋์ ๋ฌธ์ ์
- elimination strategies
- contradiction์ ํ๋ ๋ฐ ๋์์ด ์๋๋ ๊ฒ์ ์ง์
- ๋๊ฐ์ ๋ฌธ์ฅ๋ค
- ํ๋์ literal๋ก๋ง ์ด๋ฃจ์ด์ง ๊ฒ๋ค(p๋ง ์๊ณ not p๊ฐ ์๋ ๊ฒฝ์ฐ ๋๋ ๊ทธ ๋ฐ๋)
- ๋ ์ฐธ์ด ๋๋ ๋ฌธ์ฅ(positive์ negative๊ฐ disjunction๋๋ ๊ฒฝ์ฐ)
- โ{p,q} ์ด๋ฉด {p,q,r}โ์์ {p,q,r}์ด ์์ด๋ ๋จ
- restriction strategies
- ๋ฌธ์ฅ์ pair๋ฅผ ๊ณ ๋ฅผ ๋
- Unit Restriction: ๋ ์ค ํ๋๋ literal์ด ํ๋์ฌ์ผ ํจ
- unit resolution์ ์ผ๋ฐ์ ์ผ๋ก complete ํ์ง ์๋ค. ํ์ง๋ง ๋น ๋ฅด๊ธฐ ๋๋ฌธ์ ์ฌ์ฉ.
- Input Restriction: ๋ ์ค ํ๋๋ ์๋์ KB์ ์์ด์ผ ํจ
- Linear Restriction: ์๋์ KB์ ์๊ฑฐ๋ ๋ค๋ฅธ ๋ฌธ์ฅ์ ancestor
- Set of Support Restriction: ์์์๊ณต๋ถํ์ฌ๋ผ
- tell operation, ask operation
- ์ด๋ค ์ํ์ ๋ํด ํ์ธ ํ ๋ satisfiability๋ฅผ ์ํ์ ๋ํด ํ๋ฒ, not ์ํ์ ๋ํด ํ๋ฒ ์ด ๋๋ฒ ํ์ธํ๋ฉด ๋๋ค
- ๋ฌธ์ ์์ฒด๊ฐ complexํ๊ธฐ ๋๋ฌธ์ ๋ฌด์จ ์๊ณ ๋ฆฌ์ฆ์ ์จ๋ linearํ๊ฒ ํ ์ ์์
- satisfiability๋ฅผ ํ์ธํ๋ ๊ฒ์ ๊ฒฐ๊ตญ ํด๋น ์กฐ๊ฑด์ ๋ง์กฑํ๋ ๋ชจ๋ธ์ด ์๋๋์ ๋ฌธ์ ์ด๊ธฐ ๋๋ฌธ์ model checking์ด๋ผ๊ณ ๋ ํ๋ค
DPLL
- 54์ชฝ: ์ด๋ค clause๊ฐ ์๊ธฐ๋ฉด ๊ทธ clause์ ๊ด๋ จ๋ ๋ชจ๋ clause๋ฅผ ํ์ธํด๋ณธ๋ค
- empty clause๊ฐ ๋์ค๋ฉด backtrackํด์ผํจ
- KB์ ๋ชจ๋ clause๊ฐ assignment๋ฅผ ํตํด ์์ด์ง๋ฉด ๋จ์ ๋ณ์๋ ์๋ฌด๋ ๊ฒ๋ assignํด๋๋จ
- KB์ ํ๋์ literal๋ง ๋จ์ผ๋ฉด 1๋ก assignํ๋ค
- 57์ชฝ *์์ *: DPLL(F U { (c) }, assigned) || DPLL(F U { (ยฌ c) }, assigned);
- ์ฃผ์: pure literal/unit clause๋ฅผ ์ ๊ฑฐํ๋ ๋ถ๋ถ์ ์ถ๊ฐํด๋ ๋๋ค๋ ๋ป
- 61: horn clause์์ forward/backward chaining ์ linear. any clause๋ NP-completeํ๊ธฐ ๋๋ฌธ์ exponential
- ๐(๐ฅ, y) โ ยฌ๐ถlear(y) ์ด๋ฐ๊ฑด propositional logic์ด ์๋
'CS > Lecture' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ปดํจํฐ๋น์ (0) | 2017.09.13 |
---|---|
์ง๋ฅํ์๋ฌผ์ ๋ณดํ (0) | 2017.09.13 |
์ด์์ฒด์ (0) | 2017.09.13 |
์ปดํจํฐ๊ทธ๋ํฝ์ค (0) | 2017.09.12 |
๋ฐ์ดํฐ์ฌ์ด์ธ์ค (0) | 2017.09.12 |