[코드로 이해하는 딥러닝 14]

[코드로 이해하는 딥러닝 0] - 글연재에 앞서 https://limitsinx.tistory.com/27

[코드로 이해하는 딥러닝 1] - Tensorflow 시작 https://limitsinx.tistory.com/28

[코드로 이해하는 딥러닝 2] - Tensorflow 변수선언 https://limitsinx.tistory.com/29

[코드로 이해하는 딥러닝 3] - Tensorflow placeholder변수 https://limitsinx.tistory.com/30

[코드로 이해하는 딥러닝 4] - 선형회귀(Linear Regression) https://limitsinx.tistory.com/31

[코드로 이해하는 딥러닝 5] - 다중선형회귀(Multiple Linear Regression) https://limitsinx.tistory.com/32

[코드로 이해하는 딥러닝 6] - 회귀(Regression)에 대한 다른 접근 https://limitsinx.tistory.com/33

[코드로 이해하는 딥러닝 7] - .txt(.csv)파일 불러오기 https://limitsinx.tistory.com/34

[코드로 이해하는 딥러닝 8] - Logistic Regression(sigmoid) https://limitsinx.tistory.com/35

[코드로 이해하는 딥러닝 9] - Softmax Regression(multiple classification) https://limitsinx.tistory.com/36

[코드로 이해하는 딥러닝 10] - MNIST 데이터 분류/One hot encoding https://limitsinx.tistory.com/37

[코드로 이해하는 딥러닝 11] - Deep Neural Network/XOR https://limitsinx.tistory.com/38

[코드로 이해하는 딥러닝 11-EX] - MNIST를 DNN으로 학습해보기/Adam optimizer https://limitsinx.tistory.com/39

[코드로 이해하는 딥러닝 12] - RELU(Rectified Linear Unit) https://limitsinx.tistory.com/40

[코드로 이해하는 딥러닝 13] - .txt(.csv)파일로 저장하기 https://limitsinx.tistory.com/44

※이 전글에서 정리한 코드/문법은 재설명하지 않으므로, 참고부탁드립니다

※해당 글은 PC에서 보기에 최적화 되어있습니다.

Drop out, 출처 : https://jjeongil.tistory.com/578

Drop out은 Alexnet이라는 딥러닝모델에서 처음 제안된 기술입니다.

기존까지 사용하고 있던 Neural Network방식은 FCNN(Fully Connected Neural Network)로써, 모든 노드들이 전부 연결되어있죠 (왼쪽이미지)

그런데 Drop out이 적용된 방식은 오른쪽이미지처럼, 중간중간의 노드들을 죽여버리고 랜덤하게 연결하여 학습을 진행하는 것입니다.

상식적으로는

"모든 노드들이 서로 연결된게, 연산량은 많겠지만 모든 경우의 수를 학습하니 더 성능이 좋은거 아니야??"

라고 생각하실 수 있습니다. 저도 그렇게 생각했었구요..

항상 제가 하는말이 있죠?

딥러닝은 "왜?" 라는 질문 보다는, "그래서 성능이 더좋은 방법은 뭔데??"를 찾는 Heuristic한 학문이라구요!

Drop out한게 결과적으로 성능이 훨씬 좋게 나왔습니다.. 그로 인해 Alexnet은 과거기준 압도적인 성능을 보여주었구요!

이 기술은 앞으로 다룰 CNN(Convolutional Neural Network)에서 특히 엄청난 성능 효과를 가져오는데요,

워낙 연산량이 많은 CNN이다보니.. 연산량 감소도 잡고, 성능 증가도 잡는 정말 두마리 토끼를 모두잡는 기술입니다.

출처 : https://m.blog.naver.com/laonple/220827359158

한가지 주의하셔야 할점은

"학습할때는 Drop out을 해주지만, 검증할때는 Drop out이 없는 FCNN 상태로 진행해야 합니다."

중간중간 끊어진 다리로 학습을하고, 끊어두었던 다리를 다시 보수공사하여 검증을 진행하면 성능이 향상되는 원리이기 때문이죠!

즉, 조금은 다른의미지만 간단하게 예시를 들어보겠습니다.

내가 친구A를 확인할때 A의 눈,코,입 3개의 특징으로 판단한다고 가정해보죠

눈이 아주 매력적인 친구라 특히 눈에띄어, 0.7만큼의 특징을 가지고, 코는 0.1, 입은 0.2라고 생각해보면

Drop out을 통해 "눈"만을 가지고 친구의 얼굴사진을 학습시킵니다.

그러면 "눈"만으로 대부분 친구의 사진을 정확히 찾을수 있겠죠

검증할때는 이 "눈"에서 "코"와 "입"까지 추가해서, 눈만으로도 충분히 잘 찾을수있지만 코와 입까지 같이 보고 찾는거죠

결과적으론 이런 원리에 의해 성능이 향상됩니다.

이제는 코드로 한번 넘어가보겠습니다.

[코드 전문]

import tensorflow.compat.v1 as tf

tf.disable_v2_behavior()

import random

# import matplotlib.pyplot as plt

from tensorflow.examples.tutorials.mnist import input_data

tf.set_random_seed(777) # reproducibility

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

# parameters

learning_rate = 0.001

training_epochs = 15

batch_size = 100

total_batch = int(mnist.train.num_examples / batch_size)

# input place holders

X = tf.placeholder(tf.float32, [None, 784])

Y = tf.placeholder(tf.float32, [None, 10])

# dropout (keep_prob) rate 0.7 on training, but should be 1 for testing

keep_prob = tf.placeholder(tf.float32)

W1 = tf.get_variable("W1", shape=[784, 512],