본문 바로가기
DeepLearning Framework & Coding/Tensorflow 1.X

[코드로 이해하는 딥러닝 13] - .txt(csv)파일로 저장하기

by 노마드공학자 2020. 12. 30.

[코드로 이해하는 딥러닝 0] - 글연재에 앞서 https://limitsinx.tistory.com/27

[코드로 이해하는 딥러닝 1] - Tensorflow 시작 https://limitsinx.tistory.com/28 

[코드로 이해하는 딥러닝 2] - Tensorflow 변수선언 https://limitsinx.tistory.com/29

[코드로 이해하는 딥러닝 3] - Tensorflow placeholder변수 https://limitsinx.tistory.com/30

[코드로 이해하는 딥러닝 4] - 선형회귀(Linear Regression) https://limitsinx.tistory.com/31

[코드로 이해하는 딥러닝 5] - 다중선형회귀(Multiple Linear Regression) https://limitsinx.tistory.com/32

[코드로 이해하는 딥러닝 6] - 회귀(Regression)에 대한 다른 접근 https://limitsinx.tistory.com/33

[코드로 이해하는 딥러닝 7] - .txt(.csv)파일 불러오기 https://limitsinx.tistory.com/34

[코드로 이해하는 딥러닝 8] - Logistic Regression(sigmoid) https://limitsinx.tistory.com/35

[코드로 이해하는 딥러닝 9] - Softmax Regression(multiple classification) https://limitsinx.tistory.com/36

[코드로 이해하는 딥러닝 10] - MNIST 데이터 분류/One hot encoding https://limitsinx.tistory.com/37

[코드로 이해하는 딥러닝 11] - Deep Neural Network/XOR https://limitsinx.tistory.com/38

[코드로 이해하는 딥러닝 11-EX] - MNIST를 DNN으로 학습해보기/Adam optimizer https://limitsinx.tistory.com/39

[코드로 이해하는 딥러닝 12] - RELU(Rectified Linear Unit) https://limitsinx.tistory.com/40

 

※이 전글에서 정리한 코드/문법은 재설명하지 않으므로, 참고부탁드립니다

※해당 글은 PC에서 보기에 최적화 되어있습니다.

 

[코드로 이해하는 딥러닝7]에서는 학습하기 위한 데이터를 코드로 읽어오는 것에 대해 다루었었습니다.

 

기본적으로, 파이썬에서 엑셀 및 txt데이터를 다루기 위한 Library는 'pandas'입니다.

(pandas는 기본적으로, 데이터처리를 위한 많은 함수들을 제공)

 

보통 pip install pandas(파이썬3 이상의 경우, pip3 install pandas)로 설치를 하고, 

 

import pandas as pd 이런식으로 선언을 하여 해당 라이브러리를 사용하는데요

 

pandas logo

이 pandas라는 녀석이.. 파이썬 버전3 이상에서는 호환이 잘안되서.. 돌아가지 않는 경우가 있습니다.

 

최근에 머신러닝을 입문하신분들은 대부분, 파이썬 3.6이상 버전에 텐서플로우 2.1버전일텐데요

 

따라서 이런문제를 해결하고자 다른 라이브러리로 간단하게 처리할 수 있는법을 정리해보았습니다.

 

numpy Library는 모두 알고있으실겁니다.

 

이제까지 제가 정리한 코드들에서 처음부터 꾸준히 사용중이였거든요

 

import numpy as np 라는 선언으로!

 

[코드로 이해하는 딥러닝7] 에서도 numpy로 txt값을 읽어오는데요, 아래와 같은 코드로 사용했었습니다.

 

import numpy as np

...

xy_train = np.load('~~~~~.txt', delimiter=',', dtype=np.float32) 

...

 

코드를 저장하는것도 매우 간단합니다.

 

save = np.savetxt('~~~~~~.txt', AAAA, delimiter=',', dtype=np.float32)

 

해당코드 한줄만 입력해주면 되는데요

 

코드가 돌아가는 도중, AAAA라는 변수에 값이 담겨있다면 이 변수들을 ~~~~~.txt라는 이름으로 저장하는 것입니다.

 

현재 코드가 돌고있는(파이썬 코드 파일이 있는) 위치에 Default로 저장됩니다.

 

 

Tensorflow를 실제 현업에서 사용하다보면, 만개단위의 데이터를 다루다보니

 

Hypothesis가 엄청나게 많은 관계로, 모두 일일이 하나하나 복사붙여넣기를 할수가없어서

 

해당 방식으로 한번에 txt파일로 저장을하고 엑셀로 데이터 후처리 및 검증결과 분석을 하는편입니다.

 

Matlab처럼 workspace가 존재해서 변수들의 값들을 array형태로 모두 저장해놓지도 않죠.. 불편하게 스리..

 

VScode에는 Python extension package라고 해서 파이썬확장팩을 받으면, matlab workspace같이 변수들을 하나하나 확인할 수 있긴한데요! 이것은 파이썬 3.6과 1.7 두개버전만 지원을 하기때문에 해당하시는 분들만 깔고 진행해주시면

됩니다!

 

쥬피터(Jupyter)를 활용하시는분들은, workspace가 default로 존재하기에 바로 보실수 있습니다.

 

matlab workspace

둘다 사용이 힘드신 분들은,

 

numpy를 활용하면 코드 딱 한줄로 위처럼 원하는 변수를 모두 저장할수가있습니다!

 

 

 

 

댓글