본문 바로가기
DeepLearning Framework & Coding/Microsoft AzureML

[Microsoft AzureML - 9] 학습 데이터 CSV로 Export하기

by 노마드공학자 2021. 6. 25.

※ 이전글

[Microsoft AzureML - 0] Intro https://limitsinx.tistory.com/113

[Microsoft AzureML - 1] 개발 환경 세팅 https://limitsinx.tistory.com/114

[Microsoft AzureML - 2] 학습할 데이터 불러오기 https://limitsinx.tistory.com/115

[Microsoft AzureML - 3] 데이터 전처리(Data pre-processing) - I https://limitsinx.tistory.com/116

[Microsoft AzureML - 4] 데이터 전처리(Data pre-processing) - II https://limitsinx.tistory.com/117

[Microsoft AzureML - 5] 학습모델 구현 및 검증 https://limitsinx.tistory.com/118

[Microsoft AzureML - 6] 여러 학습모델 동시에 성능비교 https://limitsinx.tistory.com/119

[Microsoft AzureML - 7] Binary Classification with Kaggle https://limitsinx.tistory.com/120

[Microsoft AzureML - 8] 모델 선정과 Hyper Parameter 자동튜닝 https://limitsinx.tistory.com/121

 

 


 

CSV?

 

CSV파일은 Excel데이터로, 쉼표단위로 데이터가 구분된것을 의미합니다.

Kaggle에서 유명한 데이터중 하나인, 집값예측 Datset인데요

 

파일 확장자명을 보면 "Microsoft Excel 쉼표로 구분된 값 파일" 이라고 되어있습니다.

 

 

그럼 CSV파일이 왜중요하냐?!

 

AzureML이나 App Inventor같은 블록코드로 쉽게 프로그래밍할 수 있는 Tool들이 많은데도 다들 코딩을 하는이유가 뭘까요??

 

수박겉핥기?식으로 할때는 별문제가 없지만.. 깊게들어가다보면, 블록코드로는 제대로 연결도 안될뿐더러

설령 블록코드에 존재하는 방식이라해도 차라리 코딩하는게 나을정도로 복잡해집니다..

 

예를들면, AzureML 블록코드로 Input data를 Normalizing하면, Output data의 Normalizing전 데이터에 대한 MAE를 알아낼수 없습니다.

 

따라서, Azure와 Python을 유기적으로 섞어, 학습모델 뼈대는 Azure로 짜주되 Python으로 데이터전처리와 마무리를 해주는 방법도 있습니다.

 

그렇게하기위해선 파이썬의 pandas 라이브러리로 바로 읽어오기 쉬운 Excel데이터로 Export/Import해주면 좋죠!

 

 

사용법은 간단합니다.

 

[Data Format Conversions] -> [Conver to CSV] 블록을 드래그하여, 원하는 데이터를 선연결해놓고 [RUN]해주시면 되는데요

 

 

CSV블록에 초록색체크표시가 생기면, 하단부 노드에 우측마우스를 클릭하고 다운로드 해주시면 됩니다 :)

Block code의 property로는 100개이상의 데이터는 표시를 안해주거든요..

 

100개이상의 결과값 데이터를 보시려면 이렇게 CSV 블록을 이용해주시면 됩니다!

 

 

댓글