본문 바로가기

pyTorch

Pytorch based DQN DQN 및 강화학습을 Tensorflow로만 작성하다 Pytorch이가 점차 올라오는 추세가 되어 Pytorch 공부를 겸하여 코드 작성을 하였다. Cartpole environment에서 return해주는 float 값들을 활용하는 DQN 코드를 먼저 작성하였다. 해당 코드를 작성후 Tensorflow와 시간차이를 확인해보니 동일한 알고리즘으로 작성한 것 같은데, 연산 속도에서 훨씬 빠른 속도를 체감하였다. Cartpole environment에서 return해주는 float 값이 아닌 Cartpole environment를 사람처럼 보면서 입력받으며 CNN을 활용하기 위해 CNN-DQN을 작성하였다. 이전 버전들에서는 env.render만으로도 작동되던 방식이 env.render('human')으로 .. 더보기
기업들이 Tensorflow보다 Pytorch로 선호하는 이유 간단하게 Tensorflow와 Pytorch의 정의를 보자. TensorFlow는 다양한 작업에서 데이터 흐름 및 차별화 가능한 프로그래밍을 위한 오픈 소스 소프트웨어 라이브러리다. 기호 수학 라이브러리이며 신경망과 같은 기계 학습 응용 프로그램에도 사용되며, Google Brain 팀에서 개발했으며 많은 Google 제품 및 서비스에 사용되고 있다. PyTorch는 Torch 라이브러리를 기반으로 하는 오픈 소스 기계 학습 라이브러리이며, Facebook의 AI 연구소에서 개발했으며 많은 제품에 사용되는 중이다. PyTorch는 유연성과 사용 편의성에 중점을 두고 연구 및 실험을 위한 플랫폼을 제공한다. 그렇다면 둘의 결정적인 차이는 무엇일까? TensorFlow와 달리 PyTorch는 "실행별 정의".. 더보기