본문 바로가기

프로젝트

RL Drone Challenge behaviors: My Behavior: trainer_type: ppo hyperparameters: batch_size: 128 buffer_size: 2048 learning_rate: 0.0005 beta: 0.01 epsilon: 0.2 lambd: 0.95 num_epoch: 5 learning_rate_schedule: linear network_settings: normalize: true hidden_units: 128 num_layers: 2 vis_encode_type: nature_cnn Batch size: The batch size has been decreased to 128 to improve stability during training. Learning rate: The.. 더보기
Lux AI Season 2 https://www.kaggle.com/competitions/lux-ai-season-2/overview Lux AI Season 2 | Kaggle www.kaggle.com 노력중 더보기
음성 변조를 잡아내는 앱 계획서 최근에 텍스트를 읽어주던 인공지능에서 음성이 변조가 가능한 인공지능으로 음성 인공지능이 발달하고 있다. https://www.youtube.com/watch?v=JMCxsc-kJ24 위의 유튜브 동영상처럼 30분과 12시간의 학습이면 자신의 목소리로 노래하고 랩을 할 수 있는 세상이 온 것이다. 이는 보이스 피싱에 이용될 가능성이 충분히 보이며, 어쩌면 근시일내에 해당 음성변조를 통해 일어날 수 있다. Chat-Gpt를 잡아내는 Gpt-zero와 같이 전화통화시 상대의 음성변조를 잡아내는 방법을 고안해보자. Diffsinger는 Diffusion 모델을 사용한 모델인 만큼 그림에 기반해 두고 있다. 즉, 소리의 파형 학습시켰다는 이야기와 동일하다. 해당 파형을 학습시킨 후, 2개의 데이터를 Concate.. 더보기
Pytorch based DQN DQN 및 강화학습을 Tensorflow로만 작성하다 Pytorch이가 점차 올라오는 추세가 되어 Pytorch 공부를 겸하여 코드 작성을 하였다. Cartpole environment에서 return해주는 float 값들을 활용하는 DQN 코드를 먼저 작성하였다. 해당 코드를 작성후 Tensorflow와 시간차이를 확인해보니 동일한 알고리즘으로 작성한 것 같은데, 연산 속도에서 훨씬 빠른 속도를 체감하였다. Cartpole environment에서 return해주는 float 값이 아닌 Cartpole environment를 사람처럼 보면서 입력받으며 CNN을 활용하기 위해 CNN-DQN을 작성하였다. 이전 버전들에서는 env.render만으로도 작동되던 방식이 env.render('human')으로 .. 더보기
일간이긴 하지만 오픈 어시스턴트 1위 달성 더보기
일간이긴 하지만 오픈 어시스턴트 19위 달성 한국어도 좀 해주세요... 11위까지... 더보기
일간이긴 하지만 오픈 어시스턴트 98위 달성 더보기
오픈 어시스턴스(Open Assistant) 현재 대한민국 언어에 대한 label, prompt 생성에 참여중. 닉네임: JunHan Zang 더보기