본문 바로가기

전체 글

저장용 보호되어 있는 글입니다. 더보기
Geometry-Inspired Top-k Adversarial Perturbations https://www.youtube.com/watch?v=0NcEnmL88wk Universial noising 방식 더보기
재미있는 질문들 비전 트랜스포머에 일반적으로 사용되는 임베딩 벡터의 길이는 얼마나 되나요? 비전 트랜스포머는 일련의 자체 주의 레이어를 사용하여 이미지를 처리합니다. 처리하기 전에 이미지를 고정된 크기의 겹치지 않는 패치(예: 16x16픽셀)로 분할한 다음 연속 벡터 표현에 선형적으로 임베드합니다. 이렇게 임베드된 벡터는 트랜스포머 레이어를 통해 처리됩니다. 임베딩 벡터의 길이는 일반적으로 비전 트랜스포머의 설계와 입력 이미지 패치의 크기에 따라 결정됩니다. Google의 ViT(비전 트랜스포머)와 같은 일반적인 비전 트랜스포머는 768 또는 1024 차원의 임베딩 벡터 크기를 사용합니다. DeiT(데이터 효율적 이미지 트랜스포머)와 같은 비전 트랜스포머의 다른 변형도 비슷한 임베딩 크기를 사용합니다. 그러나 임베딩 벡.. 더보기
GTC 나중에 체크할꺼 보호되어 있는 글입니다. 더보기
Lux AI Season 2 최고기록이당... 열심히 해보자... 더보기
유니티 ML-Agents를 이용한 drl-crawler 개선 보호되어 있는 글입니다. 더보기
유니티 ML-Agents를 이용한 AutoParkSimulation 보호되어 있는 글입니다. 더보기
영상 만드는 인공지능 https://huggingface.co/damo-vilab/modelscope-damo-text-to-video-synthesis damo-vilab/modelscope-damo-text-to-video-synthesis · Hugging Face YAML Metadata Warning: The pipeline tag "text-to-video" is not in the official list: text-classification, token-classification, table-question-answering, question-answering, zero-shot-classification, translation, summarization, conversational, feature-extr h.. 더보기