본문 바로가기

전체 글

Thinking with images https://openai.com/index/thinking-with-images/ OpenAI o3와 o4‑mini는 이미지 기반 사고 과정을 활용해 시각적 지각 영역에서 획기적인 진전을 이뤄 냈습니다. OpenAI o3와 o4‑mini는 o‑시리즈의 최신 시각 추론 모델로, 모델이 단순히 이미지를 “보는 것”을 넘어 내부 chain‑of‑thought (사고 연쇄) 속에서 이미지를 함께 “생각”할 수 있게 된 것은 이번이 처음입니다. 초기 모델인 OpenAI o1과 마찬가지로 o3와 o4‑mini는 답변 전 긴 사고 과정을 거치도록 학습되었습니다. 여기에 더해, 사용자 업로드 이미지를 도구로 변환해 자르기·확대·회전 등 간단한 이미지 처리를 스스로 수행하며, 그 결과를 사고 과정에 바로 활용합니다. .. 더보기
Introducing OpenAI o3 and o4-mini https://openai.com/index/introducing-o3-and-o4-mini/ 지금까지 출시된 모델 가운데 가장 스마트하고 강력한 기능 ― 완전한 도구 접근 오늘 저희는 o‑시리즈의 최신작인 OpenAI o3와 o4‑mini를 공개합니다. 이 모델들은 응답 전에 더 깊이 사고하도록 학습된, 지금까지 선보인 모델 중 최고 성능을 자랑합니다. 호기심 많은 사용자부터 고급 연구자까지 모두에게 ChatGPT의 능력을 한 단계 도약시키는 획기적인 진전입니다.이번에 처음으로, 우리의 추론 모델이 ChatGPT 안의 모든 도구를 능동적으로 조합해 사용할 수 있습니다—웹 검색, Python으로 업로드한 파일·데이터 분석, 시각 입력에 대한 심층 추론, 이미지 생성까지 포함됩니다. 특히 모델 스스로 언제.. 더보기
MONAI Integrates Advanced Agentic Architectures to Establish Multimodal Medical AI Ecosystem https://developer.nvidia.com/blog/monai-integrates-advanced-agentic-architectures-to-establish-multimodal-medical-ai-ecosystem/?ncid=em-even-120973-vt12&mkt_tok=MTU2LU9GTi03NDIAAAGZ0afUn3t6hA6jFxLXibpOT6MQzu96oCnWq1cVxzHRCKU6dKwiA0MPIjvdcBLiSpIRMQksqarBkI3FfUPQZJsPipT40JPNUB8mGsIKu6oLECBok4W3lJ-E MONAI Integrates Advanced Agentic Architectures to Establish Multimodal Medical AI Ecosystem | NVIDI.. 더보기
물리 AI로 헬스케어 혁신 주도하는 NVIDIA와 GE HealthCare https://blogs.nvidia.co.kr/blog/nvidia-and-ge-healthcare-collaborate-to-advance-the-development-of-autonomous-diagnostic-imaging-with-physical-ai/?ncid=em-even-790066-vt12&mkt_tok=MTU2LU9GTi03NDIAAAGZ0afUnwUVLa-huUGamGQI1URwt9btmQjKY67xnWEOsv0Vu-EuBth2-kxF0EmIcrPGwxp6ouwaeANIPJN9jVDoOOAEVHHekgXN2VkckRzBcmTGvDeKEyAD 물리 AI로 헬스케어 혁신 주도하는 NVIDIA와 GE HealthCare - NVIDIA Blog KoreaNVIDIA는 GE 헬스케어(GE H.. 더보기
EfficientViT: Memory Efficient Vision Transformer with Cascaded Group Attention https://arxiv.org/abs/2305.07027 EfficientViT: Memory Efficient Vision Transformer with Cascaded Group AttentionVision transformers have shown great success due to their high model capabilities. However, their remarkable performance is accompanied by heavy computation costs, which makes them unsuitable for real-time applications. In this paper, we propose a family oarxiv.org 초록비전 트랜스포머(Vision Tr.. 더보기
EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense Prediction https://arxiv.org/abs/2205.14756 EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense PredictionHigh-resolution dense prediction enables many appealing real-world applications, such as computational photography, autonomous driving, etc. However, the vast computational cost makes deploying state-of-the-art high-resolution dense prediction models on haarxiv.org 초록고해상도 밀집 예측(high-re.. 더보기
On the Biology of a Large Language Model https://transformer-circuits.pub/2025/attribution-graphs/biology.html On the Biology of a Large Language ModelWe investigate the internal mechanisms used by Claude 3.5 Haiku — Anthropic's lightweight production model — in a variety of contexts, using our circuit tracing methodology.transformer-circuits.pub 대형 언어 모델의 생물학에 대하여 우리는 Anthropic의 경량 프로덕션 모델인 Claude 3.5 Haiku의 내부 메커니즘을 다양한 맥락에서 회로 추적(ci.. 더보기
Introducing the Max plan — get more Claude usage than ever before 더보기