본문 바로가기

Article

Whisk: Visualize and remix ideas using images and AI

https://blog.google/technology/google-labs/whisk/

 

Whisk: Visualize and remix ideas using images and AI

Whisk is a new Google Labs experiment that lets you prompt using images for a fast and fun creative process.

blog.google

일반 요약

Whisk는 새로운 생성형 AI 도구로, 텍스트가 아닌 이미지를 입력해 이미지를 생성할 수 있습니다. 사용자는 주제, 장면, 스타일에 해당하는 이미지를 드래그해 넣고, 이를 혼합하여 독창적인 결과물을 만들 수 있습니다. Whisk는 Gemini를 사용해 입력된 이미지의 세부적인 설명을 자동으로 작성한 뒤, 이를 Imagen 3에 전달해 최종 이미지를 생성합니다. 이 과정은 주제의 본질을 포착하지만, 정확한 복제본을 만들지는 않으므로 주제, 장면, 스타일을 새롭고 독창적인 방식으로 손쉽게 리믹스할 수 있습니다.

 

오늘부터 미국에서 Whisk라는 생성형 AI의 새로운 실험을 시작합니다. 긴 텍스트 프롬프트 대신 이미지를 활용하여 이미지를 생성할 수 있는 도구입니다. 이미지를 드래그해 넣는 것만으로 창작을 시작할 수 있습니다.

 

Whisk는 주제를 나타내는 이미지, 장면을 나타내는 이미지, 스타일을 나타내는 이미지를 각각 입력받아 이를 조합하여 디지털 인형, 에나멜 핀, 스티커 등 자신만의 독특한 결과물을 만들 수 있습니다.

 

Gemini 모델은 이미지의 세부적인 캡션을 자동으로 작성합니다. 그런 다음 이 설명을 Google의 최신 이미지 생성 모델인 Imagen 3에 전달합니다. 이 과정은 주제의 본질을 포착하지만, 정확한 복제본을 만드는 것은 아닙니다. 이를 통해 주제, 장면, 스타일을 새로운 방식으로 손쉽게 리믹스할 수 있습니다.

 

https://www.youtube.com/watch?v=fyFDztZxlEc

 

Whisk는 이미지에서 몇 가지 주요 특징만 추출하기 때문에, 생성된 이미지가 기대와 다를 수 있습니다. 예를 들어, 생성된 주제가 다른 키, 체중, 헤어스타일 또는 피부 톤을 가질 수 있습니다. 이러한 특징이 프로젝트에서 중요한 요소일 수 있다는 점을 이해하며, Whisk가 이를 놓칠 가능성을 고려해 사용자가 언제든지 기본 프롬프트를 확인하고 수정할 수 있도록 했습니다.

 

초기 테스트에서 예술가와 크리에이터들은 Whisk를 전통적인 이미지 편집기가 아닌 새로운 유형의 창작 도구로 묘사했습니다. Whisk는 픽셀 단위의 완벽한 편집이 아니라, 빠른 비주얼 탐색을 위해 설계되었습니다. 새로운 창의적인 방식으로 아이디어를 탐구하며 수십 가지 옵션을 검토하고, 마음에 드는 결과물을 다운로드할 수 있도록 돕는 데 중점을 둡니다.

미국에 거주 중이라면 오늘 바로 labs.google/whisk에서 Whisk를 체험하고 의견을 공유해 주세요.

 

Google Labs는 Gemini, Imagen, Veo와 같은 최신 생성형 AI 모델로 실험을 진행하는 공간입니다. 우리의 목표는 새로운 제품과 기능에 대한 피드백을 수집하여 기술을 함께 발전시키는 것입니다. Whisk 및 다른 실험에 대한 최신 정보를 얻으려면 뉴스레터를 구독하거나 Google Labs를 X, Reddit, Discord에서 팔로우하세요.

 

https://labs.google/fx/ko/tools/whisk/unsupported-country

 

Whisk

 

labs.google