구글은 아직 또 다른 AI 도구 에 추가하다 더미. 총채 기존 이미지를 프롬프트로 사용할 수 있는 Google Labs 이미지 생성기입니다. 그러나 출력은 새로운 세부 사항으로 시작 이미지를 다시 생성하는 것이 아니라 시작 이미지의 “본질”만 캡처합니다. 따라서 소스 이미지를 편집하는 것보다 브레인스토밍과 신속한 시각화에 더 좋습니다.
회사는 Whisk를 “새로운 유형의 창의적인 도구”라고 설명합니다. 입력 화면은 스타일과 주제에 대한 입력이 포함된 기본 인터페이스로 시작됩니다. 이 간단한 입문용 인터페이스에서는 미리 정의된 세 가지 스타일(스티커, 에나멜 핀, 봉제인형) 중에서만 선택할 수 있습니다. 나는 Google이 실험 도구가 현재 형태로 가장 이상적인 대략적인 개요 출력에 허용되는 세 가지를 발견했다고 생각합니다.
위 이미지에서 볼 수 있듯이 윌포드 브림리 인형의 견고한 이미지를 연출하였습니다. (구글에서는 유명인의 사진을 찍는 것을 금지하고 있지만 윌포드는 경비원에게 알리지도 않고 퀘이커 오트밀을 끌고 문을 빠져나갔습니다.)
Whisk에는 고급 편집기도 포함되어 있습니다(메인 화면에서 “처음부터 시작”을 클릭하면 찾을 수 있습니다). 이 모드에서는 피사체, 장면, 스타일의 세 가지 범주에 있는 텍스트나 소스 이미지를 사용할 수 있습니다. 마무리 작업을 위해 더 많은 텍스트를 추가할 수 있는 입력 표시줄도 있습니다. 그러나 현재 형태에서는 고급 컨트롤이 내 쿼리와 유사한 결과를 생성하지 못했습니다.
예를 들어, 온라인에서 찾은 바다코끼리 봉제 인형 이미지 스타일로 라이트박스 장면에서 고 브림리 씨를 생성하려는 시도를 확인해 보세요.
라이트박스 프레임 안에서 오트밀을 먹고 있는 윌포드 브림리 같은 배우처럼 보이는 것을 뱉어내세요. 내가 아는 한, 그 친구는 인형이 아니다. 따라서 Google이 ‘빠른 시각적 탐색’을 위해 이 도구를 더 많이 사용하고 제작 준비가 완료된 콘텐츠에는 덜 사용하도록 권장하는 이유는 분명합니다.
Google은 Whisk가 소스 이미지의 ‘몇 가지 주요 특성’만을 활용한다는 점을 인정합니다. 예를 들어 생성된 피사체의 키, 몸무게, 헤어스타일, 피부색이 다를 수 있다고 회사는 경고합니다.
이유를 이해하려면 Whisk가 내부적으로 어떻게 작동하는지에 대한 Google의 설명을 살펴보세요. 그것은 쌍둥이자리 언어 모델 업로드한 소스 이미지에 대한 자세한 캡션을 작성합니다. 그런 다음 해당 설명을 이미지 3 이미지 생성기. 결과는 다음을 기반으로 한 이미지입니다. 당신의 이미지에 대한 쌍둥이 자리의 말 — 소스 이미지 자체가 아닙니다.
Whisk는 적어도 현재로서는 미국에서만 사용할 수 있습니다. 프로젝트에서 시도해 볼 수 있습니다. Google 연구소 사이트.