최근 OpenAI에서 달리3(DALL-E3)를 chatGPT-Plus 고객들에게만 서비스를 제공한다고 하는 뉴스가 나왔습니다. 하지만 그보다 먼저 마이크로소프트의 빙(Bing)에서 무료로 달리3 서비스를 제공하고 있습니다.
이전부터 달리2도 서비스하고 있었는데 이번에 달리3로 업그레이드되었습니다. 달리3는 달리2보다 특히 그림의 섬세함에 있어 많은 발전이 있다고 하니 빙에서 무료로 달리3를 이용해 보세요
그리고 추가적으로 Bing에서 제공하는 달리3 뿐만 아니라 그림을 분석하는 Visual Search라는 멋진 기능도 있으니 한번 경험해보세요
빙에서 DALL-E 3 이용 방법
◈ Bing Image Creator 페이지 이동
우선 달리3를 이용하기 위해서는 Image Creator라는 페이지로 이동해야 합니다.
아래 바로가기 버튼을 클릭하면 바로 이동할 수 있습니다.
◈ 회원가입 또는 로그인
Bing Image Creator 페이지로 이동하면 위와 같이 가입 및 만들기라는 버튼을 통해 마이크로소프트에 회원가입을 한 후 로그인을 해야 이용할 수 있습니다.
회원가입을 진행 후 다음 단계로 넘어갑니다.
◈ 프롬프트 화면
로그인을 완료하면 위의 그림과 같은 화면이 나타납니다.
▶ 프롬프트 : 붉은색 네모 부분이 그림을 그리기 위해 텍스를 입력하는 곳
▶ 부스터 : 달리3가 그림 그리는 속도를 증가시키는 기능을 하고 한번 그릴 때마다 1개씩 차감됩니다.
→ 부스터가 없다고 그림을 못 그리지는 않고 속도만 감소합니다.
◈ 프롬프트 입력
프롬프트 창에 그리고 싶은 내용의 문자를 입력 후 우측의 '만들기' 버튼을 클릭하면 그림을 그려 줍니다.
그림을 그리는 데는 대략 10초에서 20초 정도의 시간이 걸립니다.(부스터 사용 시)
기다리는 동안 아래 그림과 같은 wait 화면이 나오고 생성이 완료되면 위의 그림과 같은 그림이 나옵니다.
◈ 생성된 그림 다운로드
생성된 그림 4개 중 가장 마음에 드는 그림의 영역을 클릭하면 화면이 확대되고 생성된 그림과 우측에 '다운로드' 버튼을 클릭하면 다운로드가 진행됩니다.
프롬프트 영어와 한글 입력
달리3는 한글도 입력을 처리할 수 있습니다. 하지만 개인적으로 테스트를 해본 결과 한글이 영어보다는 해석 능력이 부족하다는 느낌을 받았습니다.
◈ 한글 입력
한글로 아래와 같이 꽃과 소나기를 실사화해서 글려달라고 요청했지만 꽃과 소나기를 사실적으로 그리지는 못하는 결과가 나왔습니다. '세밀하게' 등 다른 단어를 입력해도 마찬가지였습니다.
◈ 영어 입력
한글로 입력한 내용을 영어로 번역하여 이미지를 생성하였더니 한글과 다르게 좀 더 원하던 그림에 가깝게 나왔습니다. 진짜 꽃 같이 이미지가 생성되었네요...
◈ 한글에 ' realistic' 추가
그래서 한글에 추가적으로 사실적인을 뜻하는 영단어 realistic을 추가했습니다. 한글로만 이루어졌던 결과물에 비해 좀 더 사실적인 그림이 그려지네요.
위의 테스를 봤을 때 한글보다는 영어로 입력하고 생성해야 우리가 진짜 원하는 그림에 더 가깝게 나오는 것 같습니다.
DALL-E2 와 DALL-E3 비교
이번에는 DALL-E2 와 DALL-E3 성능에 대해서 알아보겠습니다.
◈ 모델 크기
달리2는 126억 개, 달리3는 175억 개의 파라미터로 구성된 트랜스포머 모델입니다. 즉 달리3는 달리2 보다 약 40% 더 복잡한 모델입니다.
◈ 데이터 세트
달리2와 달리3는 1.56T개의 텍스트-이미지 쌍으로 구성된 데이터 Set에서 학습이 되었다는 공통점이 있지만 달리3는 추가적으로 600억 개의 텍스트 쌍으로 구성된 데이터 Set을 학습되었습니다.
◈ 출력 Image 품질
달리3는 달리2에 비해 사실적이고 디테일이 풍부하고 다양한 표현을 생성할 수 있습니다.
◈ 기능
달리2가 덱스트를 입력하면 그에 맞는 이미지를 생성하는 기능이 전부라면 달리3는 달리2의 기능에 이미지를 입력하면 그에 해당하는 텍스트를 생성하는 기능이 추가되었습니다.
위의 설명을 간단히 표로 요약한 표는 아래와 같습니다.
특징 | 달리2 | 달리3 |
---|---|---|
모델 크기 | 126억 개의 파라미터 | 175억 개의 파라미터 |
데이터 세트 | 1.56T개의 텍스트-이미지 쌍 | 1.56T개의 텍스트-이미지 쌍 + 600억 개의 텍스트 쌍 |
출력 이미지 품질 | 사실적인 디테일이 부족하고, 약간 뭉개진 이미지 | 사실적인 디테일이 풍부하고, 다양한 표현을 생성할 수 있는 이미지 |
기능 | 텍스트를 입력하여 이미지 생성 | 텍스트를 입력하여 이미지 생성, 이미지를 입력하여 텍스트 생성(추후 추가 예정) |
◈ 달리2와 달리3의 결과물 비교
아래 그림은 이전에 빙에서 달리2를 소개하면서 그린 그림인데 같은 프롬프트를 이용하여 달리3에서 같은 테스트를 진행해본 결과입니다.
입력 프롬프트 : 3d render of a person working hard in a company
비교를 해보면 비슷한 스타일일의 3d형태로 그림이 나왔지만 person에 대한 표현의 차이가 많이 나는 것을 확인할 수 있습니다.
어도비 생성형 AI FireFly 관련 글
'AI > AI서비스' 카테고리의 다른 글
Bing Visual Search 및 이미지 분석 기능 (0) | 2023.08.02 |
---|---|
어도비 FireFly로 AI로 그림 그리기 #2(Text effects) (0) | 2023.07.05 |
어도비 FireFly와 ChatGPT를 이용한 AI로 그림 그리기 #1(Text to Image) (0) | 2023.07.03 |
댓글