본문 바로가기
AI/AI서비스

빙 무료 달리3(DALL-E3) 사용법과 달리2(DALL-E2) 차이 알아보기

by 컴업정 2023. 10. 18.

 

최근 OpenAI에서 달리3(DALL-E3)를 chatGPT-Plus 고객들에게만 서비스를 제공한다고 하는 뉴스가 나왔습니다. 하지만 그보다 먼저 마이크로소프트의 빙(Bing)에서 무료로 달리3 서비스를 제공하고 있습니다.

 

이전부터 달리2도 서비스하고 있었는데 이번에 달리3로 업그레이드되었습니다. 달리3는 달리2보다 특히 그림의 섬세함에 있어 많은 발전이 있다고 하니 빙에서 무료로 달리3를 이용해 보세요

 

 

그리고 추가적으로 Bing에서 제공하는 달리3 뿐만 아니라 그림을 분석하는 Visual Search라는 멋진 기능도 있으니 한번 경험해보세요

 

Bing Visual Search 및 이미지 분석 기능

chatGPT를 탑재하면서 더욱 인기가 많아진 Bing이 Visual Search 기능과 이미지 분석 기능이 추가되었습니다. 프롬프트에서 Text만 처리하던 AI들이 점점 더 발전하여 시각적, 특히 이미지 처리에 대한

comupjung.tistory.com

 

빙에서 DALL-E 3 이용 방법

 

◈ Bing Image Creator 페이지 이동

 

우선 달리3를 이용하기 위해서는 Image Creator라는 페이지로 이동해야 합니다. 

아래 바로가기 버튼을 클릭하면 바로 이동할 수 있습니다.

 

 

Bing Image Creator 바로 가기

 

 

◈ 회원가입 또는 로그인

 

회원가입

 

Bing Image Creator 페이지로 이동하면 위와 같이 가입 및 만들기라는 버튼을 통해 마이크로소프트에 회원가입을 한 후 로그인을 해야 이용할 수 있습니다.

 

회원가입을 진행 후 다음 단계로 넘어갑니다.

 

 

 프롬프트 화면

 

 

프롬프트 화면

 

로그인을 완료하면 위의 그림과 같은 화면이 나타납니다. 

 

▶ 프롬프트 :  붉은색 네모 부분이 그림을 그리기 위해 텍스를 입력하는 곳

▶ 부스터 :  달리3가 그림 그리는 속도를 증가시키는 기능을 하고 한번 그릴 때마다 1개씩 차감됩니다.

    → 부스터가 없다고 그림을 못 그리지는 않고 속도만 감소합니다.

 

 

 

 프롬프트 입력

프롬프트 창에 그리고 싶은 내용의 문자를 입력 후 우측의 '만들기' 버튼을 클릭하면 그림을 그려 줍니다.

 

 

그림을 그리는 데는 대략 10초에서 20초 정도의 시간이 걸립니다.(부스터 사용 시) 

 

wait

 

기다리는 동안 아래 그림과 같은 wait 화면이 나오고 생성이 완료되면 위의 그림과 같은 그림이 나옵니다.

 

이미지 생성

 

생성된 그림 다운로드

생성된 그림 4개 중 가장 마음에 드는 그림의 영역을 클릭하면 화면이 확대되고 생성된 그림과 우측에 '다운로드'  버튼을 클릭하면 다운로드가 진행됩니다.

 

다운로드

 

 

 

 

프롬프트 영어와 한글 입력

 

달리3는 한글도 입력을 처리할 수 있습니다. 하지만 개인적으로 테스트를 해본 결과 한글이 영어보다는 해석 능력이 부족하다는 느낌을 받았습니다.

 

 한글 입력

 

한글로 아래와 같이 꽃과 소나기를 실사화해서 글려달라고 요청했지만 꽃과 소나기를 사실적으로 그리지는 못하는 결과가 나왔습니다. '세밀하게' 등 다른 단어를 입력해도 마찬가지였습니다.

 

한글 생성이미지

 

 영어 입력

한글로 입력한 내용을 영어로 번역하여 이미지를 생성하였더니 한글과 다르게 좀 더 원하던 그림에 가깝게 나왔습니다. 진짜 꽃 같이 이미지가 생성되었네요...

 

영어 생성이미지

 

 

 한글에 ' realistic' 추가

그래서 한글에 추가적으로 사실적인을 뜻하는 영단어 realistic을 추가했습니다. 한글로만 이루어졌던 결과물에 비해 좀 더 사실적인 그림이 그려지네요.

 

한글 추가 생성이미지

 

 

위의 테스를 봤을 때 한글보다는 영어로 입력하고 생성해야 우리가 진짜 원하는 그림에 더 가깝게 나오는 것 같습니다.

 

 

DALL-E2 와 DALL-E3 비교

이번에는 DALL-E2 와 DALL-E3 성능에 대해서 알아보겠습니다.

 

◈ 모델 크기

달리2는 126억 개, 달리3는 175억 개의 파라미터로 구성된 트랜스포머 모델입니다. 즉 달리3는 달리2 보다 약 40% 더 복잡한 모델입니다.

 

◈ 데이터 세트

달리2와 달리3는 1.56T개의 텍스트-이미지 쌍으로 구성된 데이터 Set에서 학습이 되었다는 공통점이 있지만 달리3는 추가적으로 600억 개의 텍스트 쌍으로 구성된 데이터 Set을 학습되었습니다.

 

◈ 출력 Image 품질

달리3는 달리2에 비해 사실적이고 디테일이 풍부하고 다양한 표현을 생성할 수 있습니다.

 

◈ 기능

달리2가 덱스트를 입력하면 그에 맞는 이미지를 생성하는 기능이 전부라면 달리3는 달리2의 기능에 이미지를 입력하면 그에 해당하는 텍스트를 생성하는 기능이 추가되었습니다.

 

위의 설명을 간단히 표로 요약한 표는 아래와 같습니다.

 

특징 달리2 달리3
모델 크기 126억 개의 파라미터 175억 개의 파라미터
데이터 세트 1.56T개의 텍스트-이미지 쌍 1.56T개의 텍스트-이미지 쌍 + 600억 개의 텍스트 쌍
출력 이미지 품질 사실적인 디테일이 부족하고, 약간 뭉개진 이미지 사실적인 디테일이 풍부하고, 다양한 표현을 생성할 수 있는 이미지
기능 텍스트를 입력하여 이미지 생성 텍스트를 입력하여 이미지 생성, 이미지를 입력하여 텍스트 생성(추후 추가 예정)

 

 

 

  달리2와 달리3의 결과물 비교

 

아래 그림은 이전에 빙에서 달리2를 소개하면서 그린 그림인데 같은 프롬프트를 이용하여 달리3에서 같은 테스트를 진행해본 결과입니다.

 

입력 프롬프트 : 3d render of a person working hard in a company

 

비교를 해보면 비슷한 스타일일의 3d형태로 그림이 나왔지만 person에 대한 표현의 차이가 많이 나는 것을 확인할 수 있습니다.

 

달리2-그림달리3-그림
달리2 와 달리3          

 

 

어도비 생성형 AI FireFly 관련 글

 

어도비 FireFly와 ChatGPT를 이용한 AI로 그림 그리기 #1(Text to Image)

chatGPT로 폭발한 생성형 AI에 챗봇도 있지만 그림을 그려주는 AI 서비스도 많습니다. 미드저니, 달리 2 등 많이 있지만 대부분 유료로 넘어가고 있는 상황에서 어도비의 FireFly는 아직 베타버전으로

comupjung.tistory.com

 

어도비 FireFly로 AI로 그림 그리기 #2(Text effects)

지난번 FireFly의 Text to image 기능에 대해서 알아봤습니다. 이번에는 Text에 여러 가지 효과를 채워서 이쁜 고 특이한 Text를 만들 수 있는 'Text effects' 기능에 대해서 알아보겠습니다. 로그인을 해야 F

comupjung.tistory.com

 

댓글