ICT 레이더/인공지능(AI)

Visual ChatGPT 출시

kusson 2023. 4. 12. 16:15
반응형
728x170

 MS 사에서 드디어 Visual ChatGPT를 출시했다. 지금까지 AI 이미지 생성이라는 것이 Prompt라는 수단을 통해서 간접적으로 그림을 출력하는 것이었다면 이제 진정한 의미의 text to image 시대가 열린 것이다. ChatGPT4가 출시되면서 나온 얘기가 Multi modal 이란 용어 였는데 이제 Visual ChatGPT를 통해서 진정한 의미의 Multi modal도 실현 될 것으로 생각된다.

 

먼저 구글 검색창에 Visual ChatGPT라고 입력하고 첫번째 나오는 'microsoft/visual- chatgpt'를 클릭한다.

 

 

(https://github.com/microsoft/visual-chatgpt)사이트에 들어가서 여기서 하단부의 'Open in Space'를 클릭하자.

 

GitHub - microsoft/visual-chatgpt: Official repo for the paper: Visual ChatGPT: Talking, Drawing and Editing with Visual Foundat

Official repo for the paper: Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models - GitHub - microsoft/visual-chatgpt: Official repo for the paper: Visual ChatGPT: Talking, Dr...

github.com

 

 

 그러면 아래와 같이 Visual ChatGPT 페이지가 열리는데 여기서 바로 Visual ChatGPT를 시험해 볼 수 있는 것이 아니고 한가지 먼저 해야 할 일이 있다. 바로 Open AI의 API Key를 받아 와서 아래 빨간 박스속에 넣어 줘야 한다.

 

 

(https://platform.openai.com/account/api-keys) 에 들어가서 API keys를 생성한다. 'Create new secret key'를 클릭해서 새 API keys를 생성하고 복사해 온다.

 

OpenAI API

An API for accessing new AI models developed by OpenAI

platform.openai.com

 

 

 복사해 온 API keys를 빨간 박스 속에 붙여 넣고 엔터를 클릭해 보자.

 

 

 하단부에 채팅창과 3가지 실행 버튼이 새로 생긴 것을 볼 수 있을 것이다.

 

 

 첫번째 예제 항을 클릭하면 채팅창에 그 문장이 입력된다. 우측의 'Run' 버튼을 클릭해 보자.

 

 

 조금 기다리면 정원에서 뛰어노는 고양이 그림이 나타난다. 

 

 

 그런데 그 다음 예제를 입력해서 'Run'을 클릭했는데 아직 반응이 없다. 아마 접속자가 많거나 아직 베타 테스트이기 때문에 문제가 있는 것으로 보인다. 이 글을 보는 분들도 한 번 시도해 보기 바란다. 필자가 이 글을 작성하고 있는 상황에서는 더 이상 실행이 되지 않는 상황이다.

 Visual ChatGPT가 제대로 실행이 된다면 진정한 의미의 text to image가 실현 되는 것이다. 화면 하단에 준비된 예제 문장만이 아니라 사용자가 어떠한 문장을 입력하더라고 그기에 맞게 이미지를 생성해 준다는 의미이기 때문이다. 몇시간 기다렸다가 또 한 번 시도해 봐야 겠다.

반응형
그리드형