본문 바로가기
  • AI 개발자가 될래요
Deep Learning

ChatGPT4에 이미지 입력으로 넣는 법 / 지피티(GPT) 이미지 해석

by 꿀개 2023. 11. 13.

ChatGPT4에 이미지 입력으로 넣는 법 / 지피티(GPT) 이미지 해석

 

최근 지피티 유료버전, ChatGPT4에 이미지를 입력으로 넣을 수 있는 기능이 생겼다.

 

지피티에 이미지 입력으로 넣는 법

1. 입력란 왼쪽 클립 버튼을 클릭 후 원하는 이미지를 선택한다.

 

사실 방법은 매우 간단하다. 질문을 작성하는 입력란 왼쪽에 클립 모양의 아이콘이 있어, 이를 클릭하면 된다.

 

지피티에 이미지 넣기

 

그러면 파일 시스템에서 이미지를 로드할 수 있게 창이 뜰 것이다.

 

2. 이미지와 함께, 이미지에서 원하는 것을 텍스트로 입력한다.

 

실험을 해보니, 이미지만 입력으로 넣으면 대답을 못하는 것을 확인했다. (나중엔 바뀔수도?)

그래서 이미지와 함께 텍스트를 입력해야 한다. 

멀티모달로 학습된 모델을 이용하는듯 하다.

일 년 전까지만 해도 멀티모달이 이렇게 빨리 상용화 될 줄 몰랐는데.. 기술 발전 속도 참 빠르다.

 

필자의 경우에는 필자가 그린 그림과 함께 이에 대한 설명을 부탁했다.

 

GPT4에 이미지와 텍스트를 입력으로 넣은 모습

 

이 그림은 필자의 연구 과정에서 생긴 "마스크 영역 세그먼트" 와 관련된 그림이다.

더 자세한 내용을 알기 원한다면, 아래 깃허브에 정리해 놓았으니 보기 바란다. 😊

https://github.com/Seungeun-Han/Masked-LFW-Dataset-Mask-Parsing

 

GitHub - Seungeun-Han/Masked-LFW-Dataset-Mask-Parsing: This repository contains code for applying our face parsing technology to

This repository contains code for applying our face parsing technology to the Masked LFW Dataset. Our algorithm accurately identifies masked regions and sets their pixel values to 0, effectively se...

github.com

 

지피티의 대답

 

이미지를 입력으로 넣었을 때 지피티의 대답

 

아주 놀라지 않을 수 없다. 매우 놀랍다.

이젠 그림에 대한 해석도 자동으로 만들 수 있는 세상이 왔다.

 

양날의 검?! 일 수 도 있다. 이 기술이 후대에 어떤 영향을 미칠지는 모르겠다.

하지만 지금 당장 나에게는 매우 유용하다..!