728x90
반응형
멀티모달 = 텍스트·이미지·음성·코드 등을 한 번에 이해·처리하는 똑똑한 방식.
이걸로 “사진에서 글 뽑기→정렬→엑셀 만들기”, “수학문제 풀이”, “가수 사진만 보고 정보·영상 찾기”, “PDF→PPT 자동 제작”까지 술술!
- 오늘 목표: 멀티모달 이해하고, GPTs(자주 쓰는 질문 저장·재사용) 예고.
멀티모달 개념 정리
- 정의: 여러 형태의 데이터를 동시에 읽고 쓰는 능력(텍스트·이미지·음성·코드 등).
- 왜 중요?
- 눈으로 보듯 직관적(이미지·표·그래프 바로 해석)
- 복합 사고 가능(듣고/보고/읽고를 합쳐 판단)
- 문제 해결력↑(수학·도표 같은 시각 문제에 강함)
- 주의: 사람은 진짜 병렬 못 함(멀티태스킹 환상), 컴퓨터/GPU·TPU가 대신 병렬 처리.
실습 핵심 4종 셋트
- 이미지 → 텍스트(OCR) → 가공
- 카페 메뉴판 사진 올리고 “텍스트 추출해줘” →
“가격순으로 정렬해줘” → “엑셀 파일로 만들어줘” - 보너스: 구글 킵도 이미지에서 텍스트 추출 가능.
- 카페 메뉴판 사진 올리고 “텍스트 추출해줘” →
- 수학 문제 이미지 풀이
- 문제 사진 첨부 + “단계별로 풀이 과정을 써 주고, 최종 답도 알려줘”
- 포인트: **‘단계별로’**가 정확도 스위치.
- 사진 한 장으로 인물/그룹 리서치
- 그룹 사진 첨부 +
① “이름·멤버 소개”, ② “대표곡 3곡 추천”, ③ “가장 인기 곡 유튜브 링크” - 한 번에 1,2,3 항목 쭉 적어도 됨.
- 그룹 사진 첨부 +
- PDF 긴 문서 → 요약 → PPT 파일 자동 생성
- “첨부 문서를 10장짜리 PPT로 요약·제작해줘(파일로 저장)”
- 완성본은 반드시 사람이 검토·수정(슬라이드 분량/레이아웃은 별도 손봐야 함).
도구 사용 팁(오늘 시연 기준)
- 웹 검색(리서치), 캔버스(문서 편집), 심층 리서치(장문 보고서)도 활용 가능.
- 무료 사용자는 멀티모달 업로드 횟수 제한(하루 3회 수준) → 꼭 필요한 것부터!
- 이미지 생성 기능 제한과는 별개로 취급(이미지는 더 여러 번 가능하다고 안내).
- 막힐 때 요령: 1분 대기 → F5 새로고침 → 그래도 안 되면 다른 시각/표현으로 재시도.
개인정보·저작권 한 줄 상식
- 민감정보(생년월일 등) 업로드 자제, 보관 끄기 옵션 활용 권장.
- AI 생성물 저작권 이슈는 국가·시기별로 변동 → 상업 사용 전 라이선스/약관 확인 필수.
- 인물·브랜드는 초상권/상표권 주의.
바로 써먹는 프롬프트 모음
- OCR + 정렬:
“이 이미지에서 텍스트 추출해줘 → 가격순으로 정렬해줘 → 엑셀 파일로 만들어줘.” - 수학:
“이미지 속 문제를 단계별로 풀이하고, 최종 답을 알려줘.” - 인물/그룹:
“사진 속 그룹 이름·멤버 소개하고, 대표곡 3개와 가장 인기 곡 유튜브 링크 알려줘.” - PDF→PPT:
“첨부한 PDF를 10장짜리 PPT로 요약 제작해줘. 파일로 저장해줘.”
- 오늘 멀티모달 기초 끝! → 다음은 GPTs 활용(자주 쓰는 질문·작업을 저장해 반복 자동화) +
이후 기수는 다른 AI & 영상/음악 생성 파트로 확장.
728x90
반응형
'AI활용지도사' 카테고리의 다른 글
| 1차시 - 1강 인공지능의 개요 (0) | 2025.10.22 |
|---|---|
| 3차시-6강-GTPs 사용하기 (0) | 2025.10.22 |
| AI활용지도사 4차시 두번째 시간 - 프롬프트로 영상까지 (0) | 2025.10.22 |
| AI활용지도사 4차시 수업 - 텍스트 → 이미지 → 영상 (0) | 2025.10.22 |
| AI의 개요와 발전 과정: AI가 변화시킨 우리의 일상 (2) | 2025.09.17 |
댓글