Bullstory
프리미엄 구독
피드시황 대시보드

도구

모닝브리핑오늘의 급등주실적 캘린더배당 캘린더양도세 계산기매매일지전체 도구

더보기

불스터디무료 자료방불스토리란?
로그인
Bullstory
피드|구독하기|무료 자료방|무료 도구|불스터디|불스토리란?

불스토리 크리에이터 지원 →

회사명: 노터미너스 | 대표자: 염철민 | 사업자등록번호: 541-02-03119 | 통신판매업신고번호: 2024-대전중구-0643 | 주소: 대전광역시 유성구 장대로 106, 2층 J304호(장대동) | 고객센터: 010-3719-4658 | 이메일: noterminus@naver.com

홈도구스터디내 정보
생성형 AI
홈›허브›생성형 AI

생성형 AI

LLM·이미지·영상 생성 모델 기반의 AI 분야. 오픈AI·구글·앤트로픽 등이 주도합니다.

Generative AI · 위키
하드웨어 (AI 가속기)인프라·클라우드파운데이션 모델애플리케이션
엔비디아마이크로소프트알파벳(구글)아마존메타애플
트랜스포머·LLM파라미터·토큰학습 vs. 추론환각 (Hallucination)RAG·AI 에이전트
인공지능(AI)반도체데이터센터에너지·전력
나스닥100 (NDX)QQQAI·로보틱스 테마 ETF
생성형 AIGenerative AI
분류기술 테마 · 구조적 성장
핵심 개념거대언어모델(LLM) · 트랜스포머 · 확산모델(Diffusion)
밸류체인하드웨어(칩) · 인프라(클라우드) · 파운데이션 모델 · 애플리케이션
대표 종목US엔비디아 · 마이크로소프트 · 알파벳(구글) · 아마존 · 메타
주요 비상장OpenAI · Anthropic (직접 투자 불가, 클라우드 파트너 통한 간접 노출)
대표 지수나스닥100 NDX
대표 ETFUSQQQ  AI·로보틱스 테마 ETF
수요 진앙지반도체 · 데이터센터 · 전력·에너지 수요를 동시에 견인
기점챗GPT 공개 (2022년 11월) OpenAI
키워드LLM 트랜스포머 AI 에이전트 CAPEX 군비경쟁 환각

한 줄 정의 생성형 AI(Generative AI): 기존 데이터의 패턴을 학습해 텍스트·이미지·코드·음성·영상 같은 '새로운 콘텐츠'를 만들어내는 인공지능. 정답을 분류·예측만 하던 기존 AI와 달리, 사람이 시킨 적 없는 문장과 그림을 스스로 '생성'한다는 게 핵심이다.

통념 교정 흔히 "생성형 AI = 챗GPT"로 이해하는 경향이 있다. 그러나 챗GPT는 OpenAI의 거대언어모델(LLM)을 채팅 형태로 포장한 한 가지 제품일 뿐이다. 생성형 AI는 글을 쓰는 LLM, 그림을 그리는 확산모델(Diffusion), 코드를 짜는 코드 모델, 영상을 만드는 모델을 모두 아우르는 상위 범주다. 투자 맥락에서 "생성형 AI에 투자한다"고 하면 모델 개발사뿐 아니라, 그 모델을 돌리는 칩·전력·데이터센터·서비스까지 전체 사슬을 가리킨다.


1.개요

생성형 AI는 2022년 11월 챗GPT 등장 이후 가장 빠르게 대중화된 기술이다. 출시 두 달 만에 월간 활성 사용자 1억 명을 돌파해, 당시 기준 역사상 가장 빠르게 성장한 소비자 애플리케이션으로 기록됐다.[1] 본질은 단순하다. 인터넷의 방대한 텍스트·이미지를 학습한 뒤, 다음에 올 단어(또는 픽셀)를 확률적으로 예측해 한 토막씩 이어 붙이는 것이다. 그런데 이 단순한 원리를 천문학적 규모로 키웠더니, 번역·요약·코딩·그림처럼 따로 가르치지 않은 능력이 '창발(emergence)'했다.[2]

투자자에게 생성형 AI가 중요한 이유는, 이 기술이 단독으로 굴러가지 않기 때문이다. 모델 하나를 학습시키려면 수만 개의 GPU, 그 GPU를 묶는 데이터센터, 데이터센터를 돌리는 막대한 전력·원자력이 동시에 필요하다. 즉 생성형 AI 붐은 반도체·데이터센터·에너지 섹터 전체로 수요를 끌어올리는 '수요의 진앙지' 역할을 한다. 칩을 파는 엔비디아가 AI 사이클의 최대 수혜주로 꼽히는 것도 이 구조 때문이다.

생성형 AI 밸류체인을 대표하는 미국 상장 핵심 종목을 실시간 스냅샷으로 확인해보자.

종목 스냅샷엔비디아NVDA
—
52주 범위 — – —
시가총액—PER—
배당수익률—섹터—
심화 리포트Nvidia 기업분석 보기→
종목 스냅샷마이크로소프트MSFT
—
52주 범위 — – —
시가총액—PER—
배당수익률—섹터—
종목 스냅샷알파벳(구글)GOOGL
—
52주 범위 — – —
시가총액—PER—
배당수익률—섹터—

2.쉬운 정의: 판별형 AI vs. 생성형 AI

생성형 AI 쉬운 정의: 판별형 AI vs. 생성형 AI

AI는 크게 두 갈래로 나뉜다. 사진을 보고 "고양이"라고 맞히는 게 판별형(Discriminative) AI라면, "주황색 줄무늬 고양이를 그려줘"에 맞춰 없던 그림을 만드는 게 생성형(Generative) AI다.

쉽게 그림을 그리면 이렇다.

  • 판별형 AI: 시험 채점관. 주어진 입력이 어느 카테고리에 속하는지 '구분'한다. 스팸 필터, 안면 인식이 대표적.
  • 생성형 AI: 작가·화가. 학습한 패턴을 바탕으로 입력에 없던 '새 결과물'을 만든다. 챗봇, 이미지 생성기가 대표적.

생성형 AI의 심장은 2017년 구글이 발표한 '트랜스포머(Transformer)' 구조다.[3] 이 구조 덕분에 모델이 문장 전체의 맥락을 한꺼번에 보며 다음 단어를 고를 수 있게 됐고, 오늘날의 LLM(Large Language Model, 거대언어모델)이 전부 여기서 파생됐다. 챗GPT의 'GPT'도 'Generative Pre-trained Transformer'의 약자다.


3.산업 구조 (밸류체인)

생성형 AI 산업 구조 (밸류체인)

생성형 AI 산업은 아래에서 위로 쌓이는 4개 층(레이어)으로 이해하면 깔끔하다. 아래층일수록 자본 집약적이고, 위층일수록 사용자와 가깝다.

레이어 역할 대표 기업 마진·특징
하드웨어[4] AI 연산용 칩·메모리 엔비디아, AMD, 브로드컴 마진 최고, 공급 병목
인프라·클라우드 GPU를 빌려주는 데이터센터 마이크로소프트 Azure, 아마존 AWS, 구글 Cloud 막대한 CAPEX, 규모의 경제
파운데이션 모델[5] 범용 거대 모델 개발 OpenAI, Anthropic, 구글 DeepMind, 메타 학습비 부담, 승자독식 경향
애플리케이션 모델을 얹은 서비스 ChatGPT, Copilot, Midjourney 진입장벽 낮음, 경쟁 치열

여기서 핵심은 '곡괭이 장수' 구도다. 골드러시에서 금을 캔 사람보다 곡괭이·청바지를 판 사람이 더 안정적으로 돈을 벌었듯, 모델 경쟁(애플리케이션 층)의 승자가 누가 될지는 불확실해도 모든 참가자가 칩과 클라우드(하드웨어·인프라 층)는 반드시 사야 한다. 그래서 시장은 가장 아래 두 층에 가장 후한 밸류에이션을 줘왔다.

불스토리 관점: 파운데이션 모델 층은 '학습비는 천문학적인데 모델 성능은 금세 따라잡힌다'는 딜레마를 안고 있다. 한 회사가 수천억 원을 들여 최고 모델을 내놓아도, 몇 달 뒤 경쟁사·오픈소스가 비슷한 성능에 도달하는 일이 반복됐다. 반면 하드웨어 층의 엔비디아는 CUDA라는 소프트웨어 생태계로 개발자를 묶어둬, 경쟁사가 칩을 내놓아도 쉽게 갈아타지 못한다. 모델은 추격당해도 생태계는 추격당하기 어렵다는 점이 밸류체인 층마다 해자의 두께가 다른 이유다.


4.핵심 기술·용어

4.1.파라미터 (Parameter)

모델이 학습으로 조정하는 '손잡이'의 개수. 손잡이가 많을수록 더 미묘한 패턴을 담을 수 있다. 초기 GPT-3가 1,750억 개 수준이었고, 이후 모델들은 그 규모를 크게 키웠다.[6] 다만 무조건 클수록 좋은 건 아니어서, 최근엔 작지만 효율적인 모델(sLLM)로 비용을 줄이려는 흐름도 강하다.

4.2.학습(Training) vs. 추론(Inference)

모델을 만드는 단계가 '학습', 만들어진 모델을 실제로 사용하는 단계가 '추론'이다. 학습은 한 번에 수만 개 GPU를 몇 주씩 돌리는 거대 토목공사라면, 추론은 사용자가 질문할 때마다 발생하는 일상 전기요금이다. 사용자가 늘수록 추론 비용이 누적돼, "AI 서비스는 쓰면 쓸수록 적자"라는 말이 나오는 배경이 됐다.

4.3.토큰 (Token)

모델이 글을 처리하는 최소 단위. 단어보다 잘게 쪼갠 조각으로, AI 서비스의 과금도 보통 토큰 수 기준이다. 입력·출력 토큰이 많아질수록 비용이 올라가므로, 기업이 AI 도입 비용을 따질 때 핵심 변수가 된다.

4.4.환각 (Hallucination)

모델이 사실이 아닌 내용을 그럴듯하게 지어내는 현상.[7] 생성형 AI가 '확률적으로 그럴싸한 다음 단어'를 고르는 구조라서, 진위 판별 능력이 없어 발생한다. 의료·법률·금융처럼 정확성이 생명인 분야의 도입을 늦추는 가장 큰 걸림돌로 꼽힌다.

4.5.RAG (검색 증강 생성)

모델이 답하기 전에 외부 문서·DB를 먼저 검색해 근거를 붙이는 기법.[8] 환각을 줄이고 최신 정보를 반영하기 위한 사실상의 표준 기법이 됐다.


5.시장 사이클: 역사→현황→전망

5.1.폭발 (2022~2023년)

2022년 11월 챗GPT 공개가 방아쇠였다. 이듬해 마이크로소프트가 OpenAI에 대규모 추가 투자를 단행하고 검색·오피스 제품에 AI를 결합하자, 구글·메타·아마존 등 빅테크가 일제히 자체 모델 개발과 AI 데이터센터 투자에 뛰어들었다. 'AI에 안 쓰면 도태된다'는 공포가 업계 전체에 퍼졌다.

5.2.CAPEX 군비경쟁 (2024~2025년)

판이 칩 확보 전쟁으로 옮겨갔다. 빅테크들은 엔비디아 GPU를 더 많이 사기 위해 설비투자(CAPEX) 규모를 매년 키웠고, AI 데이터센터에 필요한 전력·원자력 확보 경쟁까지 번졌다. 엔비디아의 데이터센터 매출이 폭증하며, AI 인프라 투자가 실적으로 확인되는 구간이 이어졌다.[9]

5.3.수익화 시험대 (현재~전망)

지금 시장의 최대 관심사는 단 하나, "이 막대한 투자가 실제 수익으로 돌아오는가"다. 기업용 AI 에이전트, 코딩 보조, 고객 응대 자동화 등에서 생산성 향상 사례가 보고되고 있지만, 투입된 CAPEX 규모에 견줘 충분한 매출이 나오는지는 아직 검증 중이다. 이 검증 결과가 다음 사이클의 방향을 가를 변수다.

5.4.구조적 성장인가, 또 다른 버블인가

낙관론은 "생성형 AI가 소프트웨어를 넘어 노동 그 자체를 대체하기 시작했다"고 본다. 시장 규모가 클라우드·SaaS를 합친 것보다 커질 수 있다는 전망도 있다.[10] 반면 신중론은 닷컴버블을 떠올린다. 기술 자체는 진짜지만, 단기 투자 규모가 단기 수익을 한참 앞질러 일부 기업의 밸류에이션이 과열됐을 수 있다는 것이다. 어느 쪽이든, 수요가 실제 매출로 전환되는 속도가 핵심 변수라는 데는 양측이 동의한다.


6.리스크 및 쟁점

수익화·버블 논쟁 AI 인프라에 투입된 CAPEX 대비 실제 수익화 속도가 시장 기대에 못 미치면, 빅테크의 투자 기조가 꺾이고 그 충격이 반도체 수요로 직격될 수 있다. 생성형 AI 밸류체인이 통째로 같은 방향으로 움직이는 구조라, 한 곳의 실망이 사슬 전체로 번질 위험이 있다.

저작권·데이터 소송 모델 학습에 쓰인 데이터의 저작권 문제로 다수의 소송이 진행 중이다. 뉴욕타임스가 OpenAI·마이크로소프트를 상대로 무단 학습을 이유로 소송을 제기하는 등, 콘텐츠 제작자와 AI 기업 간 분쟁이 이어지고 있다.[11] 판결 방향에 따라 학습 데이터 확보 비용 구조가 바뀔 수 있다는 점이 변수다.

규제 리스크 EU의 AI 법(AI Act)이 위험도 기반 규제를 도입하는 등, 주요국이 생성형 AI에 대한 규율 체계를 정비하고 있다.[12] 규제는 빅테크의 컴플라이언스 비용을 늘리는 한편, 안전성 검증 능력을 갖춘 대형 사업자에게 오히려 진입장벽 역할을 할 수 있다는 양면성이 있다.

전력·환경 부담 AI 데이터센터는 막대한 전력과 냉각수를 소비한다. 전력망 확보가 AI 확장의 물리적 병목으로 떠오르면서, AI 투자 테마가 전력·원자력 섹터로까지 번지는 동시에 환경·지역사회 마찰이라는 리스크도 함께 커지고 있다.

환각과 신뢰성 앞서 설명한 환각 문제는 단순한 기술 결함을 넘어, 잘못된 정보가 의사결정에 쓰일 경우 법적 책임 문제로 이어질 수 있다. 정확성이 요구되는 산업의 도입 속도를 늦추는 구조적 한계다.


7.주요 종목

생성형 AI 밸류체인 어느 층에 투자하느냐에 따라 리스크·수익 구조가 완전히 다르다.

하드웨어 층 (미국)

  • 엔비디아: AI 가속기 시장의 기준점. GPU 하드웨어와 CUDA 소프트웨어 생태계를 함께 팔아, 경쟁사의 진입 장벽이 하드웨어 스펙보다 훨씬 높다. 생성형 AI 붐의 최대 수혜주로 꼽혀왔다.

인프라·클라우드 층 (미국)

  • 마이크로소프트: OpenAI와 긴밀히 제휴해 Azure 클라우드와 Copilot 제품군 전반에 AI를 결합. 모델을 직접 쥐지 않고도 인프라·유통 길목을 장악하는 전략.
  • 알파벳(구글): 검색 강자이자 트랜스포머 원천 기술 보유사. Gemini 모델과 자체 AI 칩(TPU), Google Cloud로 풀스택을 갖췄다.
  • 아마존: AWS로 클라우드 1위. Anthropic에 투자하며 자체 칩(Trainium·Inferentia)으로 추론 비용 절감을 노린다.

모델·플랫폼 층

  • 메타: 라마(Llama) 오픈소스 모델을 공개해 생태계 주도권을 노리는 한편, 광고 사업에 생성형 AI를 결합. (OpenAI는 6월 SEC에 비공개 IPO 서류를 제출했지만 상장 시점은 아직 확정되지 않아, 직접 투자 불가), Anthropic은 비상장이라 직접 투자 불가.

ETF로 접근하기 개별 종목이 부담스럽다면, AI 테마를 통째로 담는 ETF도 있다. 빅테크 비중이 높은 나스닥100 추종 ETF나 AI·로보틱스 테마 ETF가 대표적이며, 밸류체인 여러 층을 한 바구니에 담는다.[13]


8.알아두면 좋은 포인트

  • 스케일링 법칙(Scaling Law): "모델·데이터·연산량을 키울수록 성능이 예측 가능하게 좋아진다"는 경험칙. 빅테크가 주저 없이 CAPEX를 키운 이론적 근거였지만, 최근엔 단순 규모 확장의 효율이 떨어진다는 논쟁도 함께 커지고 있다.
  • 에이전트(Agent)로의 진화: 질문에 답만 하던 챗봇에서, 스스로 도구를 쓰고 여러 단계를 거쳐 작업을 완수하는 'AI 에이전트'로 무게중심이 옮겨가는 중이다. 기업용 수익화의 핵심 열쇠로 주목받는다.
  • 온디바이스 AI: 클라우드가 아니라 스마트폰·PC에서 직접 모델을 돌리는 방식. 애플·삼성전자 등이 추진하며, 추론 비용과 프라이버시 문제를 동시에 풀 카드로 거론된다.
  • 생성형 AI와 반도체의 연결고리: 빅테크(구글, 마이크로소프트, 아마존, 메타)가 AI 인프라에 쏟아붓는 CAPEX가 반도체 수요의 직접 원인이다. 이들의 투자 계획이 바뀌면 칩 업황도 따라 바뀐다.
  • 멀티모달(Multimodal): 텍스트뿐 아니라 이미지·음성·영상을 한 모델이 동시에 이해·생성하는 방향. 검색·교육·콘텐츠 제작 시장을 새로 흔들 변수로 꼽힌다.

9.외부 링크 · 둘러보기

공식·1차 출처

  • OpenAI: openai.com
  • EU AI Act 공식 포털: artificialintelligence-act.eu
  • Stanford HAI 'AI Index Report': hai.stanford.edu

관련 문서 인공지능(AI) · 반도체 · 데이터센터 · 엔비디아 · 마이크로소프트 · 알파벳(구글) · 메타 · 애플 · 에너지/전력 · ETF



본 문서는 정보 제공용이며 투자 권유가 아닙니다. 모든 투자 결정과 그에 따른 손익은 투자자 본인에게 귀속됩니다.


각주

  1. 1. UBS 분석 보고서 인용 (2023년 2월 기준). 챗GPT가 출시 약 2개월 만에 월간 활성 사용자 1억 명을 추정 돌파했다는 내용. 당시 기준 가장 빠른 소비자 앱 성장 사례로 보도됐다.
  2. 2. 창발(Emergence): 모델 규모가 일정 임계점을 넘어서면, 작은 모델에선 안 보이던 능력(추론·번역 등)이 갑자기 나타나는 현상. 왜 생기는지는 아직 완전히 규명되지 않았다.
  3. 3. Vaswani et al., "Attention Is All You Need", 구글 (2017년 발표). 오늘날 거의 모든 LLM의 토대가 된 트랜스포머 구조를 제안한 논문.
  4. 4. AI 가속기: GPU처럼 행렬 연산을 대량 병렬로 처리하도록 만든 칩. 일반 CPU로는 모델 학습이 사실상 불가능해, 생성형 AI 시대의 필수 인프라가 됐다.
  5. 5. 파운데이션 모델(Foundation Model): 방대한 데이터로 미리 학습해 다양한 작업에 두루 쓸 수 있는 범용 대형 모델. GPT, Gemini, Llama 등이 여기 속한다.
  6. 6. GPT-3 파라미터 약 1,750억 개는 OpenAI 논문(2020년) 공개 수치. 이후 최신 모델들의 정확한 파라미터 수는 비공개인 경우가 많아, 특정 숫자는 단정하지 않는다.
  7. 7. 환각(Hallucination): 모델이 학습 데이터에 없거나 사실과 다른 내용을 자신 있게 생성하는 오류. 확률 기반 생성 구조의 본질적 한계로 평가된다.
  8. 8. RAG(Retrieval-Augmented Generation): 모델이 답을 만들기 전에 외부 지식베이스를 검색해 근거 문서를 함께 입력하는 방식. 최신성·정확성을 높이는 표준 기법.
  9. 9. 엔비디아 데이터센터 부문 매출 급증은 분기 실적 발표(Form 10-Q/연차 10-K)로 확인 가능. 구체 수치는 각 분기 공시 기준일을 확인해야 하므로 본문에서는 정성적으로만 서술.
  10. 10. 복수 투자은행·시장조사기관이 생성형 AI 시장 규모에 대해 큰 폭으로 엇갈리는 장기 전망을 내놓고 있다. 기관별 가정 차이가 커 단일 수치는 신뢰도가 낮으므로 정성 서술로 갈음.
  11. 11. The New York Times, "NYT v. OpenAI/Microsoft" 소송 제기 (2023년 12월). 학습 데이터 무단 사용을 쟁점으로 한 다수 저작권 소송 중 대표 사례. 2026년 6월 기준 진행 중.
  12. 12. EU AI Act: 유럽연합이 채택한 AI 규제법으로, 활용 위험도에 따라 차등 규제를 적용한다. 단계적 시행 중이며 글로벌 AI 규제의 기준점으로 거론된다.
  13. 13. AI 테마 ETF는 미국·한국 양쪽에 다수 상장돼 있다. 구성 종목·운용보수·환율 조건이 상품마다 다르므로, 매수 전 보유 종목과 비용을 반드시 확인해야 한다.