Generatywna sztuczna inteligencja

Generatywna sztuczna inteligencja (ang. generative artificial intelligence, generative AI, GenAI) – ogół narzędzi sztucznej inteligencji służących do generowania tekstu, obrazów, filmów i innych danych z wykorzystaniem modeli generatywnych, najczęściej na podstawie podanych przez użytkownika podpowiedzi (ang. prompts)[1]. Modele generatywnej sztucznej inteligencji uczą się wzorców i struktury danych wejściowych, a następnie generują nowe dane o podobnych cechach[2].
Ulepszenia głębokich sieci neuronowych opartych na transformatorach, w szczególności dużych modeli językowych (LLM), umożliwiły rozwój generatywnych systemów sztucznej inteligencji na początku lat dwudziestych XXI wieku. Należą do nich chatboty, takie jak ChatGPT, Copilot, Gemini, DeepSeek i Claude, systemy generowania obrazu oparte na sztucznej inteligencji przekształcające tekst na obraz, takie jak Stable Diffusion, Midjourney i DALL-E, a także generatory przetwarzające tekst na wideo (np Sora) lub muzykę. Firmy takie jak OpenAI, Anthropic, Microsoft, Google i Baidu, a także wiele mniejszych firm opracowały własne generatywne modele sztucznej inteligencji[3][4].
Generatywna sztuczna inteligencja ma zastosowania w wielu różnych branżach, w tym w tworzeniu oprogramowania, opiece zdrowotnej, finansach, rozrywce, obsłudze klienta[5], sprzedaży i marketingu[6], sztuce, literaturze[7], modzie[8] i projektowaniu produktów. Pojawiły się jednak obawy dotyczące potencjalnego niewłaściwego wykorzystania generatywnej sztucznej inteligencji (cyberprzestępczość, generowanie fałszywych wiadomości lub deepfakes do oszukiwania ludzi lub manipulowania nimi)[9][10].
Historia
Wczesna historia

Pomysł generatywnej sztuki był znany w starożytnej Grecji gdzie tacy wynalazcy jak Dedal czy Heron z Aleksandrii byli opisywani jako potrafiący tworzyć maszyny automaton, które potrafiły pisać tekst, tworzyć dźwięki czy grać muzykę[11][12]. Jednym z bardziej znanych maszyn tego typu jest automaton Maillardeta.
Łańcuch Markowa był używany do analizy tekstu naturalnego od pierwszej publikacji przez jego twórcę Andrieja Markowa, który w 1906 opublikował analizę samogłosek w powieści Eugeniusz Oniegin[13][14]. Gdy łańcuch nauczy się korpusu języka, może zostać użyty jako generator tekstu oparty na prawdopodobieństwie[15][16].
Badania nad sztuczną inteligencją
Od lat 50. XX wieku artyści i badacze wykorzystywali sztuczną inteligencję do tworzenia dzieł artystycznych. Już w latach 70. Harold Cohen tworzył i prezentował generatywne dzieła sztuki oparte na AI, stworzone za pomocą AARON-a – programu komputerowego zaprojektowanego w celu generowania obrazów[17].
Terminy planowanie generatywne był używany w latach 80. i 90. XX wieku w odniesieniu do systemów planowania wykorzystujących sztuczną inteligencję (zwłaszcza systemów CAPP), które służyły do generowania sekwencji kroków wymaganych do osiągnięcia określonego celu[18][19].
Systemy generatywnego planowania AI wykorzystywały symboliczne metody, takie jak przeszukiwanie przestrzeni stanów i rozwiązywanie problemów z ograniczeniami, i były już stosunkowo dojrzałą technologią na początku lat 90. Wykorzystywano je do tworzenia planów działania w sytuacjach kryzysowych na potrzeby wojska[20], planów procesów produkcyjnych[21] oraz planów decyzyjnych, m.in. w prototypowych autonomicznych statkach kosmicznych[22].
Generatywne sieci neuronowe

Od początku swojego istnienia dziedzina uczenia maszynowego wykorzystywała do przewidywania danych zarówno modele dyskryminacyjne (zwracające przewidywaną klasyfikację lub rozkład warunkowy zmiennej objaśnianej), jak i generatywne (umożliwiające generowanie potencjalnych obserwacji). Począwszy od końca lat 2000, pojawienie się uczenia głębokiego napędziło postęp oraz badania w obszarach takich jak klasyfikacja obrazów, rozpoznawanie mowy czy przetwarzanie języka naturalnego. Sieci neuronowe w tym okresie były zazwyczaj trenowane jako modele dyskryminacyjne ze względu na trudności związane z modelowaniem generatywnym[23][24]. W miarę jak uczenie głębokie zyskiwało na popularności w latach 2010., coraz większym zainteresowaniem cieszyły się modele generowania obrazów z wykorzystaniem głębokich sieci neuronowych, takie jak DeepDream oparty na sieciach konwolucyjnych[25]. W 2014 roku pojawiły się przełomowe rozwiązania, takie jak autoenkodery wariacyjne i generatywne sieci przeciwstawne (GAN) pozwalające na tworzenie bardziej zaawansowanych modeli generatywnych.
Przedstawiona w 2017 architektura transformatora umożliwiła postęp w modelach generatywnych w porównaniu do starszych modeli wykorzystujących długą pamięć krótkotrwałą[26]. Doprowadziło to do stworzenia architektury GPT-1 w 2018 i GPT-2 w 2019[27].
Nowe modele generatywne wprowadzone w tym okresie pozwoliły na uczenie nienadzorowane, co pozwoliło na znaczne ograniczenie lub eliminację czynnika ludzkiego w przygotowywaniu zbiorów uczących, co pozwoliło na tworzenie dużych modeli językowych[28].
Rozkwit generatywnej sztucznej inteligencji (od 2020 roku)

W marcu 2020 roku udostępniono 15.ai – darmową aplikację internetową stworzoną przez anonimowego badacza z MIT, która potrafiła generować realistyczne głosy postaci przy użyciu minimalnej ilości danych treningowych. Był to jeden z pierwszych przypadków powszechnego wykorzystania generatywnej AI[29].
Pojawienie się w 2021 roku usługi DALL-E – modelu generującego obrazy z tekstu – stanowiło przełom w dziedzinie obrazów generowanych przez sztuczną inteligencję[30]. W ślad za tym, powstały takie narzędzia jak Midjourney[31] czy Stable Diffusion w 2022[32].
W listopadzie 2022 OpenAI wydało ChatGPT[33], który potrafił przeprowadzać konwersację z użytkownikiem, a później także generować obrazy, asystować przy tworzeniu kodu i przeprowadzać analizy, co spowodowało debatę nad wpływem generatywnej sztucznej inteligencji w przemyśle, edukacji czy sztuce[34].
W grudniu 2023 Google wprowadziło multimodalny model Gemini[35].
W marcu 2024 Anthropic zaprezentował model Claude, które w szeregu testów przewyższył rozwiązania oferowane przez OpenAI i Google[36].
W styczniu 2025 firma DeepSeek wypuściła model R1, stanowiący alternatywę dla takich usług jak ChatGPT czy Claude[37].
Oprogramowanie i sprzęt

Generatywna sztuczna inteligencja znajduje zastosowanie m.in. w tworzeniu czatbotów, takich jak ChatGPT, narzędzi programistycznych, jak GitHub Copilot[38], generowaniu obrazów z tekstu (np. Stable Diffusion) oraz wideo z tekstu (np. Sora). Modele generatywne są również integrowane z produktami biurowymi, takimi jak Microsoft Office[39].
Mniejsze modele generatywne (poniżej 10 miliardów parametrów) mogą działać na niewielkich urządzeniach, takich jak Raspberry Pi[40] albo iPhone 11[41].
Z kolei modele zawierające dziesiątki miliardów parametrów mogą być uruchamiane na laptopach lub komputerach stacjonarnych, choć często wymagają one dodatkowych akceleratorów, takich jak GPU czy NPU[42].
_025.png)
Modele liczące setki miliardów parametrów, takie jak GPT-4, wymagają specjalistycznych serwerów wyposażonych w macierze GPU, jak Nvidia H100, lub NPU (np. Google TPU). Centra danych obsługujące takie systemy potrafią pobierać 100-150 MW energii elektrycznej[43][44][45]. W 2024 roku cena jednej karty GPU klasy serwerowej, takiej jak Nvidia H100, wynosi 25-30 tys. USD[46].
W 2022 roku Stany Zjednoczone wprowadziły ograniczenia eksportu zaawansowanych układów obliczeniowych do Chin. W odpowiedzi powstały takie rozwiązania jak Nvidia A800[47], H800[48] oraz Biren Technology BR104[49]. Kolejne zaostrzenia ogłoszone przez administrację Stanów Zjednoczonych[50] doprowadziły do opracowania układu Nvidia H20 w roku 2024, zaprojektowanego specjalnie z myślą o rynku chińskim[51], których sprzedaż została jednak zablokowana w kwietniu 2025[52].
W 2024 roku zaproponowano nowy system ograniczeń eksportu zaawansowanych chipów korzystających z technologii ze Stanów Zjednoczonych z podziałem na 3 grupy państw[53][54]:
- kraje bez ograniczeń w imporcie, takie jak Stany Zjednoczone, Niemcy, Francja czy Japonia,
- kraje z limitem wynoszącym 50 tys. zaawansowanych chipów, m.in. Polska, Izrael, Meksyk czy Indonezja,
- kraje objęte zakazem eksportu, takie jak Chiny, Rosja.
W styczniu 2025 ogłoszono projekt Stargate zakładający inwestycje na poziomie 500 mld USD w centra danych w Stanach Zjednoczonych wspomagające działanie aplikacji sztucznej inteligencji[55], zaś trzy tygodnie później UE ogłosiła program inwestycji w AI w kwocie 200 mld euro[56].
Przypisy
- ↑ Erin Griffith: Anthropic Said to Be Closing In on $300 Million in New A.I. Funding. The New York Times, 2023-01-27. [dostęp 2023-03-14]. [zarchiwizowane z tego adresu (2023-12-09)]. (ang.).
- ↑ Andrej Karpathy: Generative models. 2016-06-16. [dostęp 2024-05-27]. [zarchiwizowane z tego adresu (2023-11-17)].
- ↑ Erin Griffith: Anthropic Said to Be Closing In on $300 Million in New A.I. Funding. The New York Times, 2023-01-27. [dostęp 2023-03-14]. [zarchiwizowane z tego adresu (2023-12-09)].
- ↑ June Yang: Google Cloud brings generative AI to developers, businesses, and governments. 2023-03-14. [dostęp 2023-03-15]. [zarchiwizowane z tego adresu (2023-11-17)].
- ↑ Brynjolfsson, Generative AI at Work, 2023 (Working Paper Series), DOI: 10.3386/w31161 [dostęp 2024-01-21] [zarchiwizowane z adresu 2023-03-28].
- ↑ Don’t fear an AI-induced jobs apocalypse just yet. 2023-03-06. [dostęp 2023-03-14]. [zarchiwizowane z tego adresu (2023-11-17)].
- ↑ Jake Coyle: In Hollywood writers’ battle against AI, humans win (for now). AP News, 2023-09-27. [dostęp 2024-01-26]. [zarchiwizowane z tego adresu (2024-04-03)]. (ang.).
- ↑ H. Harreis: Generative AI: Unlocking the future of fashion. [dostęp 2023-03-14]. [zarchiwizowane z tego adresu (2023-11-17)]. (ang.).
- ↑ Justin Hendrix: Transcript: Senate Judiciary Subcommittee Hearing on Oversight of AI. techpolicy.press, 2023-05-16. [dostęp 2023-05-19]. [zarchiwizowane z tego adresu (2023-11-17)]. (ang.).
- ↑ Felix M. Simon. Misinformation reloaded? Fears about the impact of generative AI on misinformation are overblown. „Harvard Kennedy School Misinformation Review”, 2023-10-18. DOI: 10.37016/mr-2020-127. [zarchiwizowane z adresu]. (ang.).
- ↑ New Scientist Technology Blog: A programmable robot from 60 AD [online], web.archive.org, 12 stycznia 2017 [dostęp 2025-04-19] [zarchiwizowane z adresu 2017-01-12].
- ↑ Gerard Brett, The Automata in the Byzantine "Throne of Solomon", „Speculum”, 29 (3), 1954, s. 477–487, DOI: 10.2307/2846790, ISSN 0038-7134, JSTOR: 2846790 [dostęp 2025-04-19].
- ↑ Prof. Charles Grinstead, Prof. Laurie Snell, Introduction to Probability, American Mathematical Society, 1997 [dostęp 2025-04-19].
- ↑ Pierre Bremaud, Markov Chains: Gibbs Fields, Monte Carlo Simulation, and Queues, Springer Science & Business Media, 9 marca 2013, ISBN 978-1-4757-3124-8 [dostęp 2025-04-19] (ang.).
- ↑ First Links in the Markov Chain [online], American Scientist, 6 lutego 2017 [dostęp 2025-04-19] (ang.).
- ↑ Shai Fine, Yoram Singer, Naftali Tishby, The Hierarchical Hidden Markov Model: Analysis and Applications, „Machine Learning”, 32 (1), 1998, s. 41–62, DOI: 10.1023/A:1007469218079, ISSN 1573-0565 [dostęp 2025-04-19] (ang.).
- ↑ Nathan Bergen, Angela Huang, A Brief History of Generative AI, 2023, s. 4 [dostęp 2025-04-21] (ang.).
- ↑ (PDF) Computer Aided Process Planning: The State-of-the-Art Survey,” [online], ResearchGate [dostęp 2025-04-19] [zarchiwizowane z adresu 2025-03-06] (ang.).
- ↑ S. Chien i inni, Automated planning and scheduling for goal-based autonomous spacecraft, „IEEE Intelligent Systems and their Applications”, 13 (5), 1998, s. 50–55, DOI: 10.1109/5254.722362, ISSN 2374-9423 [dostęp 2025-04-19].
- ↑ Thomas D. Garvey Northrup Fowler IlI, Overview: ARPA-Rome Laboratory Knowledge-Based Planning and Scheduling Initiative (ARPI) [online], AAAI [dostęp 2025-04-19] (ang.).
- ↑ Computer Aided Process Planning: The State-of-the-Art Survey, 1989.
- ↑ Barney Pell i inni, An Autonomous Spacecraft Agent Prototype, „Autonomous Robots”, 5 (1), 1998, s. 29–52, DOI: 10.1023/A:1008860925034, ISSN 1573-7527 [dostęp 2025-04-21] (ang.).
- ↑ Andrew Ng, Michael Jordan, On Discriminative vs. Generative Classifiers: A comparison of logistic regression and naive Bayes, „Advances in Neural Information Processing Systems”, 14, MIT Press, 2001 [dostęp 2025-04-19].
- ↑ Tony Jebara, Machine Learning. Discriminative and generative, Springer Link, 2004, DOI: 10.1007/978-1-4419-9011-2 [dostęp 2025-04-19] (ang.).
- ↑ Research Blog: DeepDream - a code example for visualizing Neural Networks [online], web.archive.org, 8 lipca 2015 [dostęp 2025-04-19] [zarchiwizowane z adresu 2015-07-08].
- ↑ Yihan Cao i inni, A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT, „arXiv”, 2023, DOI: 10.48550/arXiv.2303.04226, arXiv:2303.04226 [dostęp 2025-04-19].
- ↑ Language Models are Unsupervised Multitask Learners, OpenAI, 2021 [zarchiwizowane 2021-02-06].
- ↑ Improving language understanding with unsupervised learning [online], openai.com, 14 lutego 2024 [dostęp 2025-04-19] (ang.).
- ↑ Rionaldi Chandraseta, Generate Your Favourite Characters' Voice Lines using Machine Learning [online], Towards Data Science, 21 stycznia 2021 [dostęp 2025-04-19] (ang.).
- ↑ OpenAI’s DALL-E creates plausible images of literally anything you ask it to – TechCrunch [online], web.archive.org, 6 stycznia 2021 [dostęp 2025-04-19] [zarchiwizowane z adresu 2021-01-06].
- ↑ Midjourney Legacy Model Versions [online], web.archive.org, 26 września 2023 [dostęp 2025-04-19] [zarchiwizowane z adresu 2023-09-26].
- ↑ Stable Diffusion Public Release [online], Stability AI [dostęp 2025-04-19] (ang.).
- ↑ Introducing ChatGPT [online], openai.com, 13 marca 2024 [dostęp 2025-04-19] (ang.).
- ↑ Ars Contributors, How ChatGPT turned generative AI into an “anything tool” [online], Ars Technica, 23 sierpnia 2023 [dostęp 2025-04-19] (ang.).
- ↑ Miles Kruppa, Google Announces AI System Gemini After Turmoil at Rival OpenAI [online], WSJ [dostęp 2025-04-19] (ang.).
- ↑ Michael Nuñez, Anthropic unveils Claude 3, surpassing GPT-4 and Gemini Ultra in benchmark tests [online], VentureBeat, 4 marca 2024 [dostęp 2025-04-19] (ang.).
- ↑ Sharon Goldman, DeepSeek dropped an open-source AI bomb—what does it mean for OpenAI and Anthropic? [online], Fortune [dostęp 2025-04-19] (ang.).
- ↑ Sam Sabin, GitHub taps generative AI to help coders keep security flaws out of their projects [online], Axios, 30 czerwca 2023 [dostęp 2025-04-19] (ang.).
- ↑ Jonathan Vanian, Microsoft adds OpenAI technology to Word and Excel [online], CNBC, 16 marca 2023 [dostęp 2025-04-19] (ang.).
- ↑ Les Pounder, How To Create Your Own AI Chatbot Server With Raspberry Pi 4 [online], Tom's Hardware, 25 marca 2023 [dostęp 2025-04-19] (ang.).
- ↑ Jonathan Kemper, "Draw Things" App brings Stable Diffusion to the iPhone [online], THE DECODER, 10 listopada 2022 [dostęp 2025-04-19] (ang.).
- ↑ Llama 2 and Llama 3.1 Hardware Requirements: GPU, CPU, RAM [online], Hardware Corner [dostęp 2025-04-19] (ang.).
- ↑ Emil Sayegh, The Billion-Dollar AI Gamble: Data Centers As The New High-Stakes Game [online], Forbes [dostęp 2025-04-19] (ang.).
- ↑ China built hundreds of AI data centers to catch the AI boom. Now many stand unused. [online], MIT Technology Review [dostęp 2025-04-19] (ang.).
- ↑ Adam Jadczak, UE uruchamia inicjatywę InvestAI wartą nawet 200 mld euro [online], ITwiz, 11 lutego 2025 [dostęp 2025-04-21].
- ↑ Jonathan Vanian, Mark Zuckerberg indicates Meta is spending billions of dollars on Nvidia AI chips [online], CNBC, 18 stycznia 2024 [dostęp 2025-04-19] (ang.).
- ↑ Anton Shilov, Nvidia's Chinese A800 GPU's Performance Revealed [online], Tom's Hardware, 7 maja 2023 [dostęp 2025-04-19] (ang.).
- ↑ Nvidia tweaks flagship H100 chip for export to China as H800 | Reuters [online], web.archive.org, 22 listopada 2023 [dostęp 2025-04-19] [zarchiwizowane z adresu 2023-11-22].
- ↑ How China’s Biren Is Attempting To Evade US Sanctions [online], SemiAnalysis, 24 października 2022 [dostęp 2025-04-19] (ang.).
- ↑ Kif Leswing, U.S. curbs export of more AI chips, including Nvidia H800, to China [online], CNBC, 17 października 2023 [dostęp 2025-04-19] (ang.).
- ↑ Here are the chips that Nvidia can sell to China [online], Quartz, 27 marca 2025 [dostęp 2025-04-19] (ang.).
- ↑ USA nakładają kolejne blokady na sprzedaż układów Nvidia do Chin. Firma straci miliardy [online], pb.pl, 22 kwietnia 2025 [dostęp 2025-04-22].
- ↑ Pożegnalny "prezent" Joe Bidena uderzy w Polskę. Może spowolnić rozwój AI [online], INNPoland.pl [dostęp 2025-04-19] (pol.).
- ↑ Maciej Szostak, USA nakładają limity m.in. na Polskę — AI nie dla każdego [online], Obserwator Gospodarczy, 15 stycznia 2025 [dostęp 2025-04-19].
- ↑ Trump ogłasza projekt Stargate. 500 mld dolarów na sztuczną inteligencję w USA [online], Parkiet [dostęp 2025-04-19].
- ↑ UE ma zmobilizować 200 mld euro na inwestycje w AI - szefowa KE [online] [dostęp 2025-04-21].