Dom News > Deepseek AI Koszty rozwinięte do 1,6 miliarda dolarów, obalając mit przystępności cenowej

Deepseek AI Koszty rozwinięte do 1,6 miliarda dolarów, obalając mit przystępności cenowej

by Caleb Mar 26,2025

Jest jednak nadal tańszy niż jego konkurenci.

Nowy chatbot z Deepseek przedstawił mi ten intrygujący opis:

Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć.

Dzisiaj sztuczna inteligencja Deepseek stała się potężnym konkurentem na rynku, w szczególności przyczyniając się do jednego z największych spadków cen akcji w NVIDIA.

Test Deepseek Zdjęcie: engame.com

Tym, co wyróżnia ten model, to jego innowacyjna architektura i metody szkolenia. Wykorzystuje kilka najnowocześniejszych technologii:

Prognozowanie wielu tokenów (MTP): Zamiast przewidywać jedno słowo na raz, model prognozuje wiele słów jednocześnie poprzez analizę różnych części zdania. Podejście to znacznie zwiększa zarówno dokładność, jak i wydajność modelu.

Mieszanka ekspertów (MOE): Architektura ta wykorzystuje różne sieci neuronowe do przetwarzania danych wejściowych. Przyspiesza szkolenie AI i poprawia wydajność. W Deepseek V3 wykorzystywane jest 256 sieci neuronowych, a osiem jest aktywowanych dla każdego zadania przetwarzania tokenu.

Utrzymująca uwaga wielowłócona (MLA): Ten mechanizm pomaga skupić się na najważniejszych częściach zdania. MLA wielokrotnie wyodrębnia kluczowe szczegóły z fragmentów tekstu, a nie tylko raz, zmniejszając prawdopodobieństwo braku ważnych informacji. Umożliwia to efektywne przechwytywanie kluczowych niuansów w danych wejściowych.

Wybitny chiński startup Deepseek twierdzi, że stworzył konkurencyjny model sztucznej inteligencji przy minimalnych kosztach, stwierdzając, że wydali tylko 6 milionów dolarów na szkolenie potężnej sieci neuronowej Deepseek V3 i wykorzystali zaledwie 2048 procesorów graficznych.

Deepseek v3 Zdjęcie: engame.com

Jednak analitycy z semianalizy odkryli, że Deepseek prowadzi dużą infrastrukturę obliczeniową obejmującą około 50 000 GPU Nvidia Hopper. Obejmuje to 10 000 jednostek H800, 10 000 bardziej zaawansowanych H100 i dodatkowe partie H20 GPU. Zasoby te są dystrybuowane w kilku centrach danych i są wykorzystywane do szkolenia AI, badania i modelowanie finansowe.

Całkowita inwestycja Spółki w serwerach wynosi około 1,6 miliarda dolarów, a wydatki operacyjne szacują na 944 mln USD.

Deepseek jest spółką zależną chińskiego funduszu hedgingowego High-Flyer, która odrzuciła start-upa jako odrębny podział koncentrujący się na technologiach AI w 2023 r.. W przeciwieństwie do większości startupów, które wynajmują siłę obliczeniową od dostawców chmur, Deepseek jest właścicielem własnych centrów danych, co daje mu pełną kontrolę nad optymalizacją modelu AI i włączając szybką wdrażanie innowacji. Firma pozostaje finansowana, co pozytywnie wpływa na jego elastyczność i szybkość podejmowania decyzji.

Deepseek Zdjęcie: engame.com

Ponadto niektórzy badacze Deepseek zarabiają ponad 1,3 miliona dolarów rocznie, przyciągając najlepsze talenty wiodących chińskich uniwersytetów (firma nie zatrudniał zagranicznych specjalistów).

Nawet biorąc to pod uwagę, ostatnie twierdzenie Deepseeka o szkolenie najnowszego modelu za jedyne 6 milionów dolarów wydaje się nierealne. Liczba ta odnosi się jedynie do kosztu wykorzystania GPU podczas wstępnego treningu i nie uwzględnia kosztów badań, udoskonalania modelu, przetwarzania danych lub ogólnych kosztów infrastruktury.

Od samego początku Deepseek zainwestował ponad 500 milionów dolarów w rozwój AI. Jednak w przeciwieństwie do większych firm obciążonych biurokracją, kompaktowa struktura Deepseek pozwala jej aktywnie i skutecznie wdrażać innowacje AI.

Deepseek Zdjęcie: engame.com

Przykład Deepseek pokazuje, że dobrze finansowana niezależna firma AI może konkurować z liderami branży. Niemniej jednak eksperci podkreślają, że sukces firmy wynika głównie z miliardów inwestycji, przełomów technicznych i silnego zespołu, podczas gdy twierdzenia o „rewolucyjnym budżecie” dla opracowywania modeli AI są nieco przesadzone.

Mimo to koszty konkurencji pozostają znacznie wyższe. Na przykład porównaj koszty treningu modelowego: Deepseek wydał 5 milionów dolarów na R1, podczas gdy Chatgpt4O kosztował 100 milionów dolarów.

Najnowsze aplikacje