Kineski AI gigant troši mnogo manje novca za treniranje AI-ja u odnosu na američke rivale.
Kineska kompanija DeepSeek saopštila je danas da je potrošila svega 294.000 američkih dolara na treniranje svog modela veštačke inteligencija R1, što je daleko manji iznos od onoga što su trošile rivalske američke kompanije.
U članku objavljenom u časopisu “Nature” kompanija je saopštila da je treniranje modela R1 koštalo nešto manje od 300.000 dolara, kao i da je korišćeno 512 čipova H800 kompanije Nvidia.
Dodaje se da kompanija poseduje i A100 čipove, i da ih je koristila u pripremnim fazama razvoja modela R1.
“Koristili smo A100 GPU modele za eksperimente s manjim modelom, a nakon te faze , R1 je obučen tokom 80 sati na klasteru od 512 čipova H800”, navodi se u saopštenju.
Zvaničnici Sjedinjenih Američkih Država u junu su potvrdili da DeepSeek ima pristup velikim količinama H100 čipova koji su nabavljeni nakon što su SAD uvele kontrolu izvoza čipova u Kinu.
Nvidia je u slično vreme saopštial da je DeepSeek koristio legalno stečene H800 čipove, a ne H100.
Izvršni direktor rivalske američke kompanije OpenAI Sem Altman rekao je 2023. da je osnovna obuka njihovog modela ChatGPT koštala “mnogo više od 100 miliona dolara”.
Foto: mundissima / Shutterstock.com
Izvor: B92