Kineski DeepSeek objavio je danas novu verziju svog V3 modela koji, prema tvrdnjama kompanije, donosi značajna unapređenja u performansama i fleksibilnosti.
List SCMP je primetio da je kompanija uklonila reference na R1 model iz funkcije “duboko razmišljanje” svog četa, što je izazvalo spekulacije o novom odlaganju dugo očekivanog R2 modela.
Takođe, FT je prošle nedelje objavio, pozivajući se na tri anonimna upućena izvora, da je odlaganje lansiranja modela R2 posledica tehničkih problema sa Huawei čipovima Ascend.
Prema navodima izvora, firma DeepSeek je bila primorana da promeni pristup – za obuku koristi čipove američke firme Nvidia, dok su huawei čipovi namenjeni fazi inferencije (izvođenju zaključaka), koja zahteva manju procesorsku snagu od same obuke.
Prvobitno planirano lansiranje modela R2 u maju sada je pomereno, a novi zvaničan datum još nije objavljen.