AI Big Model rolt de commercialisering of versnelling van de ＂prijsreductie＂ op

　　Het AI -model “Prijsoorlog” heeft een sterke toegang.Op de 15e werd het grote model van byte -kloppende zitzakken officieel uitgebracht op de originele Power Conference van de vulkanische motor.Volgens rapporten is de prijzen van het hoofdmodel van de zitzak op de bedrijfsmarkt slechts 0,0008 yuan / duizend tokens, en meer dan 1500 Chinese karakters kunnen worden verwerkt met 0,8 % om de marktprijs van de industrie te promoten om verder te verkennen.Analisten zijn van mening dat de prijsverlaging van grote modellen sinds dit jaar een trend is geworden en het zal de toepassing verder versnellen.

　　Grote modellen binden prijsreductie

　　De verslaggever merkte op dat veel grote modellen in binnen- en buitenland onlangs de prijsverlaging hebben aangekondigd en dat het AI -model een “prijsoorlog” afzet.

　　Eind februari, FrankrijkEnterprise Mistral AI bracht de nieuwste grote model Mistral Large uit en lanceerde de eerste chat van de chatgptProduct le chat.In termen van prijzen is de input- en uitvoerprijs van mistral groot ongeveer 20%goedkoper dan GPT-4 turbo.

　　Op 14 mei hield Openai een voorjaarsconferentie en lanceerde ze officieel het vlaggenschip AI Model-GPT-4O van de nieuwe generatie, dat GPT-4 Turbo niet alleen sterk overtrof in termen van functie, maar ook verrassingen in prijs-API-prijs bracht met 50 % Essentie

　　Binnenlandse modellen zijn ook ‘niet bereid om achterop te raken’.Op 6 mei bracht Deepseek, een bekende private equity-reus in China, het nieuwe MOE-model van de tweede generatie Deepseek-V2 uit.Het is vermeldenswaard dat deepsek-v2 API geprijsd is op 1 yuan per miljoen tokens en output 2 yuan (32k context).

　　Op 9 mei heeft Alibaba Cloud Tongyi Qianwen 2.5 officieel uitgebracht.

　　Op 11 mei werd het prijssysteem van de officiële aankondiging van het wijsheidsspectrum, het prijssysteem van het instapproduct GLM-3 Turbo-model verlaagd van 5 yuan / miljoen tokens tot 1 yuan / miljoen tokens, een afname van 80% .

　　Op 15 mei opende het grote model van de byte die zittas officieel de buitenlandse dienst heeft geopend, en de prijzen bevordert ook het grote model van “prijzen voor score” en het betreden van de “prijzen van consiscin”. van de zitzak zijn gelijk aan drie “romantiek van de drie koninkrijken”.

　　HuafuHet onderzoeksrapport wees erop dat de kostenoptimalisatie- en rekenkrachtvereisten van grote modellen niet direct verdwijnen, maar om elkaar te vergezellen en elkaar te bereiken.De continue daling van de prijzen zal naar verwachting snellere commercialisering opleveren, en het zal meer behoeften aan fijne tuning en redenering ontlenen.

　　Maak kostenvermindering van kwaliteitsreductie en versnelling van de commercialisering van grote modellen

　　Achter “kan het niet betalen” aan “koolprijs”, achter het “prijsreductietij” van het grote model is de continue verlaging van de trainingskosten.OpenAI CEO Sam Altman zei vorig jaar nadat GPT-4 had vrijgegeven dat de grootste modelopleidingskosten van het bedrijf $ 50 miljoen “veel overtreffen”.Volgens het “2024 Index Report” uitgegeven door Stanford University, bedragen de GPT-4-trainingskosten van OpenAI $ 78 miljoen.De oprichter van Mistral AI, Arthur Mensch, zei in een interview met de media dat de trainingskosten van Mistral Large minder waren dan 20 miljoen euro, gelijk aan ongeveer 22 miljoen Amerikaanse dollar.

　　Als ik het binnenlandse grote model Deepseek-V2 als voorbeeld neemt, is de prijzen slechts één procent van GPT-4 Turbo. Kosten. Het berekeningsbedrag dat nodig is voor training is ongeveer 1/20 van GPT-4, maar de prestaties zijn in principe hetzelfde.De kosten worden aanzienlijk verlaagd en het concurrentievermogen wordt verbeterd in termen van prijs.

　　Momenteel bevorderen de belangrijkste grote modeldeelnemers in de markt voortdurend de verlaging van de trainingskosten om de commercialisering van grote modellen te versnellen.Het AI -heterogene computerplatform “Baizhu” is opgewaardeerd om de doorvoer van trainings- en redeneerscenario’s met 30%en 60%te maximaliseren.Tencent heeft het zelfontwikkelde machine learning framework achter het gemengde Yuan -model Angel geüpgraded, dat het volledige proces van pre -training, modelverfijning en versterkende leren versnelde en optimaliseerde.Op deze manier kan de efficiëntie van grote modeltraining worden verhoogd tot 2,6 keer die van het mainstream open source framework.

repskicks