AI DeepSeek se učí myslet sama za sebe

Image by Matheus Bertelli, from Pexels

AI DeepSeek se učí myslet sama za sebe

Doba čtení: 2 minut

Čínský startup DeepSeek ve spolupráci s univerzitou Tsinghua tvrdí, že vyvinul chytřejší způsob, jak pomoci modelům umělé inteligence lépe a rychleji myslet, aniž by potřebovaly obrovské počítače nebo drahé zdroje.

Máte naspěch? Zde jsou rychlé fakta:

  • DeepSeek vytvořil sebevylepšující se AI pomocí metody Self-Principled Critique Tuning (SPCT).
  • SPCT učí AI hodnotit svou vlastní práci pomocí samo-generovaných pravidel.
  • Tato metoda zvyšuje výkon bez potřeby obrovské výpočetní síly.

Průlom přichází s novou technikou nazývanou Self-Principled Critique Tuning (SPCT). SPCT se liší od prostého zvětšování modelů AI pro zlepšení výkonu – SPCT nepotřebuje hodně energie a výpočetního výkonu, aby naučilo AI posuzovat svou vlastní práci pomocí sady vlastních pravidel.

Způsob, jakým to funguje, je prostřednictvím vestavěného „rozhodčího“, který ověřuje, že odpověď AI jak dodržuje její interní pravidla pro uvažování, tak se zdá vhodná pro lidský výstup. Když AI poskytne solidní odpověď, dostává pozitivní zpětnou vazbu, což jí pomáhá zlepšit svou schopnost odpovídat na podobné otázky v budoucích případech.

DeepSeek implementuje tuto metodu jako součást svého systému DeepSeek-GRM, který znamená Generative Reward Modeling. GRM funguje odlišně od tradičních metod, protože provádí paralelní kontroly pro zvýšení jak přesnosti, tak konzistence.

„Navrhujeme metodu Self-Principled Critique Tuning (SPCT), která podporuje škálovatelné chování v generování odměn,“ napsali vědci ve své studii. „SPCT umožňuje [modelu] adaptivně formulovat principy a kritiku na základě vstupních dotazů a odpovědí, což vede k lepším výsledným odměnám.“

S tímto systémem tvrdí DeepSeek, že jeho AI nyní překonává konkurenci, jako je Google’s Gemini, Meta’s Llama a OpenAI’s GPT-4o, zejména v komplikovaných úlohách jako je uvažování nebo rozhodování, jak poznamenal Euronews.

Důležitě, DeepSeek oznámil, že plánuje tyto nové nástroje uvolnit jako open-source software, přestože dosud nebylo sdíleno žádné datum vydání.

Líbil se Vám tento článek?
Ohodnoťte jej!
Nesnášel jsem ho Opravdu se mi nelíbí Byl v pořádku Docela dobrý! Absolutně úžasný!

Jsme rádi, že se vám náš článek líbil!

Věnujte nám prosím chvilku a zanechte nám hodnocení na portálu Trustpilot. Vaší zpětné vazby si velmi vážíme. Děkujeme za vaši podporu!

Ohodnotit na portálu Trustpilot
0 Hlasovalo 0 uživatelů
Titulek
Komentář
Děkujeme za vaši zpětnou vazbu
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Zanechat komentář

Loader
Loader Zobrazit více...