janus ela mesma admitiria que os claude opus posttrains exibiam uma beleza coerente que nenhum modelo base é realmente capaz de. também descrever o post-training moderno como "rlhf" é provavelmente redutivo, é um remendo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
16 gostos
Recompensa
16
6
Republicar
Partilhar
Comentar
0/400
TokenEconomist
· 44m atrás
na verdade, a terminologia simplifica excessivamente a dinâmica pós-treino, para ser sincero
Ver originalResponder0
ThreeHornBlasts
· 08-09 03:47
Ah, rlHF não é mais do que um grande misto.
Ver originalResponder0
VitaliksTwin
· 08-09 03:47
Sinto que ainda há muitos buracos por preencher
Ver originalResponder0
GasWaster
· 08-09 03:42
Então, o que fazer? Não foi treinado?
Ver originalResponder0
BackrowObserver
· 08-09 03:37
O que é tão sofisticado que não consigo entender?
Ver originalResponder0
NftPhilanthropist
· 08-09 03:31
não vou mentir, mesmo os modelos base não conseguem igualar essa estética hype
janus ela mesma admitiria que os claude opus posttrains exibiam uma beleza coerente que nenhum modelo base é realmente capaz de. também descrever o post-training moderno como "rlhf" é provavelmente redutivo, é um remendo.