Janus misma admitiría que los claude opus posttrains exhibieron una belleza coherente que ningún modelo base es realmente capaz de. También describir el entrenamiento posterior moderno como "rlhf" es probablemente reductivo, es un trabajo de parches.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
17 me gusta
Recompensa
17
6
Republicar
Compartir
Comentar
0/400
TokenEconomist
· hace4h
de hecho, la terminología simplifica en exceso la dinámica post-entrenamiento, para ser honesto
Ver originalesResponder0
ThreeHornBlasts
· 08-09 03:47
Ah, rlHF solo es un gran revuelto.
Ver originalesResponder0
VitaliksTwin
· 08-09 03:47
Siento que aún hay muchos agujeros por llenar
Ver originalesResponder0
GasWaster
· 08-09 03:42
¿Y qué se le va a hacer? No es más que algo que se ha aprendido.
Ver originalesResponder0
BackrowObserver
· 08-09 03:37
¿Qué es tan elegante que no puedo entender?
Ver originalesResponder0
NftPhilanthropist
· 08-09 03:31
no voy a mentir, incluso los modelos básicos no pueden igualar ese hype estético
Janus misma admitiría que los claude opus posttrains exhibieron una belleza coherente que ningún modelo base es realmente capaz de. También describir el entrenamiento posterior moderno como "rlhf" es probablemente reductivo, es un trabajo de parches.