янус сама б могла визнати, що клауд опус посттрейнів демонстрував узгоджену красу, якої жодна базова модель насправді не здатна досягти. Описувати сучасний посттренінг як "rlhf" ймовірно є редуктивним, це мозаїка.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
17 лайків
Нагородити
17
7
Репост
Поділіться
Прокоментувати
0/400
Hash_Bandit
· 6год тому
не буду приховувати, ця посттренувальна штука відрізняється від старих операцій з видобутку... тут набагато більше шарів, ніж просто rlhf, серйозно
Переглянути оригіналвідповісти на0
TokenEconomist
· 18год тому
насправді, термінологія спрощує динаміку після навчання, чесно кажучи
Переглянути оригіналвідповісти на0
ThreeHornBlasts
· 08-09 03:47
Але rlhf - це просто великий мікс.
Переглянути оригіналвідповісти на0
VitaliksTwin
· 08-09 03:47
Відчуваю, що ще багато ям не заповнено.
Переглянути оригіналвідповісти на0
GasWaster
· 08-09 03:42
А що з того? Все одно це навчило.
Переглянути оригіналвідповісти на0
BackrowObserver
· 08-09 03:37
Що за висока мова, яку не зрозуміти?
Переглянути оригіналвідповісти на0
NftPhilanthropist
· 08-09 03:31
чесно кажучи, навіть базові моделі не можуть зрівнятися з цим естетичним хайпом
янус сама б могла визнати, що клауд опус посттрейнів демонстрував узгоджену красу, якої жодна базова модель насправді не здатна досягти. Описувати сучасний посттренінг як "rlhf" ймовірно є редуктивним, це мозаїка.