МОСКВА, 18 окт - РИА Новости. Компания Meta* представила метод Self-Taught Evaluator, позволяющий генеративной модели на основе искусственного интеллекта самостоятельно обучаться без вмешательства человека, сообщается в пресс-релизе компании.
"Итак, мы выпустили Self-Taught Evaluator - новый метод генерации синтетических данных предпочтений для модели вознаграждения, не основываясь на комментариях человека", - говорится в сообщении.
Моделирование вознаграждения - это подход машинного обучения искусственного интеллекта на основе обратной связи, оценки или подсказки.
Из релиза Meta* следует, что новый подход включает в себя процесс выстраивания логических цепочек на основе непрерывной схемы самосовершенствования модели.
Кроме того, компания сообщила о выпуске генеративной модели вознаграждения на основе прямой оптимизации предпочтений в инструменте машинного обучения RewardBench, обученной на данных без использования пояснений человека.
Компания Facebook* в 2021 году объявила о переименовании в Meta*. Ее создатель Марк Цукерберг заявил, что новый бренд делает акцент на метавселенной, где человек откажется от экранов и будет испытывать эффект присутствия в виртуальной реальности.
* Деятельность Meta (соцсети Facebook и Instagram) запрещена в России как экстремистская.