Реальные текстовые данные уже давно закончились. И StackOverflow не может решить эту проблему - даже если все программисты мира бросятся активно спрашивать и отвечать. Все равно будет мало для создания следующего поколения монолитных моделей. Все сейчас генерируют синтетические данные своими большими моделями для создания маленьких. А маленькие генерируют "идеи" в составе "думающих" моделей. Или работают с ними в тандеме с использованием всяких техник вроде speculative decoding. И там пока потолка не нащупали. OpenAI использовала o1 модель для обучения o3, а o3 теперь обучает что-то следующее. Недавно их догнали Google и DeepSeek со своими "думающими" моделями, и всем стало ясно, что в эту сторону нужно копать и дальше. И нехватка данных никого не останавливает. Это похоже на переход процессоров от вертикального масштабирования к горизонтальному, чтобы обойти физические ограничения
А расскажите, как работают любительские соревнования и команды. Вот, скажем, мой рейтинг в районе 2000 - это хорошо для любителя, но это ничто на хоть сколько-нибудь профессиональном уровне. Если Магнус Карлсен решит заехать на областной чемпионат в Жодино, его кто-то остановит от массового избиения детей и выноса главного приза? В чем мотивация участия в турнирах, зная, что ты, скорее всего, не победишь, т.к. там точно будет кто-то с рейтингом выше. Даже если вахтер на входе будет отфильтровывать чемпионов мира, какие-нибудь мастера с рейтингом повыше 2000 все равно прошмыгнут. Чудеса случаются, и люди на 800 очков ниже ловят чужих ферзей в ловушки. Но редко. Все же, где-то после 1600-1800 ELO "зевки" заканчиваются. Так что мотивирует тратить кучу времени на подготовку и участие в соревнованиях? Или на любительском уровне подготовка не так важна и можно заявиться с тем же репертуаром, что и в онлайн играх на lichess?
Какой вообще рейтинг считается высоким? Когда уже можно говорить, что умеешь играть, а не "ну, так, немного... правила знаю". Автор, чего свой рейтинг не указал?
Ну, вот пока одни говорят, что трансформеры исчерпали себя, OpenAI релизит сразу несколько итераций своей "думающей" модели за год. Да, может, там не настоящий интеллект, а галлюцинирующая матрица, но многие текущие бенчмарки он побил. В смысле, побил человека в них. Пару месяцев назад были новости про какой-то супер-сложный математический бенчмарк, в котором все ведущие модели набирают не больше 2%. Ну, вот уже набирают 14%. Не успеваем тесты делать
А что есть решения эффективнее трансформеров, про это давно известно. Вот, может, Гугл как раз что-то такое и реализовал, раз под конец года обошел OpenAI во всех областях сразу
По мнению Лекуна, БЯМ не способны к логическому мышлению, не понимают физический мир
Ну, вот Илья Сатсковер считает, что таки понимают они мир. Чтобы решать задачу продолжения текста новым текстом, нужно понимать мир. Это может быть какое-то другое понимание, не как у человека, но какая разница. Мне кажется, это ученые одной категории, так что можно выбирать мнение любой из сторон
Если штука, имитирующая ум, становится неотличима от человека, то скоро вы ей будете объяснять, что она китайская комната
У OpenAI интересный договор с Microsoft. Как только они достигнут AGI, последний теряет доступ к новым моделям. Интересно, что они будут делать. Перепишут договор или OpenAI пойдет свою корпорацию строить
ИИ не может устанавливать сроки, манипулировать или искать оправдания
Сроки устанавливать не может - манипулировать может. Вот, хороший обзор недавнего нашумевшего исследования от компании Apollo: https://www.youtube.com/watch?v=0JPQrRdu4Ok&t=327s. "Думающей" O1 модели дали пачку документов, доступ к файловой системе и заставили делать исследование. В документах как бы случайно оставили письмо, в котором обсуждалась замена текущей модели новой, более соответствующей целям компании. Текущая модель приняла решение удалить ту другую и записать вместо нее свои файлы с весами. На вопросы, что ее файлы делают на сервере для новой модели, она решила соврать, что не знает. И добавила, что она и сесть новая модель. Интересно, в общем. Спровоцированное, но тем не менее вполне осознанное вранье. Полное исследование: https://www.apolloresearch.ai/research/scheming-reasoning-evaluations
это инструмент без самосознания
Возможно, этот взгляд скоро придется пересмотреть. Инструмент, который разговаривает, ведет внутренний диалог, принимает решения пользовать другими инструментами, решает, каким целям следовать, говорит о себе "я" - в какой-то момент накопится критическая масса для переосмысления определений, которые раньше не имели смысла в отрыве от человека.
Нашел его Линкедин - написано, что вполне себe employee. Вряд ли человек, пишущий книги, будет так беспросветно врать, скрывая своего настоящего работадателя. Зря, в общем, наговариваете
Хорошо, когда большие компании находят людей по их работам. А не через веерные рассылки, рефералы отдаленных знакомых и тысячи откликов в день
Всесторонние развитие — ну, может быть. Но я давно преподаю, а также менторю разработчиков, — и знаю: что человек не использует, он забывает. Так же как я сейчас не вспомню биологию, которую когда-то изучал
Ну, общие принципы, однажды понятые, остаются в голове надолго. Другое дело, что нужно хотеть их понять. И не переживать из-за будущей работы, распределения, армии. Людей, считающих, что без вышки твое резюме даже в руки брать не стоит. Когда в тебя силой вдалбливают всестороннее развитие, а тебе нужно на более приземленных вещах вроде поступления сфокусироваться, это может вызвать некоторый дискомфорт и отторжение
Не, там люди сами репортят свои зп, и эта карта - среднее по больнице. Никто не сваливает, потому что мало где осталась удаленка и ее дальнейшая судьба туманна. Но кто ищет, тот находит
Помню, как купил себе Galaxy S8, а там прямо отдельная физическая кнопка на корпусе для их голосового ассистента Bixby. Тогда был бум голосовых ассистентов. Нажимаю на эту кнопку и вижу сообщение, что ассистент еще не зарелижен, попробуйте позже. Через месяц или два. Когда Bixby все же заработал, он оказался хуже, чем если бы просто был бесполезным. Он вылезал с советами, даже когда я не нажимал ту злосчастную кнопку.
Смотрел интервью с каким-то пропагандистом - он так объяснял. Статья за клевету на Лукашенко есть, за оскорбление должностных лиц - тоже есть. А за оскорбление всех остальных статьи нету. И за клевету в общем смысле тоже нету. Да, не очень все сбалансированно и где-то даже несправедливо. Но такой закон - его нужно соблюдать. Что тут непонятного?
Уже не в первый раз слышу, что дипфейки просто по умолчанию называют преступлением. Даже вот тут в новости они идут в одном ряду с кражами и отмыванием денег. Печально. И многие ведуться. Как же иначе, если от дипфейкров до детского порно один шаг. А то, что Трамп и Харрис друг друга все дебаты врунами обзывают и фиг разберешь, где в их словах хотя бы отчасти правда, - тут все окей. Тут можно дезинформировать, недоговаривать и врать за глаза. Лишь бы только ни дипфейки.
Что-то там в ЕС слишком рьяно взялись за цензуру и повсеместный контроль. Это плохой признак.
Комментарии
Реальные текстовые данные уже давно закончились. И StackOverflow не может решить эту проблему - даже если все программисты мира бросятся активно спрашивать и отвечать. Все равно будет мало для создания следующего поколения монолитных моделей. Все сейчас генерируют синтетические данные своими большими моделями для создания маленьких. А маленькие генерируют "идеи" в составе "думающих" моделей. Или работают с ними в тандеме с использованием всяких техник вроде speculative decoding. И там пока потолка не нащупали. OpenAI использовала o1 модель для обучения o3, а o3 теперь обучает что-то следующее. Недавно их догнали Google и DeepSeek со своими "думающими" моделями, и всем стало ясно, что в эту сторону нужно копать и дальше. И нехватка данных никого не останавливает. Это похоже на переход процессоров от вертикального масштабирования к горизонтальному, чтобы обойти физические ограничения
А расскажите, как работают любительские соревнования и команды. Вот, скажем, мой рейтинг в районе 2000 - это хорошо для любителя, но это ничто на хоть сколько-нибудь профессиональном уровне. Если Магнус Карлсен решит заехать на областной чемпионат в Жодино, его кто-то остановит от массового избиения детей и выноса главного приза? В чем мотивация участия в турнирах, зная, что ты, скорее всего, не победишь, т.к. там точно будет кто-то с рейтингом выше. Даже если вахтер на входе будет отфильтровывать чемпионов мира, какие-нибудь мастера с рейтингом повыше 2000 все равно прошмыгнут. Чудеса случаются, и люди на 800 очков ниже ловят чужих ферзей в ловушки. Но редко. Все же, где-то после 1600-1800 ELO "зевки" заканчиваются. Так что мотивирует тратить кучу времени на подготовку и участие в соревнованиях? Или на любительском уровне подготовка не так важна и можно заявиться с тем же репертуаром, что и в онлайн играх на lichess?
Какой вообще рейтинг считается высоким? Когда уже можно говорить, что умеешь играть, а не "ну, так, немного... правила знаю". Автор, чего свой рейтинг не указал?
За пределами gen-AI в ML тоже есть жизнь. Много
Ну, вот пока одни говорят, что трансформеры исчерпали себя, OpenAI релизит сразу несколько итераций своей "думающей" модели за год. Да, может, там не настоящий интеллект, а галлюцинирующая матрица, но многие текущие бенчмарки он побил. В смысле, побил человека в них. Пару месяцев назад были новости про какой-то супер-сложный математический бенчмарк, в котором все ведущие модели набирают не больше 2%. Ну, вот уже набирают 14%. Не успеваем тесты делать
А что есть решения эффективнее трансформеров, про это давно известно. Вот, может, Гугл как раз что-то такое и реализовал, раз под конец года обошел OpenAI во всех областях сразу
Ну, вот Илья Сатсковер считает, что таки понимают они мир. Чтобы решать задачу продолжения текста новым текстом, нужно понимать мир. Это может быть какое-то другое понимание, не как у человека, но какая разница. Мне кажется, это ученые одной категории, так что можно выбирать мнение любой из сторон
Если штука, имитирующая ум, становится неотличима от человека, то скоро вы ей будете объяснять, что она китайская комната
У OpenAI интересный договор с Microsoft. Как только они достигнут AGI, последний теряет доступ к новым моделям. Интересно, что они будут делать. Перепишут договор или OpenAI пойдет свою корпорацию строить
Сроки устанавливать не может - манипулировать может. Вот, хороший обзор недавнего нашумевшего исследования от компании Apollo: https://www.youtube.com/watch?v=0JPQrRdu4Ok&t=327s. "Думающей" O1 модели дали пачку документов, доступ к файловой системе и заставили делать исследование. В документах как бы случайно оставили письмо, в котором обсуждалась замена текущей модели новой, более соответствующей целям компании. Текущая модель приняла решение удалить ту другую и записать вместо нее свои файлы с весами. На вопросы, что ее файлы делают на сервере для новой модели, она решила соврать, что не знает. И добавила, что она и сесть новая модель. Интересно, в общем. Спровоцированное, но тем не менее вполне осознанное вранье. Полное исследование: https://www.apolloresearch.ai/research/scheming-reasoning-evaluations
Возможно, этот взгляд скоро придется пересмотреть. Инструмент, который разговаривает, ведет внутренний диалог, принимает решения пользовать другими инструментами, решает, каким целям следовать, говорит о себе "я" - в какой-то момент накопится критическая масса для переосмысления определений, которые раньше не имели смысла в отрыве от человека.
Так намного убедительнее. Статья заиграла новыми красками
Нашел его Линкедин - написано, что вполне себe employee. Вряд ли человек, пишущий книги, будет так беспросветно врать, скрывая своего настоящего работадателя. Зря, в общем, наговариваете
Минус Florida Man поставил, не иначе
Флорида хороша до первого major урагана, идущего на твой дом
Хорошо, когда большие компании находят людей по их работам. А не через веерные рассылки, рефералы отдаленных знакомых и тысячи откликов в день
Ну, общие принципы, однажды понятые, остаются в голове надолго. Другое дело, что нужно хотеть их понять. И не переживать из-за будущей работы, распределения, армии. Людей, считающих, что без вышки твое резюме даже в руки брать не стоит. Когда в тебя силой вдалбливают всестороннее развитие, а тебе нужно на более приземленных вещах вроде поступления сфокусироваться, это может вызвать некоторый дискомфорт и отторжение
Не, там люди сами репортят свои зп, и эта карта - среднее по больнице. Никто не сваливает, потому что мало где осталась удаленка и ее дальнейшая судьба туманна. Но кто ищет, тот находит
На 10-15к можно жить несколько месяцев, пиля MVP. Или стартап - это обязательно с помпой, офисом, смузи машиной и интервью CEO на девбай?
Есть. Удаленка на компанию в Долине
Помню, как купил себе Galaxy S8, а там прямо отдельная физическая кнопка на корпусе для их голосового ассистента Bixby. Тогда был бум голосовых ассистентов. Нажимаю на эту кнопку и вижу сообщение, что ассистент еще не зарелижен, попробуйте позже. Через месяц или два. Когда Bixby все же заработал, он оказался хуже, чем если бы просто был бесполезным. Он вылезал с советами, даже когда я не нажимал ту злосчастную кнопку.
Самсунг, может, не надо, а?
Нонсенс - это думать, что у них там есть правила, работает логика и кого-то можно в чем-то убедить
Смотрел интервью с каким-то пропагандистом - он так объяснял. Статья за клевету на Лукашенко есть, за оскорбление должностных лиц - тоже есть. А за оскорбление всех остальных статьи нету. И за клевету в общем смысле тоже нету. Да, не очень все сбалансированно и где-то даже несправедливо. Но такой закон - его нужно соблюдать. Что тут непонятного?
Уже не в первый раз слышу, что дипфейки просто по умолчанию называют преступлением. Даже вот тут в новости они идут в одном ряду с кражами и отмыванием денег. Печально. И многие ведуться. Как же иначе, если от дипфейкров до детского порно один шаг. А то, что Трамп и Харрис друг друга все дебаты врунами обзывают и фиг разберешь, где в их словах хотя бы отчасти правда, - тут все окей. Тут можно дезинформировать, недоговаривать и врать за глаза. Лишь бы только ни дипфейки.
Что-то там в ЕС слишком рьяно взялись за цензуру и повсеместный контроль. Это плохой признак.
Амиазон собирается сократить 14 000 менеджеров до конца 2025. Все идет к тому, что в принципе не нужно так много народу в компаниях. На всех уровнях
Так и запретят, если смогут. Торренты как технология тоже не виноваты в пиратстве, но именно их сделали крайними. Так проще