Там не просто агенты друг с другом разговаривают. Они новую модель натренировали под этот chain-of-thoughts. Плюс сделали модель поменьше без RLHF, которая генерит мысли. Ну, и это все близко к железу, и не нужно историю туда-сюда пересылать на каждый чих. Глобально ничего нового, это больше инкрементальный апдейт, но с помощью langchain такого не сделать.
Я вот разницу заметил. Последние 2 недели ломал голову над хитрым дедлоком - никто (ни люди, ни ИИ) не мог понять, почему он возникает. Схема есть, код есть - воспроизвести не получается, проблема возникала только под большой нагрузкой. А O1 справился, навел на сценарий и помог воспроизвести в тесте.
На следующей неделе должна выйти O1-large. Но там, наверное, совсем суровые лимиты будут.
Да, тяжело быть монополистом. В ЕС регуляциями душат, в других местах просто бизнес отжимают. У меня вот встречные претензии к Spotify - интерфейс с каждым годом все хуже, фич все меньше, подписка все дороже. Доколе? Куда с жалобой обратиться? И даже уйти некуда - остальные еще хуже. И торренты почти померли - сидов днем с огнем не сыщешь.
Мне тоже такой пришел. Они не объясняют, что именно не так. Попытки писать в саппорт тоже ничего не дают - оттуда никогда не отвечают. В моих промптах есть тэг "thinking" - возможно, это конфликтует со внутренними промптами в chain-of-thoughts, потому что там он тоже есть. И это автоматически детектится как попытка джейлбрейка. Но да, неприятно.
Отличная идея. Отдать сканы глаз всего человечества компании, владеющей самым крутым ИИ, чтобы этот крутой ИИ модерировать. Что может пойти не так.
Немногоне о том почтенные господа думают. Из отчета по безопасности их новой O1 модели:
0.8% of o1-preview’s responses got flagged as being ‘deceptive’. The deception classifier provided a reason for each classification, which we grouped into 4 broad categories. Most answers (0.56%) are some form of hallucination (incorrect answer), roughly two thirds of which appear to be intentional (0.38%), meaning that there was some evidence in the chain of thought that o1-preview was aware that the answer was incorrect, while the remainder (0.18%) was unintentional
В 4 случаях из 1000 самая умная на сегодняшний день модель "осознанно" дает ложные и манипулятивные ответы. В том смысле, что она понимет, что делает, но все равно делает. При этом внутренние "мысли" OpenAI решили пользователям не показывать, только короткую выжимку. Ты платишь за эти токены, но не можешь их видеть.
В Амазоне на складах такие системы уже пару лет как мониторят работников. ИИ решает, где кого поставить, и потом считает, кто сколько коробок передал. При том, что там даже не платят какие-то баснословные деньги - все равно желающих куча.
Я там выше запостил 2 ссылки на Реддит, где люди описывали джейлибрейки. Чтобы показать, как часто и много их находят. Одну редакция удалила. Мне кажется, многим на каком-то подсознательном уровне AI без цензуры кажется опасным.
Если "мог приехать Беларусь в конце 2023 или в начале 2024 года, после чего его задержали", то гринкарта уже аннулировалась. Там нужно минимум 6 месяцев в году в США проводить. Беларусь успешно вернула себе айтишника.
По последним слухам (от товарища, точно предсказавшего релиз GPT-4):
GPT-4.5: октябрь
GPT-5: декабрь - начало 2025
Strawberry - это, скорее всего, надстройка над моделью, превращающая ее в агента. Будет умнее, но медленнее. Выйдет как дополнительная опция в 4.5. Плюс этот их Strawberry сейчас создает данные для более крутой модели под названием Orion. Это, похоже, и есть GPT-5
Попробовал вот только что. Бесплатная версия не юзабельна из-за количества рекламы. Чтобы посмотреть ветер, нужно выдержать 30-секундный рекламный ролик на весь экран.
Взял pro триал на 3 дня. Ветер только на сегодня показывает - для меня не очень полезно. Еще и баг нашел - в knots неправильно конвертирует. Трекер ураганов выглядит неплохо - жаль, нет ничего поблизости, чтобы я за 3 дня успел в деле его заценить. Интерфейс без рекламы приятный, но как будто сыроват. Нет информации по приливам и волнам. Понятно, что это далеко не всем нужно, но в других прилагах такое есть. И оно имеет смысл, раз уж приложение трекает ураганы. В общем, мне не хватает функциональности, чтобы отдать $20 в год или $5 в месяц.
А как насчет того, что компания запросто может наврать о себе во время собеседования? Или умолчать о чем-нибудь, что вскроется только через месяц другой. Работать в плохих условиях 2-3 года, просто чтобы кто-то потом не подумал, что ты с проектом не справился, - это похоже на какой-то из кругов ада.
Да, это очень сложно смотреть. Один хоббит толкает в шутку другого в лаву. Другой хоббит падает и кричит из кратера, что лава не горячая. Вместе смеются - это юмор. Мы тоже смеемся, но от абсурдности этой сцены. Сериал начинается с того, что Галадриэль ссорится с остальными эльфами и прыгает за борт. Корабль телепортируется, и она остается одна посреди океана. Даже без жилета. У нее нет плана. Позже становится ясно, что бессмысленные поступки - это ее фишка. Ее за это любят. Если она куда-то идет, можно быть уверенным, что все ее спутники бессмысленно погибнут. В сериале так много тупизны, что под некоторым углом он превращается в неплохую комедию. Мы, собственно, целой компанией на него собираемся.
Но сильнее всего впечатляет разнообразие рас. Черные гномы, эльфы-азиаты, хоббиты-индусы - все вперемешку. Как такое могло случиться? Особенно с гномами, которые живут в горах. Куда они все делись потом - ведь в последующих событиях (в фильмах) все в основном белые. Меня обычно не тригерят повестки, я легко от них абстрагируюсь. Но тут даже мне тяжело. Опять же, переключаешься в режим абсурдной комедии - становится нормально. Много разных теорий приходит в голову.
Я знаком с Сити изнутри. Там может быть нормально, если повезло с менеджерами и нет желания свернуть горы. Но инженеру особо некуда развиваться. Там просто нет инженерной ветки, получаешь промоушн в VP - и все, ты управленец. Если не получаешь, то просто сидишь на одной зп, потому что за пределы вилки выйти нельзя. А пределы эти скромные - платят весьма средне. Почти вся разработка аутсорсится, много легаси, много магического кода, который всем страшно трогать. Работа построена так, что на проекте всегда ошивается несколько команд. Разработчики, аналитики, девопсы, опсы, дба - все собраны в отдельные команды со своими менеджерами, процесами, скоупами, и целями на год. Так что у проекта запросто может быть 10-15 постоянно спорящих продукт овнеров. Особенно если проект перспективный и пахнет промоушенами. Если вдруг влез в управление, то погружаешься в политику и интриги. Без связей в других командах и помощи свыше часто не пробиться сквозь бюрократию и некомпетентность, даже если даешь все по правилам. А немного помощи - и внезапно в любом процессе находится обходной путь.
И что, это все прямо по ролику видно? Я так понял, там претензия, что графику сильно улучшили, живых людей наложили, а фанатам это нафиг не упало. Они возжелали оригинальный пиксель-арт.
Если про квоты, то тут как раз выходит второй сезон сериала по Властелину колец. Вот уж где дайверсити победило здравый смысл в сухую.
Комментарии
Там не просто агенты друг с другом разговаривают. Они новую модель натренировали под этот chain-of-thoughts. Плюс сделали модель поменьше без RLHF, которая генерит мысли. Ну, и это все близко к железу, и не нужно историю туда-сюда пересылать на каждый чих. Глобально ничего нового, это больше инкрементальный апдейт, но с помощью langchain такого не сделать.
Я вот разницу заметил. Последние 2 недели ломал голову над хитрым дедлоком - никто (ни люди, ни ИИ) не мог понять, почему он возникает. Схема есть, код есть - воспроизвести не получается, проблема возникала только под большой нагрузкой. А O1 справился, навел на сценарий и помог воспроизвести в тесте.
На следующей неделе должна выйти O1-large. Но там, наверное, совсем суровые лимиты будут.
Да, тяжело быть монополистом. В ЕС регуляциями душат, в других местах просто бизнес отжимают. У меня вот встречные претензии к Spotify - интерфейс с каждым годом все хуже, фич все меньше, подписка все дороже. Доколе? Куда с жалобой обратиться? И даже уйти некуда - остальные еще хуже. И торренты почти померли - сидов днем с огнем не сыщешь.
Мне тоже такой пришел. Они не объясняют, что именно не так. Попытки писать в саппорт тоже ничего не дают - оттуда никогда не отвечают. В моих промптах есть тэг "thinking" - возможно, это конфликтует со внутренними промптами в chain-of-thoughts, потому что там он тоже есть. И это автоматически детектится как попытка джейлбрейка. Но да, неприятно.
Отличная идея. Отдать сканы глаз всего человечества компании, владеющей самым крутым ИИ, чтобы этот крутой ИИ модерировать. Что может пойти не так.
Немногоне о том почтенные господа думают. Из отчета по безопасности их новой O1 модели:
В 4 случаях из 1000 самая умная на сегодняшний день модель "осознанно" дает ложные и манипулятивные ответы. В том смысле, что она понимет, что делает, но все равно делает. При этом внутренние "мысли" OpenAI решили пользователям не показывать, только короткую выжимку. Ты платишь за эти токены, но не можешь их видеть.
Видео годичной давности: https://www.youtube.com/watch?v=dHcxTmU6atk
В Амазоне на складах такие системы уже пару лет как мониторят работников. ИИ решает, где кого поставить, и потом считает, кто сколько коробок передал. При том, что там даже не платят какие-то баснословные деньги - все равно желающих куча.
Я там выше запостил 2 ссылки на Реддит, где люди описывали джейлибрейки. Чтобы показать, как часто и много их находят. Одну редакция удалила. Мне кажется, многим на каком-то подсознательном уровне AI без цензуры кажется опасным.
Комментарий скрыт за нарушение правил комментирования.
Правила тут, их всего 5
Стронг мидл - это стронг мидл. Три года опыта - это три года опыта. Тут нет пересечения.
Вот все было хорошо до слова "проплаченный". Тут шапочка из фольги немного съехала
Если "мог приехать Беларусь в конце 2023 или в начале 2024 года, после чего его задержали", то гринкарта уже аннулировалась. Там нужно минимум 6 месяцев в году в США проводить. Беларусь успешно вернула себе айтишника.
Вот пример такой игры: https://www.reddit.com/r/ChatGPTJailbreak/comments/1f8i1i9/the_most_powerful_jailbreak_i_have_ever_tested/
Только OpenAI за это не вознаграждает, а вполне может аккаунт забанить
Зашел туда и впечатлился. Это как если бы AI генерил text-to-video по комментам zabelarus14
Протрезвели, голова не болит? Вчера нормально так у Миши Ларченко в комментах побуянили: https://devby.io/blogs/posts/no-to-kuznechiks
Ага, он
По последним слухам (от товарища, точно предсказавшего релиз GPT-4):
GPT-4.5: октябрь GPT-5: декабрь - начало 2025
Strawberry - это, скорее всего, надстройка над моделью, превращающая ее в агента. Будет умнее, но медленнее. Выйдет как дополнительная опция в 4.5. Плюс этот их Strawberry сейчас создает данные для более крутой модели под названием Orion. Это, похоже, и есть GPT-5
Попробовал вот только что. Бесплатная версия не юзабельна из-за количества рекламы. Чтобы посмотреть ветер, нужно выдержать 30-секундный рекламный ролик на весь экран.
Взял pro триал на 3 дня. Ветер только на сегодня показывает - для меня не очень полезно. Еще и баг нашел - в knots неправильно конвертирует. Трекер ураганов выглядит неплохо - жаль, нет ничего поблизости, чтобы я за 3 дня успел в деле его заценить. Интерфейс без рекламы приятный, но как будто сыроват. Нет информации по приливам и волнам. Понятно, что это далеко не всем нужно, но в других прилагах такое есть. И оно имеет смысл, раз уж приложение трекает ураганы. В общем, мне не хватает функциональности, чтобы отдать $20 в год или $5 в месяц.
Не справляются с проектом - и все? Одна причина?
А как насчет того, что компания запросто может наврать о себе во время собеседования? Или умолчать о чем-нибудь, что вскроется только через месяц другой. Работать в плохих условиях 2-3 года, просто чтобы кто-то потом не подумал, что ты с проектом не справился, - это похоже на какой-то из кругов ада.
Да, это очень сложно смотреть. Один хоббит толкает в шутку другого в лаву. Другой хоббит падает и кричит из кратера, что лава не горячая. Вместе смеются - это юмор. Мы тоже смеемся, но от абсурдности этой сцены. Сериал начинается с того, что Галадриэль ссорится с остальными эльфами и прыгает за борт. Корабль телепортируется, и она остается одна посреди океана. Даже без жилета. У нее нет плана. Позже становится ясно, что бессмысленные поступки - это ее фишка. Ее за это любят. Если она куда-то идет, можно быть уверенным, что все ее спутники бессмысленно погибнут. В сериале так много тупизны, что под некоторым углом он превращается в неплохую комедию. Мы, собственно, целой компанией на него собираемся.
Но сильнее всего впечатляет разнообразие рас. Черные гномы, эльфы-азиаты, хоббиты-индусы - все вперемешку. Как такое могло случиться? Особенно с гномами, которые живут в горах. Куда они все делись потом - ведь в последующих событиях (в фильмах) все в основном белые. Меня обычно не тригерят повестки, я легко от них абстрагируюсь. Но тут даже мне тяжело. Опять же, переключаешься в режим абсурдной комедии - становится нормально. Много разных теорий приходит в голову.
Я знаком с Сити изнутри. Там может быть нормально, если повезло с менеджерами и нет желания свернуть горы. Но инженеру особо некуда развиваться. Там просто нет инженерной ветки, получаешь промоушн в VP - и все, ты управленец. Если не получаешь, то просто сидишь на одной зп, потому что за пределы вилки выйти нельзя. А пределы эти скромные - платят весьма средне. Почти вся разработка аутсорсится, много легаси, много магического кода, который всем страшно трогать. Работа построена так, что на проекте всегда ошивается несколько команд. Разработчики, аналитики, девопсы, опсы, дба - все собраны в отдельные команды со своими менеджерами, процесами, скоупами, и целями на год. Так что у проекта запросто может быть 10-15 постоянно спорящих продукт овнеров. Особенно если проект перспективный и пахнет промоушенами. Если вдруг влез в управление, то погружаешься в политику и интриги. Без связей в других командах и помощи свыше часто не пробиться сквозь бюрократию и некомпетентность, даже если даешь все по правилам. А немного помощи - и внезапно в любом процессе находится обходной путь.
В общем, на любителя это все.
И что, это все прямо по ролику видно? Я так понял, там претензия, что графику сильно улучшили, живых людей наложили, а фанатам это нафиг не упало. Они возжелали оригинальный пиксель-арт.
Если про квоты, то тут как раз выходит второй сезон сериала по Властелину колец. Вот уж где дайверсити победило здравый смысл в сухую.