mstdn.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
A general-purpose Mastodon server with a 500 character limit. All languages are welcome.

Administered by:

Server stats:

13K
active users

#openai_o3

0 posts0 participants0 posts today

[Перевод] Как я нашёл уязвимость в ядре Linux при помощи модели o3

В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь API o3 — не потребовались никакая дополнительная настройка, агентские фреймворки и инструменты. Недавно я занимался аудитом уязвимостей ksmbd. ksmbd — это « сервер ядра Linux, реализующий в пространстве ядра протокол SMB3 для передачи файлов по сети ». Я приступил к этому проекту специально для того, чтобы взять отдых от разработки связанных с LLM инструментов, но после релиза o3 не мог избежать искушения и не использовать в качестве небольшого бенчмарка способностей o3 баги, найденные мной в ksmbd. В одном из следующих постов я расскажу о показателях o3 при обнаружении всех этих багов, а сегодня мы поговорим о том, как в процессе моего бенчмаркинга o3 обнаружила уязвимость нулевого дня. Найденной уязвимости присвоили обозначение CVE-2025-37899 (её патч выложен на Github ), это use-after-free в обработчике команды SMB logoff . Для понимания уязвимости необходимо знать о работе конкурентных подключений к серверу и о том, как они в определённых обстоятельствах могут обмениваться различными объектами. Модели o3 удалось разобраться в этом и найти место, где конкретный объект с автоматическим подсчётом ссылок освобождался, но продолжал оставаться доступным для другого потока. Насколько я понимаю, это будет первым публичным рассказом об уязвимости подобного типа, обнаруженной LLM.

habr.com/ru/articles/912916/

ХабрКак я нашёл уязвимость в ядре Linux при помощи модели o3В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь API o3 — не потребовались никакая дополнительная...
#openai_o3#o3#llm

Would you look at all those beautiful lies that o3 produced when tested for accuracy: transluce.org/investigating-o3

"We discovered 71 instances where o3 claims to have run code on an external laptop, including three cases where it claims to use its laptop to mine bitcoin." 🤪

So, OpenAI says o3 is their most powerful reasoning model. Powerful in bullshitting the user that asks how the model came up with the answer, that's for sure.

Continued thread

AI quest for human-level intelligence: OpenAI o3 electrifies researchers
nature.com/articles/d41586-025

* record-breaking performance on science/math wows researchers
* OpenAI chatbot model o3 made headlines Dec 2024
* high score on test that marks progress towards artificial general intelligence (AGI)
* OpenAI o3 scored 87.5%, trouncing prev. best score for an artificial intelligence system of55.5%

www.nature.comHow should we test AI for human-level intelligence? OpenAI’s o3 electrifies questExperimental model’s record-breaking performance on science and maths tests wows researchers.
Continued thread

OpenAI’s Next Big AI Effort, GPT-5, Is Behind Schedule and Crazy Expensive
wsj.com/tech/ai/openai-gpt5-or
nonpaywalled: archive.fo/L7fOF
news.ycombinator.com/item?id=4

* OpenAI ran into problem after problem on its new artificial-intelligence project, code-named Orion
* GPT-5 project, code-named Orion, in works for 18+ mo
* intended as major advancement in tech powering ChatGPT
* limitation: available training data, costs ...

#LLM#AI#AGI
Continued thread

OpenAI 03 LLM: 87.5% High Score on ARC Prize Challenge
old.reddit.com/r/MachineLearni
news.ycombinator.com/item?id=4

* GPT-3 scored 0%
* rare benchmark wh. humans get high scores, LLM low scores
* avg. human performance, ARC-AGI is 85%

OpenAI o3 Breakthrough High Score on ARC-AGI-Pub
arcprize.org/blog/oai-o3-pub-b
arcprize.org/arc-agi-pub

OpenAI o3 beats 99.8% competitive coders
old.reddit.com/r/MachineLearni