stux @stux

0 posts0 participants0 posts today

**Habr** @habr@zhub.link · May 27

[Перевод] Как я нашёл уязвимость в ядре Linux при помощи модели o3

В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь API o3 — не потребовались никакая дополнительная настройка, агентские фреймворки и инструменты. Недавно я занимался аудитом уязвимостей ksmbd. ksmbd — это « сервер ядра Linux, реализующий в пространстве ядра протокол SMB3 для передачи файлов по сети ». Я приступил к этому проекту специально для того, чтобы взять отдых от разработки связанных с LLM инструментов, но после релиза o3 не мог избежать искушения и не использовать в качестве небольшого бенчмарка способностей o3 баги, найденные мной в ksmbd. В одном из следующих постов я расскажу о показателях o3 при обнаружении всех этих багов, а сегодня мы поговорим о том, как в процессе моего бенчмаркинга o3 обнаружила уязвимость нулевого дня. Найденной уязвимости присвоили обозначение CVE-2025-37899 (её патч выложен на Github ), это use-after-free в обработчике команды SMB logoff . Для понимания уязвимости необходимо знать о работе конкурентных подключений к серверу и о том, как они в определённых обстоятельствах могут обмениваться различными объектами. Модели o3 удалось разобраться в этом и найти место, где конкретный объект с автоматическим подсчётом ссылок освобождался, но продолжал оставаться доступным для другого потока. Насколько я понимаю, это будет первым публичным рассказом об уязвимости подобного типа, обнаруженной LLM.

https://habr.com/ru/articles/912916/

ХабрКак я нашёл уязвимость в ядре Linux при помощи модели o3В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь API o3 — не потребовались никакая дополнительная...

#openai_o3 #o3 #llm

**Jukka Niiranen** @jukkan · Apr 17

Apr 17

Jukka Niiranen @jukkan

Would you look at all those beautiful lies that o3 produced when tested for accuracy: https://transluce.org/investigating-o3-truthfulness

"We discovered 71 instances where o3 claims to have run code on an external laptop, including three cases where it claims to use its laptop to mine bitcoin."

So, OpenAI says o3 is their most powerful reasoning model. Powerful in bullshitting the user that asks how the model came up with the answer, that's for sure.

#openai_o3 #OpenAI

**gihyo.jp** @gihyo@rss-mstdn.studiofreesia.com · Apr 17

Apr 17

gihyo.jp @gihyo@rss-mstdn.studiofreesia.com

OpenAI o3、o4-miniを発表 ―ChatGPT内のすべてのツールを組み合わせてエージェントとして利用可能に
https://gihyo.jp/article/2025/04/openai-o3-o4-mini?utm_source=feed

gihyo.jp · Apr 17OpenAI o3、o4-miniを発表 ―ChatGPT内のすべてのツールを組み合わせてエージェントとして利用可能に | gihyo.jpOpenAIは2025年4月17日、推論モデルの新バージョンOpenAI o3とo4-miniを発表した。

#gihyo #技術評論社 #gihyo_jp

Continued thread

**Victoria Stuart** @persagen@mastodon.social · Jan 14

Jan 14

Victoria Stuart @persagen@mastodon.social

AI quest for human-level intelligence: OpenAI o3 electrifies researchers
https://www.nature.com/articles/d41586-025-00110-6

* record-breaking performance on science/math wows researchers
* OpenAI chatbot model o3 made headlines Dec 2024
* high score on test that marks progress towards artificial general intelligence (AGI)
* OpenAI o3 scored 87.5%, trouncing prev. best score for an artificial intelligence system of55.5%

www.nature.comHow should we test AI for human-level intelligence? OpenAI’s o3 electrifies questExperimental model’s record-breaking performance on science and maths tests wows researchers.

#LLM #OpenAI #OpenAI_o1

**Norbert Reithinger** @norbertreithinger@sigmoid.social · Dec 23, 2024

Dec 23, 2024

Norbert Reithinger @norbertreithinger@sigmoid.social

Great analysis by @melaniemitchell

https://aiguide.substack.com/p/did-openai-just-solve-abstract-reasoning

AI: A Guide for Thinking Humans · Dec 23, 2024Did OpenAI Just Solve Abstract Reasoning?By Melanie Mitchell

#llm #agi #chatgpt

Continued thread

**Victoria Stuart** @persagen@mastodon.social · Dec 22, 2024

Dec 22, 2024

Victoria Stuart @persagen@mastodon.social

OpenAI’s Next Big AI Effort, GPT-5, Is Behind Schedule and Crazy Expensive
https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693
nonpaywalled: https://archive.fo/L7fOF
https://news.ycombinator.com/item?id=42485938

* OpenAI ran into problem after problem on its new artificial-intelligence project, code-named Orion
* GPT-5 project, code-named Orion, in works for 18+ mo
* intended as major advancement in tech powering ChatGPT
* limitation: available training data, costs ...

#LLM #AI #AGI

**窓の杜** @forest_watch_impress@rss-mstdn.studiofreesia.com · Dec 22, 2024

Dec 22, 2024

窓の杜 @forest_watch_impress@rss-mstdn.studiofreesia.com

OpenAI、次世代AIモデル「OpenAI o3」を発表～世界トッププログラマーを凌ぐ能力／コーディング、数学、科学的推論で飛躍的な改善
https://forest.watch.impress.co.jp/docs/news/1649667.html

窓の杜 · Dec 22, 2024OpenAI、次世代AIモデル「OpenAI o3」を発表～世界トッププログラマーを凌ぐ能力　米OpenAIは12月21日（現地時間）「OpenAI o3」を発表した。12日間にわたり行われてきたイベント「12 Days of OpenAI」の最後を飾るアナウンスは、同社の次世代AIモデルだった。

#forest_watch_impress #OpenAI #o3

**AM TechHive** @amtechhive@mastodon.social · Dec 21, 2024

Dec 21, 2024

AM TechHive @amtechhive@mastodon.social

NEW OpenAI GPT-o3 is SCARY
#openai #openai_o3
Learn More: https://amtechhive.com/openai-reveals-o3-reasoning-ai-model

video credit: @juliangoldieseo

Continued thread

**Victoria Stuart** @persagen@mastodon.social · Dec 20, 2024 *

Dec 20, 2024 *

Victoria Stuart @persagen@mastodon.social

OpenAI 03 LLM: 87.5% High Score on ARC Prize Challenge
https://old.reddit.com/r/MachineLearning/comments/1hiq3tz/d_openai_o3_875_high_score_on_arc_prize_challenge
https://news.ycombinator.com/item?id=42473321

* GPT-3 scored 0%
* rare benchmark wh. humans get high scores, LLM low scores
* avg. human performance, ARC-AGI is 85%

OpenAI o3 Breakthrough High Score on ARC-AGI-Pub
https://arcprize.org/blog/oai-o3-pub-breakthrough
https://arcprize.org/arc-agi-pub

OpenAI o3 beats 99.8% competitive coders
https://old.reddit.com/r/MachineLearning/comments/1hiqptc/openais_o3_beats_998_competitive_coders_d

OpenAI o3 87.5% High Score on ARC Prize Challenge
https://old.reddit.com/r/MachineLearning/comments/1hiq3tz/d_openai_o3_875_high_score_on_arc_prize_challenge/

* benchmark on which GPT-3 scoring 0%

OpenAI o3 Breakthrough High Score on ARC-AGI-Pub
https://arcprize.org/blog/oai-o3-pub-breakthrough
https://arcprize.org/arc-agi-pub

OpenAI's O3 beats 99.8% competitive coders
https://old.reddit.com/r/MachineLearning/comments/1hiqptc/openais_o3_beats_998_competitive_coders_d

#LLM #OpenAI #OpenAI_o1 #OpenAI_o3 #GPT4o #ML #TransformerArchitecture #reasoning #COT #ChainOfThought #AGI #AI

#LLM #OpenAI #OpenAI_o1

**Victoria Stuart** @persagen@mastodon.social · Dec 20, 2024

Dec 20, 2024

Victoria Stuart @persagen@mastodon.social

[thread] OpenAI o1, o3 | OpenAI GPT-4o
https://en.wikipedia.org/wiki/OpenAI_o1

* generative pre-trained transformer
* form. known within OpenAI as “Q*"
* o1 spends time "thinking" before it answers
* makes it better at complex reasoning tasks, science & programming than OpenAI GPT-4o
* full v. was released 2024-Dec-05

en.wikipedia.orgOpenAI o1 - Wikipedia

#LLM #OpenAI #OpenAI_o1

Recent searches

Search options

Administered by:

Server stats:

#openai_o3