Anand Bhattad (@anand_bhattad)
2025-03-29 | โค๏ธ 383 | ๐ 81
[1/8] Is scene understanding solved?
We can label pixels and detect objects with high accuracy. But does that mean we truly understand scenes?
Super excited to share our new paper and a new task in computer vision: Visual Jenga!
๐https://arxiv.org/abs/2503.21770 ๐https://visualjenga.github.io/
๐ ์๋ณธ ๋งํฌ
๋ฏธ๋์ด

์์ฝ
์ ๋ ฅ ์ด๋ฏธ์ง์์ ๋ฌผ์ฒด๋ฅผ ํ๋์ฉ ์ ๊ฑฐํ๋ฉด์ ์ฅ๋ฉด์ ์ผ๊ด์ฑ์ ์ ์งํ๋ โVisual Jengaโ ๊ณผ์ ๋ฅผ ์ ์ํ ๋ ผ๋ฌธ์ด๋ค. ์ด๋ฏธ์ง ์์์ฒ๋ผ ์์ธ ๊ทธ๋ฆ์ด ์์ฐจ์ ์ผ๋ก ์ฌ๋ผ์ง๋ ๋ฐ์ฌ์ค์ ์ธํ์ธํ ์ ํตํด, ๊ฐ์ฒด ์ธ์ ์ ํ๋๋ฅผ ๋์ด ์ค์ ์ฅ๋ฉด ์ดํด ์์ค์ ํ๊ฐํ๋ ค๋ ์ ๊ทผ์ด๋ค.