آنچه درباره‌ی سخت‌افزار کنسول نسل بعدی نینتندو می‌دانیم

آنچه درباره‌ی سخت‌افزار کنسول نسل بعدی نینتندو می‌دانیم

خیلی وقت پیش، در ژوئن سال ۲۰۲۱، لیکری با نام مستعار kopite7kimi که به‌خاطر درز دادن اطلاعات تکنولوژی‌های جدید معروف است، تصویری پرجزییات از پردازنده‌ی T234 انویدیا منتشر کرد. و برای اولین بار معلوم شد نینتندو هم قرار است نسخه‌ی ویرایش‌شده‌ای از همین پردازنده به نام T239 را برای کنسول بعدی‌اش استفاده کند. بعد از دو سال، شواهد خیلی بیشتری منتشر شد که نشان می‌داد این شایعات حقیقت داشتند. T239 یک پردازنده‌ی قابل‌حمل(۱) است که بر سی‌پی‌یوی هشت هسته‌ای ARM A78C سوار شده، به اضافه‌ی یک واحد گرافیکی مخصوص بر اساس معماری سری کارت‌های RTX-30 انویدیا که به نام آمپر/Ampere شناخته می‌شوند. ریزمعماری/Microarchitecture آن نیز برخی از ویژگی‌های آخرین جی‌پی‌یوهای لاولیس/Lovelace را برگردانده و یک انجین فشرده‌زدای(۲)  کاملا جدید به آن اضافه کرده است. اینکه این پردازنده از ای‌پی‌آی(۳) خاص کنسول استفاده می‌کند هم دوباره مهر تاییدی است بر اینکه در کنسول نسل بعدی نینتندو سوییچ استفاده خواهد شد.

در این مقاله، درباره‌ی شواهد مختلفی خواهیم نوشت که رابطه‌ی بین پردازنده‌ی T239 و نینتندو را نشان می‌دهند. همچنین یک جی‌پی‌یوی قابل‌حمل که از نظر سخت‌افزاری قدرت مشابهی با این پردازنده داشته باشد را شدیدا داون‌کلاک می‌کنیم تا ببینیم یک کارت گرافیکی مبتنی بر معماری آمپرِ کم‌قدرت چه توانایی‌هایی دارد، و مثلا آیا می‌تواند ری تریسینگ را اجرا کند و آپ‌اسکیلینگ با DLSS برای کنسول هیبریدی نسل بعدی نینتندو چقدر اهمیت دارد. در پایان خواهیم دید آیا تحلیل ما با اطلاعات پراکنده‌ای که از سوییچ ۲ داریم (که در گیمزکام برای عده‌ی معدودی از سازندگان رونمایی شد) سنخیت دارد یا نه.

اما اول از همه باید با یک سوال اساسی شروع کنیم. آیا می‌توانیم با قطعیت و صددرصد بگوییم که از T239 در سوییچ ۲ استفاده خواهد شد؟ جواب منفی است. بااین‌حال قطعا می‌توانیم T239 را به یک پروژه از نینتندو مرتبط بدانیم و هیچ شواهدی نیست – و حتی نیازی هم نیست – که انویدیا این چیپ را برای کمپانی دیگری ساخته باشد. به‌هرحال، انویدیا برای تعمین نیازش در بازار خودرو و رباتیک همین الان هم از T234 استفاده می‌کند. و برای فهم نسخه‌ی ویرایش‌شده‌ی آن، یعنی T239، خوب است که اول با خود T234 آشنا شویم و اینکه چرا نینتندو نمی‌تواند از آن استفاده کند.

به‌هرحال برای سوییچ ۱ کسی پردازنده‌ی مخصوص نساخت. گرچه وقتی سوییچ ۱ معرفی شد انویدیا طور دیگری وانمود می‌کرد، اما چیپ کنسول هیبریدی نینتندو همان تگرا ایکس‌وان/Tegra X1 و بدون تغییر بود (گرچه برخی از قابلیت‌هایش غیرفعال شده بودند، مثل هسته‌های پایینی سی‌پی‌یو). این چیپ که از همان اول برای بازار گیمینگ، موبایل و تبلت ساخته شده بود، بی‌ارزش و در حاشیه بود، اما وقتی نینتندو از آن برای سوییچ استفاده کرد دوباره احیا شد. برای سوییچ ۲ هم انویدیا نمی‌تواند دوباره نسخه‌ی دیگری از تگرا را استفاده کند. آخرین پردازنده‌های تگرا — مثل T234 — برای یک بازار به‌کل متفاوت و پرتقاضاتری ساخته شده‌اند. ماهیت آن هنوز قابل‌حمل است اما پیکربندی‌اش آنقدری بزرگ و سنگین هست که بدرد یک کنسول جریان‌اصلی و جمع‌وجور نخورد.

یک چیزی را همینجا شفاف‌سازی کنیم: T234 یک چیپ هیولاست. سایز ۴۵۵mm2 آن باعث می‌شود پردازنده‌ی ۳۵۰mm2ای ایکس‌باکس سریز ایکس مقابل آن کوتوله به نظر برسد. این چیپ از همان تکنولوژی هشت نانومتری سامسونگ استفاده می‌کند که برای سری کارت‌های RTX-30 استفاده شده بود، بنابراین نسبت به هفت نانومتری و شش نانومتری کنسول‌های نسل فعلی عقب‌گرد حساب می‌شود. از نظر سایز سی‌پی‌یو هم مجهز به هسته‌های ۱۲ ARM A78AE و جی‌پی‌یوی آن نیز مبتنی بر معماری آمپر سری ۳۰ با  ۲۰۴۸ هسته‌ی CUDA و مموری اینترفیس ۲۵۶بیتی است. برای بازار خودرو و رباتیک، T234 شدیدا به ماشین لرنینگ نیاز دارد، بنابراین یک چیپ مخصوص برای بهبود دیپ لرنینگ هم در آن قرار گرفته است که قابلیت‌هایش با هسته‌های تنسور(۴) جی‌پی‌یو بیشتر می‌شود.

T239 انویدیا — پردازنده نسل بعدی گیمینگ برای نینتندو

چیزی که از همان اول مشخص است این است که T234 زیادی برای یک پلتفرم هیبریدی که قابل‌حمل هم هست بزرگ است. برای تقریب به ذهن در نظر بگیرید که سایز این پردازنده ۴۵۵mm2 است و به‌مراتب بزرگ‌تر از ۳۹۲mm2ای همچون RTX 3070. و با عقل سلیم، اطلاعاتی که درز پیدا کردند و با هک حساب‌های لینکدین اعضای فعلی و سابق انویدیا، حالا به خوبی می‌توانیم توانایی‌های T239 را تخمین بزنیم. مهم است بدانیم انویدیا توزیع لینوکس خاص خودش را دارد که گرچه بخش زیادی از آن عمومی نیست، اما به اندازه کافی به T239 اشاره کرده که به تصویری کلی از این پردازنده برسیم.

اول از همه می‌دانیم هسته‌های سی‌پی‌یو به‌کل با T234 متفاوت هستند. با اینکه هسته‌های نوع A78 ARM معمولا بیشتر استفاده می‌شود، اما نوع AE بر اساس استانداردهای سخت‌گیرانه‌ی شورای اتوموتیوهای الکترونیکی/Automotive Electronics Council ساخته شده و نیمی از هسته‌هایش برای مقابله با نیم دیگر استفاده می‌شوند (که اصلا برای یک پلتفرم مخصوص گیم چیز خوبی نیست). توزیع لینوکس انویدیا نشان می‌دهد T239 هشت هسته دارد که روی یک کلاستر قرار گرفته‌اند و این احتمال بالا می‌رود که سوییچ ۲ از مدل A78C استفاده کند.

چیپ انویدیا

چیپ اصلی کنسول نسل بعدی نینتندو بر اساس T234 انویدیا است، اما برای جا شدن در یک کنسول هیبریدی و قابل‌حمل باید سایزش کم شود. از لحاظ مصرف سیلیکون، حتی از چیپ درون ایکس باکس سریز ایکس هم ۲۳ درصد بزرگ‌تر است.

پهنای باند حافظه برای یک کنسول قابل‌حمل خیلی مهم است و در حال حاضر چیزی که نینتندو سوییچ را اینقدر از نظر سخت‌افزاری در تنگنا قرار داده پایین‌بودن پهنای باند حافظه است. اینترفیس ۲۵۶بیتی در T239 برای چنین کنسول قابل‌حملی زیاده‌ازحد است و لیک‌ها نشان می‌دهند از اینترفیس ۱۲۸بیتی استفاده خواهد شد (و تقریبا قطعی است که با حافظه‌ی رم LPDDR5 همراه خواهد بود). انتظار داریم از ماکسیموم پهنای باند ۱۰۲ گیگابایتی استفاده شود، ولی ممکن است نینتندو برای بهینه‌تر کردن سیستمش آن را داون‌کلاک کند. ساپورت از دیسپلی‌پورت/DisplayPort — که به‌راحتی برای HDMI هم کانفیگ می‌شود — در T239 وجود دارد و همینطور در پردازنده‌ی نینتندو سوییچ فعلی. فرقش اینجاست که اگر نینتندو از آن استفاده کند پهنای باند حافظه‌ی کافی برای استفاده از HDMI 2.1 هم به‌وجود می‌آید.

سایر اطلاعاتی هم که از توزیع لینکوس انویدیا درز پیدا کرده جالب هستند. مثلا استفاده از مدیا بلاک کدگذاری‌شده/رمزگشایی‌شده که گرچه از چیپ‌های RTX سری ۳۰ و مبتنی بر معماری آمپر استفاده می‌کند، اما چون مدیا بلاک از روی آخرین چیپ‌های سری لاولیس بک‌پورت شده، ساپورت بهینه‌تری از فرمت‌های مختلف مثل AV1 خواهد داشت [AV1 یکی از فرمت‌های کدگذاری ویدئویی است که ابتدا برای انتقال ویدئوها در اینترنت استفاده ‌می‌شد]. کلاک‌گیتینگ(۵) یکی از دیگر ویژگی‌های سری لاولیس است که یک‌جورهایی راهش را به T239 هم باز کرده. بحث درباره‌ی میزان مصرف این چیپ به دلایل مختلف مشکل‌ساز است و سعی می‌کنم در ادامه‌ی مقاله مختصرا به آنها اشاره کنم.

توزیع لینوکس انویدیا تایید می‌کند T239 به افزایش‌دهنده‌ی جریان نوری(۶) هم مجهز است (یکی از اجزای اساسی فریم‌ساز DLSS 3). مشکل این است که این جریان نوری از آخرین نسل معماری آمپر است و نه معماری لاولیس که انویدیا در وهله‌ی اول به‌خاطر همان بود که قابلیت فریم‌سازی را اضافه کرد. اینکه آیا نقشی در سوییچ ۲ خواهد داشت یا نه معلوم نیست، ولی جالب است که وقتی انویدیا این پردازنده‌ی شخصی‌سازی‌شده‌ی کم‌قدرت‌ترِ تگرا را ساخت این قطعه را کنار نگذاشت.

یک نکته‌ی دیگر هم در این پردازنده مهم است: FDE. این یک قطعه‌ی سخت‌افزاری کاملا جدید است که در T234 وجود ندارد. FDE مخفف File Decompression Engine (انجین فشرده‌زدایی از فایل‌ها) است. مشابه همین تکنولوژی در پلی‌استیشن ۵ هم وجود دارد و به این معناست که می‌شود اَسِت/assetها را با سرعت زیادی از فشردگی دربیاورد. Nate The Hate (لیک‌کننده‌ای که اطلاعاتی درباره‌ی سوییچ ۲ منتشر کرد) در گزارش خود اعلام کرد که افسانه‌ی زلدا: نفس وحش/The Legend of Zelda: Breath of the Wild روی سخت‌افزار سوییچ ۲ بدون تقریبا هیچ لودینگی اجرا می‌شد. خب، T239 می‌دانیم که سخت‌افزار لازم برای لودینگ‌های فوق‌سریع را دارد، اما برای عملی‌شدنش باید حافظه‌ی به‌مراتب سریع‌تری هم داشته باشد (که فعلا چیز زیادی درباره‌اش نمی‌دانیم).

بعد از هک و درز اطلاعاتی جدید از انویدیا به تصویر خیلی پرجزییاتی از این پردازنده رسیدیم — جی‌پی‌یوی مبتنی بر معماری آمپر، مموری باس ۱۲۸ بیتی و مموری LPDDR5، به اضافه‌ی قابلیت‌های بک‌پورت‌شده‌ای از سری لاولیس که به مصرف باتری کنسول کمک می‌کنند. این اطلاعات درزشده تلویحا نشان می‌دهند T239 شامل ۱۵۳۶ هسته‌ی پردازش موازی کودا/CUDA است، یعنی سی درصد کمتر از تعداد هسته‌های کودای پردازنده‌ی T234.

تصویری از چیپ t239

تصویری که kopite7kimi در ویکی‌پدیا پیدا کرد. دای‌شات (Die shot: تصویری از داخل یک مدار یکپارچه) انویدیا T234 نشان می‌دهد چقدر از مساحت آن را سی‌پی‌یو و جی‌پی‌یو اشغال کرده است. T239 فقط ۷۵ درصد از شیدرهای T234 را دارد و کلاستر سی‌پی‌یوی آن بسیار کوچک‌تر است.

بنابراین چیپی داریم که به‌مراتب قدرتش از برادر بزرگ‌ترش یعنی T234 کمتر است، قابلیت‌های اضافی‌اش را از خود حذف کرده و درعین‌حال یک قطعه‌ی فشرده‌زدای جدید اضافه دارد. چند سوال پیش می‌آید. از سی‌پی‌یو و جی‌پی‌یوی آن چه سرعت کلاکی باید انتظار داشته باشیم؟ سرعت مموری چقدر است؟ این سوالات برای فهم عملکرد یک پردازنده‌ی قابل‌حمل مهم هستند. این سوال هم وجود دارد که آیا T239 مثل T234 ابزاری برای بهبود محاسبات دیپ لرنینگ دارد یا نه. به نظرم برای سوییچ ۲ و آپ‌اسکیل‌کردن رزولوشن با DLSS وجود چنین چیزی لازم است.

درباره‌ی سرعت کلاک: انویدیا برای محاسبه‌ی میزان مصرف T234 ابزاری فراهم کرده که با استفاده از آن می‌توانیم به عملکرد احتمالی T239 هم پی ببریم. مثلا متوجه می‌شویم جی‌پی‌یو معمولا در سرعت ۵۴۰ مگاهرتز عملکرد بهینه‌ای دارد و برای چنین پلتفرمی کفایت می‌کند. اما هرقدر سرعت کلاک را بالاتر ببرید بهینه‌بودنش شدیدا کم می‌شود و مصرف قدرت بیشتری می‌طلبد (و طبیعتا دمایش هم بالاتر می‌شود). اگر نینتندو سرعت کلاک را بالای یک گیگاهرتز ببرد جای غافلگیری دارد و حدس می‌زنم خیلی پایین‌تر از این حرف‌ها باشد. البته برای کلاک سی‌پی‌یو، یک گیگاهرتز نقطه‌ی مناسبی است. بااین‌حال این محاسبات با توجه به چیپ تگرای T234 انجام شده که به مراتب بزرگ‌تر است و از تکنولوژی هشت نانومتری سامسونگ استفاده می‌کند. چیپ کوچک‌تری مثل T239 می‌تواند بهینه‌تر باشد و در حال حاضر هیچ شواهدی نیست که نشان دهد که همچنان از تکنولوژی غیربهینه‌ی هشت نانومتری سامسونگ قرار است استفاده کند (گرچه حدس می‌زنم بکند).

از T239 چه انتظار عملکردی باید داشته باشیم؟

اگر بخواهیم همه‌ی آنچه تا اینجا نوشتیم را خلاصه‌سازی کنیم: از چیپی به نام T239 اطلاعات پرجزییاتی به دست آورده‌ایم که چند سالی است در دست توسعه قرار دارد و دو سال پیش اطلاعاتش درز پیدا کرد و تاکنون بارها در توزیع لینوکس انویدیا و اطلاعات هک‌شده‌ی انویدیا و اطلاعات لینکدین اعضای انویدیا به آن اشاره شده است. اما یک مسئله‌ی دیگری هم هست که چه بسا آن را دلیلی غیرقابل‌انکار دانست: وقتی نینتندو سوییچ ساخته شد، انویدیا برای اینکه از همه‌ی پتانسیل سی‌پی‌یو و جی‌پی‌یوی سخت‌افزار استفاده کند یک API گرافیکی سطح‌پایین به کار برد. اسم آن NVN بود. اطلاعات هک‌شده‌ی انویدیا نشان می‌دهد آنها یک API‌ گرافیکی جدید به نام NVN2 ساخته‌اند و برخی از قطعات انویدیا قرار است از آن استفاده کنند. در برخی از این کدها واضح است که T239 هم به آن مجهز خواهد بود. در واقع انویدیا نسخه‌ای اصلاح‌شده از پردازنده‌ی تگرا ساخته که هم کوچک‌تر است، هم بهینه‌تر است، و هم سخت‌افزاری دارد که لودینگ‌ها را به‌مراتب کم می‌کند — و مهم‌تر اینکه از NVN نسل بعدی برای API‌ گرافیکی سوییچ ۲ پشتیبانی می‌کند.

دموی ماتریکس

دموی ماتریکس روی کارت گرافیک RTX 2050 داون‌کلاک‌شده‌ی ما رم کم آورد، اما فورتنایت با ری تریسینگ سخت‌افزاری و با فعال‌بودن Nanite و Virtual Shadow Maps و با کمک حالت پرفورمنس DLSS تقریبا با سی فریم و ۱۰۸۰پی اجرا می‌شد.

پس، چه انتظاری می‌توان از عملکرد T239 در یک کنسول بازی قابل‌حمل داشت؟ بابی کوتیک مدیرعامل اکتیویژن، در دادگاه کمیسیون فدرال تجارت که برای مایکروسافت برگزار شده بود، اخیرا اشاره کرد در جلسه‌ای با نینتندو در سال قبل، متوجه شده عملکرد کنسول نسل بعدی نینتندو برابر با سخت‌افزارهای نسل هشتمی است. خب، ممکن است واقعا همین باشد، ولی نباید فراموش کرد با اینکه سوییچ اسب‌بخارش روی کاغذ در حد وی‌یو یا ایکس‌باکس ۳۶۰ بود ولی در عمل خیلی بهتر از اینها بازی‌ها را اجرا می‌کرد. اول از همه دلیلش این بود که جی‌پی‌یوی مدرن‌تر و با حافظه‌ی بیشتری داشت. شرط می‌بندم سوییچ ۲ هم همین منوال را ادامه دهد و فراتر هم برود. درست است که بابی کوتیک می‌گوید عملکرد سوییچ ۲ در حد پلی‌استیشن ۴ است ولی در این در حالی است که می‌شنویم دموی Matrix Awakens با آنریل انجین ۵ هم روی سوییچ ۲ اجرا می‌شود (چیزی که پلی‌استیشن ۴ نمی‌تواند اجرا کند). وقتی یک جی‌پی‌یوی خیلی مدرن‌تر سیلیکونی شخصی‌سازی‌شده‌ی مجهز به هسته‌های تنسور ماشین لرنینگ و ری تریسینگ سخت‌افزاری داشته باشید، دیگر مهم نیست اگر روی کاغذ سخت‌افزارتان در حد پلی‌استیشن ۴ باشد.

برای اینکه بدانید یک پردازنده‌ی مبتنی بر معماری آمپر قابل‌حمل چه توانایی‌هایی دارد، شخصا دست به کار شدم و آزمایش کردم: سخت‌افزاری مشابه با قابلیت‌های کلاستر سی‌پی‌یوی A78C روی پی‌سی وجود ندارد ولی در جی‌پی‌یو توانایی‌هایش تقریبا یکی است. بنابراین یک‌ لپ‌تاپ مدل Dell Vostro 5630 با این مشخصات گرفتم: سی‌پی‌یوی Core i7 1360p، شانزده گیگ رم ۴۸۰۰MHz نوع LPDDR5، یک هارد SSD 512 گیگی، و یک RTX 2050. خصوصا این قطعه‌ی آخری برای آزمایشی که می‌خواهیم بکنیم مهم‌ است.

اول از همه، با اینکه جزو RTX سری ۲۰ رده‌بندی شده، ولی در واقع همان سیلیکونی را دارد که دیگر RTXهای ۳۰۵۰ و ۳۰۵۰ Ti دارند. T239 دارای ۱۵۳۶ هسته‌ی کودا است ولی روی یک لپ‌تاپ گیمینگ با جی‌پی‌یوی مبتنی بر معماری آمپر سخت‌افزاری که کمتر از ۲۰۴۸ هسته‌ی کودا داشته باشد پیدا نکردیم. این سوال پیش می‌آید که پس چرا یک لپ‌تاپ مجهز به RTX 3050 نگرفتیم؟ خب، ۲۰۵۰ را به چشم نسخه‌ای از ۳۰۵۰ ببینید که مغزش را برداشته باشند — دارای قدرت کمتر، کلاک پایین‌تر و صرفا با حافظه اینترفیس ۶۴ بیتی. با پهنای باند ۹۶ گیگی در مقایسه با RTX 3050 خیلی ضعیف‌تر است اما تقریبا با پهنای باند احتمالی سوییچ ۲ برابری می‌کند. ولی هنوز یک گیری وجود دارد: ۲۰۵۰ تنها چهار گیگ رم دارد ولی انتظار دارم سوییچ ۲ تا هشت و بسا دوازده گیگ حافظه داشته باشد.

کنترل روی لپ‌تاپ مدل دل

لپ‌تاپ میان‌مایه‌ی مدل Dell Vostro 5640، با سی‌پی‌یوی Core i7 1360p. اما دلیل اینکه این لپ‌تاپ را انتخاب کردیم به‌خاطر گرافیک RTX 2050 چهار گیگی‌اش بود — کم‌توان‌ترین جی‌پی‌یوی قابل‌حمل مبتنی بر آمپر که توانستیم پیدا کنیم. برای آزمایش‌هایمان، آن را از ۱۳۵۰ مگاهرتز تا ۷۵۰ مگاهرتز داون‌کلاک کردیم.

نتایج این آزمایش را در این ویدئو می‌توانید ببینید، اما قبلش باید یک چیز را شفاف‌سازی کرد: از نظر قدرت، این شبیه‌ترین سخت‌افزاری است که به T239 سوییچ ۲ پیدا کردیم، ولی باید به یاد داشت آنچه در ویدئو می‌بینید یک جی‌پی‌یوی آمپر روی تنظیمات، سرعت کلاک و پهنای باند حافظه‌ی شدیدا پایین است. قرار است صرفا ببینیم یک چیپ آمپر قابل‌حمل، که حتی عمدا تا سرعت ۷۵۰ مگاهرتز داون‌کلاکش کردم، تقریبا چه عملکردی دارد، و از روی آن به عملکرد احتمالی نینتندو سوییچ ۲ پی ببریم. با همه‌ی این اوصاف، نتایج جالبی به دست آمد.

دموی Matrix Awakens را به‌خاطر اینکه RTX 2050 صرفا چهار گیگ حافظه دارد نتوانستم اجرا کنم چون به نظر می‌رسد این دمو حداقل به حافظه‌ی ۵.۶ گیگی نیاز داشته باشد. بااین‌حال فورتنایت اجراشده روی آنریل انجین ۵ را خوب با Lumen و Nanite و Virtual Shadow Maps اجرا می‌کند. برعکس نسخه‌های کنسولی، به ری تریسینگ سخت‌افزاری روی نسخه‌ی پی‌سی دسترسی داریم، و بله، همه‌ی اینها روی لپ‌تاپی با جی‌پی‌یوی RTX 2050 اجرا می‌شوند. Lumen ری‌تریسینگ، هم مدل سخت‌افزاری‌اش و هم نرم‌افزاری‌اش را، آزمایش کردم، و برای اجرای با رزولوشن نیتیو ۷۲۰p و چند مدل DLSS هم دیگر آزمایش شد که همه توانستند رزولوشن را تا ۱۰۸۰پی بالا ببرند. ری‌تریسینگ نرم‌افزاری با DLSS (رزولوشن ورودی ۵۴۰p و رزولوشن خروجی ۱۰۸۰p) از همه عملکردش بهتر بود، ولی اینطور هم نیست که سایر گزینه‌ها عملکردشان بد باشد. نهایتا ۹.۵ درصد اختلاف دارند و فرق‌شان در حد ۲.۸۲ فریم است.

حدسم این است که اجرای دموی Matrix Awakens روی نینتندو سوییچ ۲ واقعیت دارد، ولی اپیک گیمز برای اینکه قابلیت‌های کلیدی آنریل انجین ۵ را روی سوییچ اجراپذیر کند باید خیلی تغییرات زیادی ایجاد کند چون این دمو طبیعتا به‌مراتب برای جی‌پی‌یو سنگین‌تر است تا فورتنایت. اینکه این دمو را روی یک جی‌پی‌یوی کم‌قدرت آمپر اجرا کردیم درباره‌ی عملکرد نهایی نینتندو سوییچ ۲ چیز زیادی نشان نمی‌دهد. اما باز هم اجرا می‌شود. می‌توانید از ری تریسینگ سخت‌افزاری هم استفاده کنید. DLSS‌ هم کمک می‌کند.

کنترل

سایبرپانک ۲۰۷۷

با وجود کمبود پهنای باند حافظه، کمبود هسته‌های کودا و سرعت کلاک پایین، RTX 2050 با DLSS باز هم بازی Control را خوب با رزولوشن ۱۰۸۰پی اجرا کرد (رفلاکس‌های ری تریسینگ هم فعال بود). دیگر بازی‌های اجراشده هم سایبرپانک ۲۰۷۷، دث استرندینگ و A Plague Tale: Requiem بودند. دث استرندینگ روی حالت پرفورمنس DLSS با سی فریم و حتی با رزولوشن ۱۴۴۰پی اجرا شد.

برای محک‌زدن این سخت‌افزار، دث استرندینگ را هم آزمایش کردم تا ببینم عملکردش در افتتاحیه‌ی بازی که خیلی به جی‌پی‌یو فشار می‌آورد چگونه است. با رزولوشن ۱۰۸۰پی نیتیو، میانگین فریم ریت ۳۴.۹ را گرفتم، که نشان می‌دهد قدرت احتمالی سوییچ ۲ احتمالا در همان حد و اندازه‌ی کنسول‌های نسل هشتمی است. روی رزولوشن ۷۲۰پی، فریم‌ ریت تا روی ۵۲.۵ رفت. حالت کوالیتی DLSS را هم امتحان کردم — فریم ریت سابقا ۳۴.۹ای میانگین تا روی ۴۴.۷ بالا رفت. روی رزولوشن ۷۲۰پی هم فریم ریت بالاتر می‌رود اما ارزیابی عملکردش سخت است چون آن سکانس فریم ریتش روی ۶۰ قفل شده و بنابراین نمی‌دانم فریت ریت سابقا ۵۲.۵ که به ۶۰ می‌رسد دقیقا چه مقدار دیگر می‌توانست بالاتر برود. با اینکه گیم‌پلی در حالت پرفورمنس DLSS و گرفتن رزولوشن ۱۴۴۰پی روی این جی‌پی‌یوی مبتنی بر معماری آمپر عملکرد خوبی داشت و بیشتر اوقات سی فریم بود، اما بعضی جاها می‌لنگید. مثلا زمان رویارویی با BTهای بازی جی‌پی‌یو کم می‌آورد.

آیا ساپورت از DLSS برای سوییچ ۲ حیاتی است یا صرفا یک قابلیت بدردبخور است؟

به باورم DLSS برای کنسول نسل بعدی نینتندو حیاتی است، اما اینکه به افسانه‌ی «سوییچ با قابلیت فورکی» برسیم بسته به این دارد که آیا یکی از هسته‌های اساسی چیپ T234 در T239 هم وجود دارد یا نه. منظورم چیپ ارتقادهنده‌ی دیپ لرنینگ است، یک قطعه‌ی سخت‌افزاری جداگانه که در ترکیب با هسته‌های تنسور درون جی‌پی‌یو ممزوج می‌شود. آزمایش‌هایی که شخصا روی RTX 2050 انجام دادم نشان می‌دهد DLSS برای آپ‌اسکیل‌کردن رزولوشن تا روی ۱۰۸۰پی و حتی ۱۴۴۰پی مفید است (همانطور که در مثال دث استرندینگ دیدیم). بااین‌حال هرقدر خروجی رزولوشن بالاتر باشد هزینه‌ای هم که DLSS‌ روی دست سخت‌افزار می‌گذارد بالاتر می‌رود.

در دث استرندینگ مثلا هزینه‌ی آپ‌اسکیل رزولوشن ۷۲۰پی تا فورکی (حالت آلترا پرفورمنس DLSS) بالای ۱۸ میلی ثانیه است. برای همین یک سکانس شصت فریمی برای رندر کامل فریم‌ها به ۱۶.۷ میلی ثانیه نیاز دارد. بااین‌حال اگر قطعه‌ی سخت‌افزاری بهبود دیپ لرنینگ که در چیپ T234 هست به T239 هم راه پیدا کند، DLSS روی نینتندو سوییچ ۲ می‌تواند پرقدرت‌تر ظاهر شود و این پروسه را با هزینه‌ی کمتری انجام دهد.

مهم است روی اهمیت DLSS برای کل نینتندو سوییچ ۲ مجددا تاکید کنیم. همانطور که در آن ویدئو می‌بینید، تمام آزمایش‌هایی که روی گیم‌پلی‌های بازی‌های مختلف انجام دادیم تقریبا نتایج شگفت‌انگیزی داشتند — اما همه مدیون DLSS‌ هستند که رزولوشن آنها را تا ۱۰۸۰پی آپ‌اسکیل کرد. گرچه روی پی‌سی معمولا همه متفق‌القولیم که آپ‌اسکیل تا روی فورکی (حالت پرفورمنس)، یا روی ۱۴۴۰پی (حالت بالانس)، یا روی ۱۰۸۰پی (حالت کوالیتی) «مقبول» است، اما در دنیای کنسول‌ها وضعیت فرق دارد: قرار است خیلی دور از صفحه‌ی تلویزیون یا مانیتور بنشینید و انتظارات‌تان هم از کیفیت با پی‌سی گیمرها فرق دارد. به‌هرحال حتی در همین نسل فعلی و در عملکرد کنسول‌هایی مثل پلی‌استیشن ۵ و سریز ایکس هم رزولوشن‌های واقعا پایینی دیدیم.

سایبرپانک ۲۰۷۷

تصویری از نحوه‌ی عملکرد جی‌پی‌یوی آمپری کم‌قدرت در اجرای سایبرپانک ۲۰۷۷ که تا شماره‌ی ۲.۰ به‌روزرسانی شده و با تنظیمات نسخه‌ی پلی‌استیشن ۵ و با کمک DLSS روی رزولوشن ۱۰۸۰پی اجرا می‌شود. اساسا می‌خواستیم بین ۲۵ تا ۳۰ فریم بدهد. قضاوت درباره‌ی کیفیت تصویر با خودتان.

پس فکر می‌کنم یک چیپ‌ست قابل‌حمل در کنسولی که قرار است به تلویزیون وصل شود، اگر رزولوشن مثلا ۵۴۰پی خود را تا ۱۰۸۰پی آپ‌اسکیل کند، قابل قبول است. اگر هم از ۷۲۰پی به ۱۰۸۰ آپ‌اسکیل شده باشد (حالت کوالیتی DLSS) خیلی هم عالی‌ست. قطعا خیلی بهتر از دیگر بازی‌های گرافیک‌بالای سوییچ در زمانی است که روی حالت داک [صفحه‌ی خود دستگاه و نه تلویزیون] اجرا می‌شوند. حالا آپ‌اسکیل ۷۲۰پی تا فورکی چطور؟ دوباره، برای جواب به سوال به آن ویدئو رجوع کنید — فورکی تروتازه‌ای نمی‌شود اما یک کنسول کم‌قدرت هم واقعا نیازی ندارد فورکی نیتیو را اجرا کند. همین که یک کیفیت معقول روی یک تلویزیون فورکی نشان دهد کافی است.

و اساسا انتظارم از توان سخت‌افزاری و عملکرد احتمالی‌ سوییچ ۲ با یک جی‌پی‌یوی شدیدا داونگریدشده‌ی مبتنی بر معماری آمپر همین است. هنوز هم بحث و سوالات بی‌جواب باقی مانده‌اند. عده‌ای باور دارند T239 قرار است صرفا برای یک نسخه‌ی ارتقایافته از همان سوییچ ۱ استفاده شود، مثلا «سوییچ فورکی» یا «سوییچ پرو»، و نسل بعدی کنسول نینتندو قرار است چیز به‌کل متفاوتی باشد. شخصا این نظریه را قبول ندارم: T239 و سایز جی‌پی‌یویش و سخت‌افزار شخصی‌سازی‌شده‌اش بیشتر شبیه یک جهش بزرگ نسبت به تگرا ایکس‌وان است. مسئله بیشتر سر این است که آیا این چیپ برای چنین کنسول دستی‌ای کفایت می‌کند یا نه؟

بااین‌حال سوالات و نگرانی‌های معقولی درباره‌ی T239 وجود دارند. تا الان گفتیم T234 با سایز ۴۵۵mm2 زیادی برای کنسولی هیبریدی مثل نینتندو سوییچ ۲ بزرگ است — اما با وجود اینکه سی‌پی‌یو و توان گرافیکی‌اش را پایین آورده‌اند، احتمال زیاد T239 همچنان از تگرا ایکس‌وان با سایز ۱۱۸mm2ای سوییچ ۱ به‌مراتب بزرگ‌تر باشد. چیپ بزرگ‌تر یعنی استفاده‌ی بیشتر از سیستم‌های خنک‌کننده که احتمالا برای یک کنسول هیبریدی دستی/خانگی مناسب نیست. برخی‌ها هم باور دارند T239 از تکنولوژی هشت نانومتری سامسونگ قرار نیست استفاده کند. ولی خب تا زمانی که سوییچ ۲ روی قفسه‌ی مغازه‌ها ظاهر نشود نمی‌توانیم درباره‌ی صحت و سقم این نظریه مطمئن باشیم.

دث استرندینگ

تمام برداشت‌ها در اینجا حاصل آپ‌اسکیل رزولوشن ۷۲۰پی به کمک DLSS تا روی ۱۰۸۰پی، ۱۴۴۰پی و ۲۱۶۰پی هستند. البته DLSS‌ هم حکم ناهار مجانی را ندارد که بتوان بدون هزینه رزولوشن را تا هر کجا که خواستیم آپ‌اسکیل کنیم چون هسته‌های تنسور هم محدودیت‌های خودشان را دارند. بااین‌حال اگر T239 هم مثل T234 قطعه‌ی سخت‌افزاری برای بهبود ماشین لرنینگ را داشته باشد، آپ‌اسکیل رزولوشن به‌مراتب راحت‌تر و با فشار کمتری انجام خواهد شد.

از دید من T239 بهترین کاندید برای پردازنده‌ی کنسول نسل بعدی نینتندو سوییچ است. جنسن هوآنگ/Jensen Huang، موسس و مدیرعامل انویدیا، اعلام کرده همکاری بین انویدیا و نینتندو احتمالا تا دو دهه طول خواهد کشید. و با عرضه‌ی احتمالی سوییچ ۲ در سال ۲۰۲۴، تاکنون هیچ اطلاعات قانع‌کننده‌ای درباره‌ی هیچ چیپ دیگری درز پیدا نکرده که نشان دهد ممکن است کنسول نسل بعدی نینتندو از چیپی به‌جز T239 استفاده کند.

شخصا از آزمایش این نظریات با RTX 2050 لذت بردم. و این آزمایش‌ها می‌توانند یک تصویر کلی از توانایی‌های کنسول نسل بعدی سوییچ ۲ نشان دهند. تقریبا هر بازی جدیدی روی آن خوب اجرا می‌شود به شرطی که تنظیمات را درست انتخاب کنید. و DLSS هم — دوباره — شدیدا حیاتی است و اگر از قطعه‌ی سخت‌افزاری بهبود ماشین لرنینگ در این چیپ استفاده کنند خیلی بهتر هم خواهد شد.

اما بگذارید یک بار دیگر تاکید کنم این آزمایش‌ها صرفا تخمین توانایی‌های T239 است. لپ‌تاپی که روی آن آزمایش کردیم گرچه کلاک پایین‌تری دارد اما هسته‌های کودای آن بیشتر است. با اینکه پهنای باند حافظه‌اش برای یک پی‌سی کم است اما احتمالا نزدیک‌ترین چیزی است که به T239 می‌توانستیم پیدا کنیم (و البته نینتندو ممکن است همین را هم داون‌کلاک کند). و البته، در آزمایش ما روی لپ‌تاپ، مغایرتی از سمت پهنای حافظه با سی‌پی‌یو وجود نداشت (یکی از دیگر چیزهایی که عملکرد سخت‌افزاری را کاهش می‌دهد).

پتنت نینتندو

گیم‌ رنت/Game Rant اخیرا از ثبت یک حق اختراع جدید از سوی نینتندو برای یک کنسول جدید گزارش داده که دو-صفحه‌ای است و هر صفحه می‌تواند مستقل از دیگری کار کند. اینکه آیا این ثبتْ به سوییچ جدید ربطی دارد یا نه مشخص نیست اما مسئله‌ی جالبی ایجاد می‌کند: گویا درباره‌ی سخت‌افزار داخلی این کنسول بیشتر می‌دانیم تا درباره‌ی ماهیت و هدفش.

بااین‌حال هنوز هم بارقه‌ای از امید هست — و یادتان باشد که من نسخه‌ی پی‌سی این بازی‌ها را تست کردم که روی کنسول‌ها گرافیک‌شان قابل شخصی‌سازی و تغییر نیست. و جادوی نهایی را باید خود بازی‌سازها رقم بزنند و دست خودشان است که چطور بتوانند روی سخت‌افزاری محدود بازی‌شان را اجرا کنند. مثلا نگاه کنید به زمانی که دووم، ویچر ۳ یا ریمسترهای کرایسیس چگونه روی نینتندو سوییچ عرضه شدند، یا کار استادا‌نه‌ی استودیوی Rebellion North برای پورت سری اسنایپر الیت و نسخه‌های Zombie Army آن. این بازی‌ها محدودیت سخت‌افزاری تگرا ایکس‌وان را دور زدند. و جدا از اینکه T239 چه توانایی‌هایی دارد یا ندارد، توقع دارم باز هم اتفاقات مشابهی برایش بیافتد.

سوییچ ۲: سوالات مهمی که جوابی برایشان نداریم

برخی از سوالات اساسی ما درباره‌ی کنسول نسل بعدی نینتندو احتمالا وقتی سخت‌افزار نهایی‌اش را ببینیم رفع می‌شوند. مثلا اینکه چقدر بزرگ است؟ باتری آن چه عملکردی دارد؟‌ ظاهر بازی‌ها روی آن به چه شکل خواهد بود؟ سخت‌افزار سوییچ فعلی — به اضافه‌ی جوی‌کان‌هایش — تا کجا با سوییچ ۲ قابلیت انطباق دارند؟ احتمالا در آینده از خود انویدیا که در توسعه‌ی سخت‌افزار سوییچ ۲ نقش دارد اطلاعات بیشتری کسب کنیم.

طبق همه‌ی چیزهایی که در ماه‌های اخیر درباره‌ی T239 آموخته‌ام، فکر می‌کنم چیزی که بیش از همه غافلگیرم کرد جاه‌طلبی سخت‌افزارش بود. با داشتن فرصت اینکه یک پردازنده‌ی جدید را از نو مخصوص گیم پی‌ریزی کنند، انویدیا می‌توانست همان مسیری را دنبال کند که سابقا برای گرافیک‌های سری ۱۶ جی‌تی‌ایکس دنبال کرده بود: ساخت گرافیک‌های میان‌رده با حذف ماشین لرنینگ و ری تریسینگ، یا حداقل کاهش قدرت آنها برای فروش با قیمت کمتر (مثل کاری که AMD با ادغام ری تریسینگ در RDNA 2 کرد تا هزینه روی سیلیکون به کمترین حالت ممکن برسد). ولی در عوض، شواهد نشان می‌دهند انویدیا و نینتندو می‌خواهند تمام این قابلیت‌های نسل نهمی را روی این چیپ جدید همچنان حفظ کنند و درعین‌حال وجود FDE هم نشان می‌دهد روی سیلیکون‌ها (که برای تجارب گیمینگ می‌توانند مهم باشند) خوب هزینه کرده‌اند. آیا ممکن است این جاه‌طلبانه‌ترین سخت‌افزار نینتندو از زمان گیم‌کیوب تا امروز باشد؟

در خصوص استفاده از سیلیکون هشت نانومتری سامسونگ هنوز سوالاتی وجود دارد. علی‌رغم اینکه نینتندو نسخه‌ی ویرایش‌شده و ضعیف‌تری از چیپ T234 را می‌خواهد استفاده کند ولی در همین هم یک نکته‌ی مثبت هست. اینگونه ممکن است بتواند از تکنولوژی‌های شش، پنج یا چهار نانومتری برای بهبود عمر باتری و کاهش دمای کنسول استفاده کند، درست مثل کاری که در نسخه‌های اصلاح‌شده‌ی سوییچ مثل OLED و Lite انجام داد. در کوتاه مدت سوال این است که T239 چقدر بزرگ است و آیا ممکن است این باعث افزایش سایز کنسول شود (که به نظرم نینتندو چنین قصدی ندارد).

در حال حاضر و با نظر به اطلاعات درز پیدا کرده و غیررسمی درباره‌ی داخل کنسول نسل بعدی نینتندو اطلاعات بیشتری داریم تا درباره‌ی دیگر جزییات مهمش — مثلا اینکه آیا یک سخت‌افزار به‌کل جدید خواهد بود یا نه. T239 یک پردازنده‌ مخصوص دستگاه‌های قابل‌حمل است، و با اینکه نینتندو تمام سرمایه‌اش را صرف توسعه‌ی یک پلتفرم کرده و این نشان می‌دهد قرار است سوییچ جدیدی ببینیم، اما نینتندو همیشه نشان داده دنبال تکرار خود نیست و اینکه پلتفرم بعدی‌اش را صرفا «سوییچ ۲» بداند خلاف عادتش است. از آنجا که تا پرده‌برداری از اطلاعات رسمی فاصله‌ی چندانی نداریم امید می‌رود که از این کنسول جدید اطلاعات بیشتری کسب کنیم.

منبع: Digital Foundry


توضیحات مترجم

۱. Mobile Processor: پردازنده‌ای که در دستگاه‌هایی مثل گوشی موبایل و لپ‌تاپ و تبلت و دیگر کامپیوترهای قابل حمل استفاده می‌شوند.

۲. nvCOMP: لایبرری‌ای که با آن می‌شود دیتاهای مختلف را با کمک جی‌پی‌یو فشرده‌سازی یا فشرده‌زدایی کرد. این فشرده‌سازی از نوع بدون اتلاف/Lossless Compression است، یعنی می‌توان دیتای اصلی را از دیتای فشرده‌شده به‌طور کامل استخراج کرد بدون اینکه در این فرآیند اطلاعاتی از بین برود.

۳. API، مخفف Application Programming Interface، مثل پیغام‌رسانی است که بین سیستم‌های نرم‌افزاری مختلف ارتباط برقرار می‌کند. این پیغام‌رسان قوانین و پروتکل‌هایی پیاده می‌کند تا یک نرم‌افزار بتواند از قابلیت‌ها یا خدمات یک نرم‌افزار دیگر هم استفاده ببرد. API را به چشم یک گارسون در رستوان ببینید. وقتی به رستوان می‌روید تا غذا سفارش دهید مستقیما به آشپزخانه و سراغ آشپز نمی‌روید، بلکه ابتدا شما (نرم‌افزار) با یک پیغام‌رسان (گارسون یا همان API) صحبت می‌کنید تا دستورات‌تان را به آشپز (نرم‌افزار دیگر) برساند.

نمونه‌ی مثال بالا در دنیای دیجیتالی می‌شود چیزی مثل اپلیکیشن پیش‌بینی آب‌ و هوا. خود اپلیکیشن قابلیت پیش‌بینی ندارد بلکه با API به یک نرم‌افزار یا سرویس دیگر درخواست می‌دهد تا دیتای لازم برای پیش‌بینی آب و هوا را برایش ارسال کند. اینگونه اپلیکیشن می‌تواند آخرین پیش‌بینی‌های آب و هوایی را نشان دهد بدون اینکه برنامه‌نویس شخصا الگوریتمی برای پیش‌بینی آب‌ و هوا کدنویسی کرده باشد. به‌طور خلاصه، ای‌پی‌آی مثل واسط بین نرم‌افزارهای مختلف است تا با هم تعامل کنند و دیتایشان را به اشتراک بگذارند، مثل گارسونی که رابطه‌ی بین شما و آشپزخانه‌ی رستوان را ممکن می‌کند.

۴. Tensor Cores: سخت‌افزارهایی که در بعضی از جی‌پی‌یوها وجود دارند و بیشتر در حل معادلات ماتریس به سیستم کمک می‌کنند. انویدیا با معماری‌های ولتا/Volta و تورینگ/Turing اولین بار این هسته‌ها را به جی‌پی‌یوهای خود اضافه کرد. هدف از طراحی آنها این بوده که کار هوش مصنوعی و دیپ لرنینگ سریع‌تر شود چون در این حوزه‌ها معادلات ماتریس بسیار پرکاربرد هستند. هسته‌های تنسور ازاین‌نظر مثل ریاضی‌دانان ابرهوشمندی می‌مانند که این معادلات ماتریس را سریع حل می‌کنند. آنها را می‌توان به چشم یک آشپز متخصص در رستوران دید. با اینکه دیگر هسته‌های عادی جی‌پی‌یوها در پخت‌وپز انواع و اقسام غذاهای معمولی مهارت دارند، اما هسته‌های تنسور مثل آشپزهایی‌اند که فقط غذاهای خیلی حساس و ویژه مثل سوشی و خاویار می‌پزند.

۵. Clock gating: تکنیکی در مدارهای دیجیتالی که با غیرفعال‌کردن گزینشی سیگنال‌های کلاکی که در آن لحظه بلااستفاده مانده‌اند، به مصرف انرژی کمک می‌کند. مثل خاموش کردن لامپ اتاق‌های خالی برای ذخیره‌ی برق است. کلاک گیتینگ هم در پردازنده‌ها زمانی که ببیند بعضی از بخش‌ها فعلا استفاده نمی‌شوند آنها را خاموش می‌کند. مثلا وقتی پردازنده‌ای کار زیادی نمی‌کند یا در حالت low-power است، کلاک گینینگ هم مثلا واحد منطق محاسباتی (ALU) یا دیگر بخش‌ها را غیرفعال می‌کند. این تکنیک چون مصرف انرژی را در ریزپردازنده‌های مدرن تا ۵۰ درصد کاهش می‌دهد، خصوصا برای پلتفرم‌های قابل حملی چون سوییچ ۲ و افزایش عمر باتری‌شان بسیار مفید است.

۶. Optical flow accelerator: قطعه‌ای سخت‌افزاری یا الگوریتمی نرم‌افزاری که با آن حرکات اجسام در توالی صحنه‌ها تخمین زده می‌شود. جهت سرعت پیکسل‌های بین فریم‌های متوالی محاسبه شده تا مشخص شود چقدر آبجکت در طول زمان در حال حرکت بودند. برای مثال ویدئوی ماشینی که روی جاده حرکت می‌کند را تصور کنید. این ابزارْ ویدئو را تحلیل و مسیر و سرعت ماشین را از طریق‌ فریم‌ها تعیین می‌کند. این اطلاعات برای اپلیکیشن‌های مختلفی مثل ردگیری آبجکت‌ها و مسیریابی‌ها مفید است.