آشنایی تخصصی با هسته های Tensor در کارت های انویدیا

هسته های پردازش جریانی انویدیا را عمدتا با نام CUDA می شناسیم؛ اما این شرکت در حین معرفی بخشی از معماری ولتا (Volta) در کنار شتاب دهنده های گرافیکی NVIDIA Tesla V100 به یک گروه جدید از هسته های پردازشی اشاره کرد که با نام تنسور (Tensor) شناخته می شوند. این هسته دارای عملکرد بسیار توانمندی بوده و متاسفانه ویژگی های آن در بین اخبار روزانه گم شده و آنطور که باید بدان ها پرداخته نشده است. در این مطلب قصد معرفی هسته های جدید این شرکت با نام Tensor را به شما عزیزان داریم.

هسته های تنسور به تنهایی یک معماری انقلابی در صنعت GPU هستند که برای نخستین بار با ریزمعماری NVIDIA Volta همراه شدند؛ با این وجود ظاهرا تزریق آنها در معماری های دیگر نیز بلامانع است. به گفته انویدیا، عملکرد Tensor ها در مقابل معماری Pascal، تا 50% صرفه جویی انرژی را به همراه خواهند داشت که فراتر از کاهش ابعاد لیتوگرافی خواهد بود. این عملکرد بهبود یافته تنها به مصرف انرژی بسنده نکرده و در پردازش های شناور ممیزی یا همان اعداد اعشاری بر اساس ورودی های 32 و 64 بیتی (FP32/FP64) نیز شاهد پیشرفت های چشمگیری در آنها هستیم.

Tensor Cores به طور خاص برای یادگیری عمیق طراحی شده است و تحلیل نتیجه گیری در آنها تا 6 برابر افزایش یافته است. همچنین برای پیشروی در پردازش های فوق نیز شاهد سرعت عملکرد 12 برابری و سرعت پردازش آنها در یادگیری عمیق و تحلیل داده ها به طور نهایی و همزمان نیز تا 3 برابر به نسبت معماری پیشین، پیشرفت داشته است. به عنوان مثال، 640 هسته Tensor در Tesla V100 به کار رفته است؛ آنها از آرایه 4×4 استفاده می کنند. در بخش آرایه و الگوریتم های پردازش، دانشجویان سخت افزار و نرم افزار آشنایی کافی را خواهند داشت. در آرایه های 4×4 میزان خطا نیز به طور قابل توجهی کاهش خواهد یافت.

انویدیا مسیرهای مرتبط با هسته های Tensor را به طور جدا از دیگر هسته های CUDA طراحی کرده است تا بدین ترتیب بهره وری انرژی و توانایی پردازش اعداد اعشار را در آنها افزایش دهد. هر یک از هسته های Tensor در هر سیکل قادر به پردازش 64 عملیات ترکیبی شناور هستند. سرعت بالای هسته های Tensor نه تنها بسیار بالاتر از معماری Pascal است، بلکه سروری هایی که از این شتاب دهنده های گرافیکی استفاده می کنند نیز تا 47 برابر سریعتر از مدل های مشابهی هستند که از CPU برای این منظور استفاده می کنند. به واقع هسته های تنسور برای کاربردهای کاملا تخصصی نظیر تولید محتوا، فعالیت های نظامی، پزشکی، هوا فضا، اکتشافات و صد ها کاربرد مشابه دیگر طراحی شده است. سرورهای مبتنی بر این هسته ها می توانند از طریق "فضای ابری" نیز خواسته های مشتریان را پاسخ داده و به عنوان یک منبع درآمد به حساب آیند.

اما این عملکرد سخت افزاری بدون ابزارهای توسعه نرم افزار، کاربرد چندانی نخواهند داشت؛ از این رو انویدیا ابزارهای توسعه (NVIDIA Deep Learning SDK) نظیر cuDNN, NCCL و TensorRT را برای این منظور آماده کرده و در اختیار توسعه دهندگان قرار می دهد. شایان ذکر است که معماری Volta با 21 میلیارد ترانزیستور، قدرتمندترین معماری GPU است که جهان تا به حال دیده است.

(12 رای‌ها)
  • هیچ دیدگاهی یافت نشد

دیدگاه خود را اضافه کنید.

ارسال دیدگاه به عنوان مهمان

0
دیدگاه شما پس از تایید مدیریت منتشر خواهد شد.

تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.