Search

গ্রাফিক্স কার্ড সম্পর্কে খুঁটিনাটি, বিভিন্ন Specification এর ব্যাখা জেনে নিন

কম্পিউটারের অনেকগুলো কম্পোনেন্ট এর মধ্যে গুরুত্বপুর্ণ একটি কম্পোনেন্ট হলো গ্রাফিক্স কার্ড। কয়েক বছর আগেও আমাদের দেশে এর ব্যবহার, প্রয়োজনীয়তা ও চাহিদা  গুটিকয়েক লোকের মধ্যে সীমাবদ্ধ থাকলেও বর্তমানে বিভিন্ন কারণে প্রচুর মানুষ গ্রাফিক্স কার্ড দিয়ে পিসি বিল্ড করেন,গ্রুপে পোস্ট করেন ও ইউটিউবে ভিডিও দেখেন ও গ্রাফিক্স কার্ডের বাজারের দিকেও লক্ষ রাখেন। আজকের আর্টিকেলটি গ্রাফিক্স কার্ডের কোনো বায়িং গাইড নয়, বরং আজকের আর্টিকেলে আমরা আলোচনা করবো গ্রাফিক্স কার্ডের basic পরিচয় ও এর সাথে সম্পর্কিত বিভিন্ন terms ও স্পেসিফিকেশন এর ব্যাখা যেগুলো আমরা গ্রাফিক্স কার্ডের বক্সে, ওয়েবসাইটে,শপ গুলোতে,ইউটিউব ভিডিওতে দেখে থাকি ও শুনে থাকি। আজকের আর্টিকেলে গ্রাফিক্স কার্ড কি??? গ্রাফিক্স কার্ড কাকে বলে? গ্রাফিক্স কার্ডের কাজ, গ্রাফিক্স কার্ড দিয়ে কি করে?? গ্রাফিক্স কার্ডের বিভিন্ন অংশ, গ্রাফিক্স কার্ডের ব্যবহার ইত্যাদি সাধারণ কিছু প্রশ্নের উত্তর দেওয়া হয়েছে।

প্রথমেই আমরা গ্রাফিক্স কার্ড সম্পর্কে প্রাথমিক ধারণা ও Graphics card vs GPU এর মধ্যকার পার্থক্য নিয়ে সংক্ষিপ্ত আলোচনা করার পর মুল আলোচনায় প্রবেশ করবো।

গ্রাফিক্স কার্ড কি, / GPU কি? / GPU কাকে বলে? / GPU এর কাজ কি? / গ্রাফিক্স কার্ড এর কাজ ,বর্তমানে গ্রাফিক্স কার্ডের বহুবিধ ব্যবহারঃ

গ্রাফিক্স কার্ড হচ্ছে আমাদের কম্পিইউটারে মাদারবোর্ডের এক্সপ্যানশন স্লটে সংযুক্ত একটি ডিভাইস যার প্রধান ও মৌলিক কাজ হচ্ছে আউটপুট ডিস্প্লে তে দেখানো বা রেন্ডার করা, মনিটরে ছবি দেখানো। আমরা যে কাজই করি না কেন কম্পিউটারে, তা মুলত visible হয় মনিটর বা কোনো একটি আউটপুট ডিভাইসে, আর এই আউটপুট ডিভাইসে দেখানোর জন্য কাজ করে যে ডিভাইসটি সেটিই হচ্ছে Graphics card. এর মুল কাজ হচ্ছে ছবি,image, video, রেন্ডার করা,প্রসেস করা, অর্থাৎ এক কথায় graphical যত ধরনের data আছে তা প্রসেস,হ্যান্ডেল, রেন্ডার করে দেখানোই হলো গ্রাফিক্স কার্ডের কাজ। গ্রাফিক্স কার্ড (সেটি Discrete হোক বা dedicated/internal হোক, এর আলাদা মেমোরি থাকে যেখানে গ্রাফিকাল ডাটা টেম্পোরারি/অস্থায়ীভাবে রাখা হয় বা যেই মেমোরি থেকে GPU ডাটা এক্সেস করে প্রসেস করে) । মোটকথা বাইনারী বা ম্যাশিন ল্যাঙ্গুয়েজকে পিকচার বা visible ছবিতে পরিণত করা বা convert করার কাজটাই করে গ্রাফিক্স কার্ড।

আমরা মনিটরে যা কিছু দেখতে পাই, এর পুরাটাই গ্রাফিক্স কার্ডের মাধ্যমে আউটপুট ডিভাইসে সরবরাহ করা হয়। সিস্টেমে গ্রাফিক্স কার্ড না থাকলে মনিটরে কোনো সিগনালই আসবে না যদিও ব্যাকগ্রাউন্ডে কম্পিউটার চালু হবে ১০০% কিন্ত আমরা গ্রাফিকাল কোনো ডাটাই দেখতে পাবো না কারণ সেটি প্রসেস করার মত ডিভাইস অনুপস্থিত। বিট/বাইট গ্রাফিকাল ডাটায় বা গ্রাফিক্স ফাইলে কনভার্ট করাই মুলত এর কাজ।

উপরে যদিও সাধারণ সংজ্ঞা দেওয়ার সময় বলা হয়েছে যে গ্রাফিক্স কার্ড একটি এক্সপ্যানশন কার্ড যেটি মাদারবোর্ড এর মাধ্যমে কম্পিউটারে যুক্ত থাকে, কথাটি সব সময় সত্য নয়, বরং ডেডিকেটেড বা ডিসক্রিট গ্রাফিক্স কার্ডের জন্যই কেবল এটি প্রযোজ্য, কারণ অনেক ক্ষেত্রে গ্রাফিক্স কার্ড সরাসরি প্রসেসর এর মধ্যে integrated থাকে, অর্থাৎ Graphics Processing Unit বা GPU টি প্রসেসরের সাথেই সংযুক্ত থাকে বা একত্রে থাকে। এক্ষেত্রে এক্সপ্যানশন স্লট এর ব্যবহার ছাড়াই GPU টি পিসিতে কানেক্টেড থাকছে।

গ্রাফিক্স কার্ডের ব্যবহারঃ

এখান থেকে গ্রাফিক্স কার্ডের মৌলিক বা প্রধান কাজ সম্পর্কে মোটামুটি একটা ধারণা আমরা পেলাম। তবে বর্তমান যুগে গ্রাফিক্স কার্ড এর ব্যবহার শুধু মাত্র ডিস্প্লে তে আউটপুট দেখানোর মধ্যেই সীমাবদ্ধ নেই  প্রকৃতপক্ষে গ্রাফিক্স কার্ডের কাজ ও ব্যবহার এখন অগণিত।

  • যেকোনো গ্রাফিকাল এলিমেন্ট যেমন ছবি/ভিডিও/এনিমেশন/ডিজাইন মুলত রেন্ডার হয় GPU এর সাহায্যেই। হোক সেটি ডিস্ক্রিট বা Dedicated. dedicated এর ক্ষেত্রে প্রসেসর এর সাথে যে integrated GPU থাকে, সেই GPU উক্ত কাজ করে থাকে।
  • ভিডিও রেন্ডারিং/এক্সপোর্ট এর কাজে গ্রাফিক্স কার্ড ব্যবহ্বত হয়।
  • এনিমেশন/গেম খেলা, গেম ডিজাইন করা/ডেভেলপ করার কাজে গ্রাফিক্স কার্ড ব্যবহ্বত হয়।
  • 3d animation design,architecture,cartoon,movie making এ GPU এর ব্যবহার রয়েছে।
  • অনেক ধরনের ক্রিপ্টোকারেন্সি রয়েছে যেগুলো GPU এর VRAM ব্যবহার করে মাইন করা হয়ে থাকে যাকে GPU মাইনিং বলা হয়।
  • রে ট্রেসিং এর জন্য GPU ব্যবহ্বত হয়।
  • professional computer-aided design (CAD), computer-generated imagery (CGI), digital content creation (DCC) applications, scientific calculations and machine learning, high-performance computing/GPGPU applications ব্যবহার  এর কাজেও GPU ব্যবহার করা হয় ও এসব কাজের জন্য উপযোগী গ্রাফিক্স কার্ড ব্রান্ড গুলো তৈরী করে থাকে।
  • ক্লাউড গেমিং, VR Games and Apps, deep learning, artificial neural network সহ অন্যান্য জটিল সব Artificial intelligence এর কাজেও GPU ব্যবহ্বত হয়।

কিছু কিছু বিষয় বিবেচনায় গ্রাফিক্স কার্ড নিজেই একটা ছোটখাট কম্পিউটারঃ

সাধারণ অর্থে আমরা জেনে থাকি বা বুঝে থাকি অথবা বলে থাকি যে  প্রসেসর,মাদারবোর্ড,র‍্যাম,স্টোরেজ একত্রে কম্পিউটার constitute করে বা কম্পিউটার এই উপকরণগুলোর নিয়মমাফিক একত্রিকরণের ফল। সেক্ষেত্রে বলা যেতে পারে যে গ্রাফিক্স কার্ড নিজেও প্রায় একটি কম্পিইউটারের মতই কাজ করে। কারণ একটি গ্রাফিক্স কার্ডের রয়েছে প্রসেসর, নিজস্ব মাদারবোর্ড (PCB), সেই মাদারবোর্ড এর বায়োস ও রয়েছে, নিজস্ব মেমোরি চিপ,মেমোরি কন্ট্রোলার রয়েছে।

Graphics card vs GPU

এতক্ষণ যতটুকু আলোচনা করা হয়েছে সেখানে একটি বিষয় লক্ষ করে কিছু পাঠক হয়তো বিভ্রান্ত হয়েছেন যে এক জায়গায় GPU বলা হচ্ছে আবার পরক্ষণে গ্রাফিক্স কার্ড বলা হচ্ছে। এ দুটি জিনিস কি এক, নাকি আলাদা, একটির সাথে আরেকটির সম্পর্ক কি? আজকের আলোচনাটাই বা কিসের উপরে? এর বাইরেও আমরা দেশি বিদেশী আর্টিকেলগুলোতে, ইউটিউবে, ফেসবুক গ্রুপ,পেজগুলোর পোস্টে GPU, Graphics Card এই দুটি শব্দের simultaneous ব্যবহার দেখে থাকি। নিচে এর ব্যাখাটাও করে দেওয়া যাক।

মুলত সোজা বাংলায় যদি বলা হয়, তাহলে গ্রাফিক্স কার্ড এর প্রধান অংশ হচ্ছে Graphics Processing Unit বা GPU, কিন্ত বাস্তব জীবনে আমরা Metonymy হিসেবে গ্রাফিক্স কার্ড ও GPU পরষ্পর exchange করে নিয়মিত ব্যবহার করে থাকি। মুলত form factor,size এর উপর ভিত্তি করে GPU  Dedicated বা discrete/internal/integrated ইত্যাদি প্রকারের হয় , এর মধ্যে dedicated বা discrete GPU বলতে সাধারণত গ্রাফিক্স কার্ড কে বোঝানো হয়।

সাধারণত PCIe slot এ আলাদাভাবে এক্সপ্যানশন কার্ড হিসেবে যেটি ম্যানুফ্যাকচারড হয় সেটিই গ্রাফিক্স কার্ড। পার্থক্যের কথা যদি বলি, GPU দিয়েই গ্রাফিক্স কার্ড তৈরী হয়।

GPU এর পুর্ণ রুপ হচ্ছে Graphics Processing Unit. কম্পিইউটারের প্রসেসর এর মত যাবতীয় প্রসেসিং,ক্যালকুলেশন এই GPU ই করে থাকে। পার্থক্য হচ্ছে GPU এর দায়িত্ব সবধরনের ডাটা নয় বরং pixel, graphical data নিয়ে কাজ করা, এগুলোর processing, rendering,transformation নিয়ে concerned থাকে GPU। বিলিয়ন বিলিয়ন মাইক্রোচিপ,ট্রাঞ্জিস্টর দিয়ে তৈরী হয় একটি জিপিইউ। প্রসেসর এর তুলনায় আরো বেশি জটিল ও কমপ্লিকেটেড ডিভাইস হচ্ছে জিপিইউ, এর ফাংশন ও তুলনামুলক বেশি জটিল।

এটিই মুলত গ্রাফিক্স কার্ডের প্রধান অংশ, brain বা মাথা।

গ্রাফিক্স কার্ড এর গঠনঃ

একটি গ্রাফিক্স কার্ড মুলত একটি PCB বোর্ডের উপর Graphics Processing Unit বা GPU এর সাথে VRAM (Video-Memory),RAMDAC,মেমোরি কন্ট্রোলার সহ আরো অন্যান্য প্রয়োজনীয় কম্পোনেন্ট উপস্থিত থাকে।PC এর প্রসেসর এর মত গ্রাফিক্স কার্ডের মধ্যেও থাকে মাদারবোর্ড। যেটার উপরেই জিপিইউ মেমোরি সহ অন্যান্য সব কিছু মাউন্ট করা থাকে।  সাথে থাকে একটি বা একাধিক Output Port যেমন VGA,HDMI,Displayport। এর সাথে কুলিং এর জন্য Heatsync,Fan যোগ হয়, থাকতে পারে বাহারি ডিজাইন এর লোগো,ব্যাকপ্লেট ও RGB. নিচের প্রথম ছবিটি NVIDIA RTX 4090 এর GPU AD302 এর, দ্বিতীয় ছবিটি Colorful RTX 4090 NB EX-V এর PCB এর।

গ্রাফিক্স কার্ড অনেক ব্রান্ড ম্যানুফ্যাকচার করলেও মুল বোর্ড বা GPU এর সাথে মেমোরি,একদম বেসিক ইউনিট গুলো তৈরী করে মুলত দুইটি ব্রান্ড, এএমডি ও এনভিডিয়া ( বর্তমানে এই ব্যবসায় ইন্টেল ও নামছে)। এর পর তারা পুর্ণাঙ্গ গ্রাফিক্স কার্ড বানানোর ক্ষেত্রে অল্প কিছু মডেল নিজেরাই দায়িত্ব নিয়ে বানায় যেগুলো হয় exclusive, বাজারে যেগুলো reference model/founders edition নামে পরিচিত ।

কাস্টম গ্রাফিক্স কার্ডসঃ

এর বাইরে বিপুল সংখ্যক GPU সম্বলিত Board গুলো দিয়ে দেওয়া হয় Board Partner দের কাছে (এদেরকে AIB Partner বলা হয়, উল্লেখযোগ্য AIB Partner দের মধ্যে অন্যতম হলো MSI,ASUS,GIGABYTE,Sapphire,XFX,EVGA,PALIT,PNY,Colorful,Powercolor,Galax,Zotac ইত্যাদি।

Explaining Custom Graphics Card Models:

বাজারে নানান রকমের Custom Model এর নানান রংঢং এর নাম দেখতে পাওয়া যায়। এই নামগুলোর ব্যাখা কি , কোনটা দিয়ে কি বোঝায় এগুলো অনেকেই জিজ্ঞাসা করে থাকেন। যেমন Colorful GeForce RTX 3060 NB 12G EX L-V এই নামের প্রথমের অংশ ব্রান্ড বা সাবব্রান্ড হিসেবে Colorful কে বুঝাচ্ছে, এরপর Geforce দ্বারা Main GPU Maker এনভিডিয়ার Geforce Family এর কথা বুঝানো হচ্ছে, এরপর RTX দিয়ে Geforce এর একটি Subcategory RTX কে বুঝানো হচ্ছে। এরপর 3060 হচ্ছে Specific GPU বা SKU টির নাম যেটি RTX 3000 সিরিজের অন্তর্ভুক্ত । এরপর 12G দিয়ে 12GB VRAM এর দিকে ইঙ্গিত করা হচ্ছে। EX হচ্ছে কালারফুলের অন্যান্য RTX 3060 মডেল থেকে আলাদা করার জন্য ও এই মডেলের কোনো বিশেষ বিশেষত্বের কারণে যোগ করা একটি term. এখানে অনেক সময় OC ও লেখা থাকে, OC বলতে Factory Overclocked বোঝায় অর্থাৎ বেসিক স্পিড থেকে কিছুটা বেশি স্পিডে ক্লকড করে GPU টার কাস্টম মডেল প্রিপেয়ার করা হয়েছে এরকম বোঝানো হয়।

যেমন Colorful এর অন্যান্য RTX 3060 এর মডেল গুলোর মধ্যে রয়েছেঃ Bilibili Esports Edition OC, NB EX L-V,Customization OC, NB-Duo, Mini OC, Advanced OC  ইত্যাদি। অনেক ক্ষেত্রেই Duo দ্বারা ডুয়াল ফ্যান ভার্সন বোঝানো হয়, Mini দ্বারা Single Fan এর ছোট সাইজের গ্রাফিক্স কার্ডের দিকে ইঙ্গিত করা হয়।

মুল আলোচনাঃ গ্রাফিক্স কার্ড স্পেসিফিকেশন ডিকশনারী

এবার আমরা গ্রাফিক্স কার্ডের সাধারণ কিছু স্পেসিফিকেশন এর সংজ্ঞা, সেগুলো দিয়ে কি বোঝায়, গ্রাফিক্স কার্ড এর শক্তি,ক্ষমতা, কোন কোন বিষয়ের উপর নির্ভর করে একটি গ্রাফিক্স কার্ড আরেকটির থেকে ভালো বা খারাপ বিবেচিত হয় সেগুলো নিয়ে একে একে আলোচনা করবো।

Die

সিপিইউ বা জিপিইউ সিলিকনের যে ক্ষুদ্রতম অংশ বা ইউনিট দ্বারা গঠিত সেটাকেই Die বলা হয়। সিলিকনের ক্ষুদ্রতম অংশ যেখানে ট্রাঞ্জিস্টর ও অন্যান্য প্রয়োজনীয় সার্কিট খোদাই করা থাকে(হয়) তাকেই CPU এর Die বলা হয়। নিচের ছবিতে সিলিকন ওয়েফারের ক্ষুদ্রতম যে বর্গক্ষেত্র গুলো দেখা যাচ্ছে, সেগুলো এক একটি Die. Wafer থেকে এই Die গুলোকেই কেটে নেওয়া হয় যেটিকে CHIP বলেই ডাকি আমরা বেশিরভাগ ক্ষেত্রে।

Die Size

একটি ডাই/চিপ এর সাইজ /আকার বোঝানো হয় ডাই সাইজ (Die size) দিয়ে। CPU-Z/GPU-Z থেকে আপনার প্রসেসর// গ্রাফিক্স কার্ডের Die size আপনি সহজেই জানতে পারবেন।

Architecture

GPU যে প্রযুক্তির উপর ভিত্তি করে প্রস্তুত করা হয়েছে সেটাকেই আর্কিটেকচার বলে। গ্রাফিক্স কার্ড/জিপিইউ বা প্রসেসরের আর্কিটেকচার অবশ্যই সময়ের সাথে সাথে আরো উন্নত হয় (অর্থাৎ একটা আর্কিটেকচার বা টেকনোলজির থেকে পরের আর্কিটেকচারে সাধারণত বেশি পাওয়ারফুল জিপিইউ/সিপিইউ, বেশি পাওয়ার এফিসিয়েন্সি /বেটার প্রাইস টু পারফর্মেন্স রেশিও, বেটার Raw performance,computing ability পাওয়া যায়)। কোনো কোনো ক্ষেত্রে টেক জায়ান্টরা প্রতিটি জেনারেশনেই নতুন নতুন আর্কিটেকচার ব্যবহার করে  ,অথবা কিছু ক্ষেত্রে আগের আর্কিটেকচারকে আরো উন্নত করে, polished বা এনহ্যান্স করে ব্যবহার করে থাকে।

প্রতিটি আর্কিটেকচারেই কিছু সিগনেচার ব্যাপার স্যাপার থাকে যা আগের জেনারেশন এর থেকে আলাদা ও নতুন সংযোজন হিসেবে হাইলাইট করা হয়।

গ্রাফিক্স কার্ডের মধ্যে যা যা থাকে তার মধ্যে কিছু জিনিসপত্র GPU এর মধ্যে থাকে, কিছু থাকে PCB তে আলাদা ভাবে, যেমন মেমোরি। মেমোরি কনফিগারেশনের আগে আমরা GPU এর মধ্যকার কিছু জিনিস ,যেমন কুডা কোর, টেন্সর কোর, আরটি কোর,স্ট্রিমিং প্রসেসর ইত্যাদি নিয়ে আলোচনা করবো। তারপর মেমোরি ও পাওয়ার স্পেকস নিয়ে কথা হবে।

Cuda Core

CUDA (কুডা), যার পুর্ণরুপ Compute Unified Device Architecture এনভিডিয়ার নিজস্ব গ্রাফিক্স প্রসেসরের কোর।এটাকে প্রসেসরের কোরের সাথে তুলনা করা যেতে পারে, সিপিইউ কোরের তুলনায় জিপিইউ কোর কে যেমন অনেক বেশি জটিল ও কঠিন কাজ করতে হয়, একই সেকেন্ডে অনেক ক্যালকুলেশন করতে হয়, সেজন্য এর শক্তি ও সিপিইউ কোরের তুলনায় অনেক বেশি হতে হয়। এজন্য দেখা যায় প্রসেসরগুলো ২-৪,৬-৮ থেকে ১৬-২৪ কোরের বেশি যেতে পারেনি, সেখানে এনভিডিয়ার জিপিইউ গুলোর মধ্যে হাজার হাজার কুডা কোর রয়েছে। এটা একই সাথে প্রয়োজন,গঠনগত বৈশিষ্ট্যের কারণেই হয়েছে বলা যায়। এটি এনভিডিয়ার একটি প্যারালাল কম্পিউটিং প্লাটফর্ম যেখানে শত শত কোর একসাথে কাজ করতে পারে। অন্য দিক দিয়ে চিন্তা করলে একটি CPU এর সাথে এর পার্থক্য রয়েছে, CPU Instruction ALU এর মাধ্যমে Fetch,decode,execute করে, অন্যদিকে CUDA এর কাজ খালি ফ্লোটিং পয়েন্ট ম্যাথ করা। এটি মুলত একটি Programming API.

একটা বড় পানির ট্যাংক যদি হয় আমাদের calculation,task বা জটিল কাজ/গ্রাফিক্স প্রসেসিং, তাহলে কুডা কোরকে তুলনা করা যেতে পারে সেখানে সংযুক্ত একই মাপের একই ধরনের একই ব্যাস,দৈর্ঘ্য এর পাইপ যেগুলোতে একসাথে সমান পরিমাণ পানি চলাচল করতে পারে। স্বাভাবিকভাবেই আমরা এই ট্যাংক এ যত বেশি এরকম পাইপ লাগাবো,ট্যাংক টি খালি হতে ততই কম সময় লাগবে (অর্থাৎ কাজ দ্রুত শেষ হবে)।

এনভিডিয়া তাদের গ্রাফিক্স কার্ড/জিপিইউ এর নতুন নতুন আর্কিটেকচারে পুর্বের তুলনায় শক্তিশালী ও বেশি সংখ্যক কুডা কোর যোগ করে থাকে প্রতিবারই। এর জন্য গ্রাফিক্স কার্ড গুলোর power,ability,calculation করার ক্ষমতা, স্মুদ পার্ফর্মেন্স দেওয়া,বেশি এফপিএস দেওয়ার ক্ষমতাও বৃদ্ধি পায়।

আর্কিটেকচারের প্রসেস সাইজ কমে আসলে তখন বেশি কুডা কোর জিপিইউ এ দেওয়া সম্ভব হয়। CUDA Core এনভিডিয়ার AMD Equivalent Streaming processor হিসেবেও আখ্য্যায়িত করা যায় (যেটি নিয়ে আমরা পরবর্তী সেকশনেই আলোচনা করবো)। আমরা দেখেছি প্রতিটি জেনারেশনেই exponentially বেড়েছে কুডা কোরের সংখ্যা, কয়েকশত থেকে শুরু করে এখন RTX 40 সিরিজের 4090 জিপিইউ তে রয়েছে ১৬ হাজারের ও বেশি সংখ্যক কুডা কোর। প্রথম Fermi GPU গুলো ৫১২টি পর্যন্ত কুডা কোর বহন করতো (৩২ কোরে ১৬টি করে SM) নিচের প্রথম ছবিতে CUDA Core এর Structure ও দ্বিতীয় ছবিতে Fermi GPU এর ডায়াগ্রাম এর মাধ্যমে আমরা CUDA Core অধ্যায় এর সমাপ্তি করছি।

Stream Processors

NVIDIA এর CUDA কোরের মতই AMD এর রয়েছে Stream Processors । মোটামুটি উদ্দেশ্য এনভিডিয়ার CUDA Core (কুডা কোর) এর ও যা, AMD এর স্ট্রিম প্রসেসরস এর ও ঠিক তাই, parallel  ইন্সট্রাকশন হ্যান্ডেল করা, দ্রুততর সময়ে calculation করা হাজার হাজার, লক্ষ-লক্ষ ইন্সট্রাকশন প্রসেস করাই এর মুল কাজ। তবে সাধারণ ভাবে তুলনা করা গেলেও দুটি জিনিস কে মিলিয়ে ফেলা, একই criterion এ ফেলে তুলনা করার সুযোগ নেই কারণ CUDA,Streaming processor এর সাইজ,ফ্রিকোয়েন্সি ,internal architecture সবই একে অপরের থেকে আলাদা। অপ্টিমাইজেশন,সাপোর্ট এর দিক দিয়েও রয়েছে পার্থক্য। আবার যদি সংখ্যার দিক দিয়েও তুলনা করার সুযোগ নেই ।ট্রাঞ্জিস্টর কাউন্টকে যদি আমরা KEY FACTOR বা নরমালাইজড ফ্যাক্টর ধরে তুলনা করি, তাহলে দেখা যায় RTX 3080 Ti এর 28.3বিলিয়ন ট্রাঞ্জিস্টরে আছে ১০ হাজার+ কুডা কোর। আবার 26 Billion Transistor যুক্ত 6900XT তে আছে ৫১২০টি Stream processors। রিয়েল ওয়ার্ল্ডের পারফর্মেন্স এর হিসেবে ও গ্রাফিক্স কোয়ালিটিতে এমনিতে কোনো পার্থক্য নাই দুই জায়ান্ট এর দুই প্রযুক্তিতে তবে ডেভেলপারস সাপোর্ট এর দিক দিয়ে এনভিডিয়া একটু এগিয়ে আছে।

SM

এনভিডিয়ার GPU গুলো যে ছোট ছোট ব্লকে ভাগ করা থাকে, বা আরেকভাবে বলা যায়, এক একটি বড় ইউনিট এর মধ্যে উপরে আলোচিত Cuda Cores গুলো ভাগ করা থাকে, এই এক একটা বড় Unit কে বলা হয় SM। SM এর পুর্ণ রুপ হচ্ছে Streaming Multiprocessors.

এক একটি SM এ Cuda Cores এর সাথে Tensor Cores,RT Cores ও থাকে। এক এক আর্কিটেকচারে SM এর সংখ্যা ও যেমন বৃদ্ধি পায়,তেমনি SM এর মধ্যকার Components গুলোর সংখ্যা ও বাড়তে পারে।

এই বিষয়ে ডায়াগ্রাম সহ জানতে আমাদের 4090 রিভিউ ভিডিওটি দেখতে পারেন/আর্টিকেল পড়তে পারেন।

RTX 4090 বাংলা রিভিউ

TMU and Texture fill rate

Texture Mapping Unit (TMU) এর কাজ Texture map করা। পিক্সেলে টেক্সচার এপ্লাই করা, এটি একটি ফিজিক্যাল ইন্ডিপেন্ডেন্ট কম্পোনেন্ট যেটির বিট্ম্যাপ মডিফাই করার ক্ষমতা আছে (rotate,scale,skew,fit,resize,distort)। TMU এর সংখ্যা বেশি থাকা ভালো। এটি ম্যাট্রিক্স অপারেশনের মাধ্যমে কাজ করে।

সেকেন্ডে কত গুলো পিক্সেল বা টেক্সেল জিপিইউটি প্রতি সেকেন্ডে রেন্ডার করতে পারে তার পরিমাপই হলো Texture fill rate। এই হিসেবে Giga texel per second/mega texel per second এরকম করে প্রকাশ করা যায় TFR এর মান। তবে মডার্ন গ্রাফিক্স কার্ড গুলো ইউজার এন্ডে পৌছানোর আগেই পিক্সেল,টেক্সেল ফিল্টার,প্রসেস,রেন্ডার করতে পারে, এই হিসেবে Texture Fill rate মাপার নতুন সুত্র হলোঃ Core clock*TMUs. অর্থাৎ কোর ক্লক ও TMU এর সংখ্যা গুণ করলেই Texture fill rate পাওয়া যায়।  GTX 980 এর ক্ষেত্রে 128 টি TMU ও 1126 মেগাহার্জ ক্লক স্পিডের জন্য Texture fill rate হবে 1126*1000*128 (Mhz এর জন্য 1000)=144.1GT/s । higher is better.

ROP

Render Output Units বা Raster Operation pipeline এর কাজ বেশ জটিল ,তেমনি এর সংজ্ঞা ও সহজে বোঝানোর মত না। স্ক্রিনে দেখানোর আগে ফাইনাল পিক্সেল ভ্যালুকে যেটা প্রসেস করে তাকেই ROP বলা হয়। এর কাজ মেমোরিতে পিক্সেল ডাটা রাইট করা। Higher are better.

Tensor Cores and DLSS

এনভিডিয়া তাদের Turing Architecture based RTX 20 সিরিজে প্রথমবারের মত Ray Tracing এর সাপোর্ট নিয়ে আসে। এর সাথে সাথে নিয়ে আসে AI Based image up-scaling Technology যেটার নাম DLSS. এই প্রক্রিয়ায় মুলত কোনো গেমকে জিপিইউটি নেটিভ রেজুলুশন (যেই রেজুলুশন সেটিংস থেকে এপ্লাই করা হয়েছে, Original resolution)তার থেকে কম রেজুলুশনে রেন্ডার করে,স্বাভাবিকভাবেই তাই নেটিভ থেকে বেশি ফ্রেমরেট বা পারফর্মেন্স পাওয়া সম্ভব হয়, আর এইযে কম রেজুলুশনে রেন্ডার করার কারণে ছবি/ইমেজ/গ্রাফিক্স কোয়ালিটি দেখতে যতটা খারাপ হবে/হয়, সেটিকে AI upscale করে Native বা অরিজিনাল কোয়ালিটির কাছাকাছি বা তার থেকে বেটার কোয়ালিটিতে নিয়ে যাওয়ার চেষ্টা করে (এর মধ্যে থাকে শ্যাডো,ডিটেইলস,শার্পনেস,টেক্সচার সহ আরো অনেক কিছু)। এই আপস্কেলিং এর কাজ,বা ইমেজ কোয়ালিটি বাড়ানোর কাজ করার জন্য NVIDIA তাদের GPU গুলোতে কিছু dedicated,স্পেশালাইজড ইউনিট যোগ করে যেগুলোর নাম তারা দিয়েছে Tensor Cores. আমরা দেখেছি এর বিভিন্ন রকমের জেনারেশন রয়েছে ,বছর বছর এই নতুন জেনারেশন এর Tensor core গুলো নতুন আর্কিটেকচারের জিপিইউ গুলোতে দেওয়া হয় তাতে পারফর্মেন্স আরো বাড়ে (ফ্রেমরেট,ইমেজ কোয়ালিটি উভয় ই বাড়ে)। একই সাথে CUDA Core এর মত Tensor Cores এর সংখ্যা ও বৃদ্ধি করে এনভিডিয়া।

এখানে আর্কিটেকচার গত বিভিন্ন পরিবর্তন, working procedure ইত্যাদি বিষয়ে পরিবর্তন আসে বিভিন্ন জেনারেশনের Tensor Core এ । এবং ওই Tensor core ভিত্তিক DLSS ভার্সনে। বিস্তারিত জানতে আমাদের RTX 4090 এর রিভিউ ভিডিও টি দেখতে পারেন,আর্টিকেলটি পড়তে পারেন।

উল্লেখ্য, AMD  এরও নিজেদের Image Upscaling Technology রয়েছে, কিন্ত সেটার জন্য কোনো Dedicated Hardware তাদের GPU তে থাকে না। সফটওয়্যার বেজড FSR,FSR 2.0 তে গেম এর সাপোর্ট থাকলে মুলত Driver level থেকেই আপস্কেল এর কাজটা হয়, GPU এর হার্ডওয়্যার এর তেমন ভুমিকা এখানে থাকে না। উল্লেখ্য, FSR 1 ছিল spatial upscaling technology , পরবর্তীতে AMD Temporal Up-scaling ব্যবহার করে FSR 2.0 তে। DLSS ও Temporal Upscaling প্রযুক্তি।

RT Cores

20 Series এ যে Ray Tracing টেকনোলজির সাপোর্ট দেওয়া শুরু করে NVIDIA,সেখানে রে ট্রেসিং করার জন্য যে Dedicated hardware রয়েছে, অর্থাৎ Ray Tracing প্রক্রিয়াটা সম্পন্ন করে যে হার্ডওয়্যার তাকেই RT Core বলা হয়। Tensor Core এর মত এটিও NVIDIA Geforce RTX GPU গুলোর মধ্যে থাকে নির্দিষ্ট  পরিমাণে। প্রতি জেনারেশনে Tensor cores এর মত RT Core এর সংখ্যা ও বাড়ানো হয়, নতুন আর্কিটেকচার গত পরিবর্তন,enhancement করা হয় ফলে এই কোর গুলো আরো বেশি শক্তিশালী হয় ও Better image produce করতে পারে। উপরের RTX 4090 এর রিভিউ ভিডিও/আর্টিকেলেই এই ব্যাপারে কিছুটা আলোচনা করা আছে। তাছাড়া যদি আরো বিস্তারিত আলোচনা শুনতে চান তাহলে নিচের ভিডিওটিও দেখতে পারেন। আরটি বা রে ট্রেসিং কি, গেমস গুলোতে কিভাবে কাজ করে, কিভাবে implement করা হয় তা নিয়ে এখানে আর বিস্তারিত লিখলাম না কারণ জামান ভাই ভিডিওটি করার আগে বেশ ভালো রকমের রিসার্চ করেছিলেন। মোটামুটি এরকম বলা যায় যে, বাস্তবে বিভিন্ন উৎস থেকে আসা আলো,আলোর reflection,আগুন, সুর্য চাঁদের আলো কোন বস্তুতে পরলে যেরকম reflection, দেখা যায় ঠিক সেরকম রিফ্লেকশন গেমের ইমেজে দেখানোর প্রক্রিয়াটাই ray tracing. আলো একটি বস্তুতে আঘাত করবে, ক্ষেত্রবিশেষে ভেদ করে চলে যাবে কিছু অংশ, কিছু প্রতিফলন হবে (আমাদের চোখে আসবে), কিছু শোষিত হবে। বাস্তব জীবনে ঘটা এই সম্পুর্ণ ব্যাপারটা ভিডিও গেমেও একই রকম ভাবে ,accurate ভাবে simulate করাটাই ray tracing.

AMD এর ক্ষেত্রেও Ray Accelerator নামের হার্ডওয়্যার রয়েছে Ray trace করার জন্য।

এই প্রক্রিয়ায় যে ধাপগুলো, যে অপারেশন গুলো জড়িত থাকে তা মাত্রাতিরিক্ত কঠিন ও resource demanding, আপনারা DLSS ব্যতীত RTX 4090 এর Ray tracing performance দেখলেও কিছুটা আচ করতে পারবেন। DLSS অন না করে RTX অন করলে কি পরিমাণ Framerate কমে যায় (ডেডিকেটেড hardware থাকা সত্তেও)।

Base Clock

GPU এর ক্লক স্পিড বা ফ্রিকোয়েন্সি, যে স্টান্ডার্ড স্পিডে GPU অপারেট করে তাকে বলা হয় Base clock বা Core clock. আরেকটু অন্যভাবে বললে, প্রতি সেকেন্ডে GPU chip এর crystal যতবার oscillate (আবর্তন করে) করে সেটাই GPU এর ক্লক স্পিড/বেস ক্লক/কোর ক্লক। ধরি, RTX 4090 এর 2.1 Ghz clock speed. অর্থাৎ সেকেন্ডে AD302 Chip এর Silicon Crystal 2,100,000 বার অসিলেট করে। অবশ্যই একই সিরিজে,একই আর্কিটেকচারে কিংবা অন্যান্য specification একই রকম হলে দুটি GPU এর মধ্যে যার clock speed বেশি সেটিই বেশি শক্তিশালী,অন্যটির তুলনায় ফ্রেমরেট বেশির দেওয়ার ক্ষমতাও অধিক ।

তবে এটা এরকম কিছু নয় যে 2.1 Ghz কোরক্লক/বেস ক্লক রয়েছে বলে 24/7 এই স্পিডেই GPU টি চলবে। এখানে টেম্পারেচার, VRM Quality,Cooling এবং সবথেকে বড় কথা, কি ধরনের কাজ করা হচ্ছে, GPU টির উপর কতটুকু চাপ পরছে তার উপর নির্ভর করে Clock Speed কত হবে। নিশ্চয় একটি গান চালাতে/কার্টুন দেখতে/মুভি দেখতে কিংবা Desktop এর সাধারণ workload রেন্ডার করতে 2.1Ghz এর দরকার হয় না।

Boost Clock

আর বুস্ট ক্লক হচ্ছে একটা গ্রাফিক্স কার্ড কিছু শর্তসাপেক্ষে সর্বোচ্চ কত ক্লক স্পিডে /কত ফ্রিকোয়েন্সিতে চলতে পারে। পর্যাপ্ত পরিমাণ workload এর সময় যথেষ্ট thermal headroom থাকলে, অর্থাৎ temperature বিপদসীমার থেকে দূরে থাকলে, Power supply PCIe Cable এর মাধ্যমে তাকে যথেষ্ট পরিমাণ Power সরবরাহ করতে পারলে, এবং পিসিবির VRM গুলো যথেষ্ট ভালো মানের হলে একটা GPU বেস ক্লক থেকে বেশ কিছু বেশি ক্লক স্পিডে একটা সর্বোচ্চ লিমিট পর্যন্ত চলতে পারে কিছুক্ষণের জন্য। এটাকেই বুস্ট ক্লক বলা হয়। বুস্ট ক্লক স্পিডে সাধারণত কোনো ডিভাইস ই সারাক্ষণ চলতে পারে না, উপরে উল্লেখিত ব্যাপারগুলোর সাথে সাথে সিলিকন লটারি নামের একটা ব্যাপার ও কাজ করে ,যেই GPU এর লটারি যত ভালো, অনুকুল পরিবেশে তার  ক্লক স্পিড বুস্ট ভ্যালু তে ধরে রাখার ক্ষমতা ও বেশি।

তবে বুস্ট ক্লকের সাথে ওভারক্লক মিলিয়ে ফেলার সুযোগ নেই, Boost Clock GPU এর একটি Automatic process ।এখানে কোনো ভ্যালু ইউজার থেকে ইনপুট দিতে হয় না,ভোল্টেজ,কারেন্ট,ক্লক স্পিডের ভ্যালু সেট করে দেওয়া লাগে না, বরং GPU নিজে থেকেই এটা চালু করে। কিন্ত Overclock এর ক্ষেত্রে ইউজার কে নিজে থেকে ভোল্টেজ,clock সেট করে দিতে হয়।

এক কথায় পর্যাপ্ত Power সরবরাহ সাপেক্ষে, Temperature Maximum Limit থেকে কম থাকা সাপেক্ষে ও GPU এর উপর পর্যাপ্ত Workload থাকা সাপেক্ষে GPU এর নিজে থেকে ক্লক স্পিড কিছুটা বাড়িয়ে নেওয়ার ব্যাপারটিই Boost clock.

Graphics Card এর মেমোরি Specs:

Memory Clock

আমরা জানি GPU এর মধ্যে dedicated memory থাকে যেগুলোকে VRAM বলা হয়। প্রসেসর, গ্রাফিক্স কার্ডের মত র‍্যামের ও স্পিড আছে সেটা তো আমরা কমবেশি জানি।অনুরুপভাবে ,এই VRAM এর ও স্পিড আছে যেটা তার ক্ষমতা,ability নির্দেশ করে। যে স্পিডে গ্রাফিক্স কার্ডের মেমোরি কাজ করে সেটাকেই বলা হয় Memory clock (আমরা এটাকে যদি 3200 Mhz ram,3600 Mhz ram,2400 Mhz র‍্যাম; এরকম র‍্যাম স্পিড এর সাথে তুলনা করি তাহলে আশা করি সহজেই বুঝতে পারবো)। অবশ্যই যত বেশি ক্লক স্পিড, মেমোরি তত দ্রুত textures,assets ও অন্যান্য জিনিসপত্র লোড করতে পারবে অথবা দেওয়া নেওয়া করতে পারবে, (অবশ্যই temporarily কাজ করার সময় মেমোরিতেই সব রকমের অপারেশন করে GPU বা CPU), সুতরাং ফ্রেমরেট, পারফর্মেন্স,স্পিডে ইতিবাচক প্রভাব পরবে যদি মেমোরির ক্লক বেশি হয়।

Higher is better.

Memory Interface

প্রতি ক্লক সাইকেলে কত বিট DATA একটি GPU এর মেমোরি ট্রান্সফার করতে পারে সেটাকে এর Memory Interface বলা হয়। এটা মেমোরির physical bit-width।  এটাকে ৬৪ বিট,১২৮ বিট,১৯২ বিট,২৫৬ বিট এরকম এককে প্রকাশ করা হয়। ক্লক স্পিড হচ্ছে প্রতি ক্লক সাইকেলে কি পরিমাণ data GPU execute করতে পারে সেটা, আর memory interface প্রতি সেকেন্ডে   384 bit করে সেই সংখ্যক ডাটা ট্রান্সফার করতে পারে। অবশ্যই এটা যত বেশি তত ভালো।

Memory Bandwidth

মেমোরি ব্যান্ডউইডথ হচ্ছে theoretically প্রতি একক সময়ে কি পরিমাণ data নিয়ে মেমোরি বাস কাজ করতে পারে সেটার পরিমাণ। গাণিতিক ভাবে প্রকাশ করলে Memory bus witdh,যেটি আমরা এর আগে আলোচনা করলাম, তাকে ৮ দিয়ে ভাগ করে বিট থেকে বাইট এককে রুপান্তর করে নেওয়ার পর ভাগফলকে মেমোরির ক্লক স্পিড দিয়ে গুণ করে তারপর সেটাকে ২ ২ করে মোট ৪ দিয়ী গুন করলে GPU এর Memory Bandwidth পাওয়া যায়।এটা সাধারণত GB/s, এরকম এককে প্রকাশ করা হয়, অর্থাৎ প্রতি সেকেন্ডে কত গিগাবাইট ডাটা ট্রান্সফার করা সম্ভব সেটাকে বলে Memory Bandwidth.

Memory Capacity

যেরকম RAM, কম্পিউটারের সাধারণ মেমোরির ক্যাপাসিটি থাকে যেমন ২জিবি, ৪ জিবি,৮জিবি, একইরকম ভাবে Graphics Memory এর ও ক্যাপাসিটি থাকে (একই ইউনিটে পরিমাপ করা হয়, গিগাবাইট হিসেবে। ৪ জিবি,৬ জিবি,১১জিবি,১৬ জিবি,৮ জিবি বা ১২ জিবি ইত্যাদি)। যত বেশি ক্যাপাসিটি,স্বাভাবিকভাবেই একই সময়ে বেশি পরিমাণ ডাটা সেখানে রাখার সুযোগ পায়, বেশি পরিমাণ ডাটা রেখে কাজ করার সুযোগ পায় GPU,CPU , এজন্য অবশ্যই Memory capacity একই সিরিজে ,একই জিপিইউ এর বা একই ধরনের কনফিগারেশনে মেমোরির অন্যান্য স্পেসিফিকেশন সেম হলে মেমোরি ক্যাপাসিটি যেই গ্রাফিক্স কার্ডে বেশি সেটিই বেটার (যদিও সবসময় তারা বেটার পারফর্ম করবে সেটাও জরুরি নয়, যদি GAME টির বেশি পরিমাণ মেমোরির দরকার হয়, ঠিক তখনই এই বেশি ক্যাপাসিটির GPU টি বেশি ভালো পারফর্মেন্স দেবে)।

Power স্পেসিফিকেশন

TDP,TGP.TBP

TDP হচ্ছে গ্রাফিক্স কার্ড কতটুকু পরিমাণ পাওয়ার খরচ করবে সেটার একটা সাধারণ নির্দেশক। TDP এর পুর্ণ রুপ হচ্ছে Thermal Design Power/profile/Parameter। ।যত বেশি পাওয়ার Consumption, তত বেশি Temperature rise, তত বেশি পারফর্মেন্স। লোড দিলে (সেটা রেন্ডারিং,ভিডিও এক্সপোর্ট/গেমিং/স্ট্রিমিং হতে পারে) গ্রাফিক্স কার্ড কি পরিমাণ পাওয়ার পাওয়ার সাপ্লাই থেকে Draw করবে সেটা বোঝানোর একটা প্যারামিটার হচ্ছে TDP. এটাকে Thermal design, অর্থাৎ তাপ শক্তির সাথে তুলনা করা হয় এই অর্থে যে ঐ পরিমাণ Power এর equivalent heat energy বা যতটুকু heat energy কাজ করার সময় gpu টি উৎপন্ন করে তার equivalent পাওয়ার হচ্ছে ঐ TDP এর মান। এটাকে আমরা সাধারণত ওয়াট এককে প্রকাশ করে থাকি। গ্রাফিক্স কার্ডের স্পেসিফিকেশন এর লিস্টেও এর উল্লেখ থাকে Watt হিসেবে। তবে ঠিক অত ওয়াট ই খরচ করবে গ্রাফিক্স কার্ড টি এমন ধরার ও কারণ নেই। এর থেকে কম কিংবা এর থেকে বেশি পাওয়ার ও কনজিউম করতে পারে বিভিন্ন বিষয়ের উপর নির্ভর করে (তবে এটা একটা সাধারণ Indicator)।

TGP

total graphics power. শুধুমাত্র GPU (সাথে পিসিবি) টি কত ওয়াট পাওয়ার কঞ্জিউম করছে সেটাকে বলে TGP. এখানে কুলিং,লাইটিং সিস্টেম এর পাওয়ার include করা থাকে না।

GPU,PCB,Memories,Controllers,Fans, LED সবকিছু মিলিয়ে যে পাওয়ার খরচ করে, সেটাকে বলে TBP বা total board power.

some of the specs are taken from gamers nexus

 

পরিশেষে-

এখানে আমরা গ্রাফিক্স কার্ডের এমন কিছু স্পেসিফিকেশন নিয়ে আলোচনা করেছি যেগুলো আমাদের সাধারণ মানুষের জন্য জানা কমবেশি গুরুত্বপুর্ণ, তাদের জন্য,যারা গ্রাফিক্স কার্ড কিনতে চান, কোন কোন জিনিসের ভিত্তিতে গ্রাফিক্স কার্ডের রিয়েল ওয়ার্ল্ড পারফর্মেন্স এ কম বেশি হয়, একটি থেকে অন্য মডেল বা GPU তুলনামুলক ভালো বা খারাপ এটা নির্ধারিত হয় ভেতরের যে ব্যাপারগুলোর জন্য, একটা গ্রাফিক্স কার্ড লঞ্চ হলে সেগুলোর যে স্পেসিফিকেশন দেখানো হয়, সেগুলোর মানে কি সেগুলোই কেবল জানানোর চেষ্টা করেছি।মেমোরি কত জিবি, যত জিবি তত ভালো এই ধারণা থেকে বের হয়ে এসে যাতে সাধারণ পাঠকরা বুঝেন যে আরো অনেক কিছু আছে যা দ্বারা ভালো খারাপ নির্ধারিত হয় কেবল সেগুলোই তুলে ধরার একট ক্ষুদ্র প্রচেষ্টা ছিল এটা।

প্রকৃতপক্ষে, একটা গ্রাফিক্স কার্ডের অপারেশন, কাজ করার প্রক্রিয়া অনেক অনেক বেশি জটিল, এর যেসব পরিভাষা আছে, বিভিন্ন terms, বিষয় আছে সেগুলো অনেক বেশি জটিল। তবে সেগুলো আদৌ আমাদের জানার প্রয়োজন নেই যদি না আমরা গবেষক হই। সেগুলো জেনে,বুঝে উপস্থাপন করাও অনেক কঠিন । সেগুলো নিয়ে আমাদের খুব বেশি চিন্তা না করলেও চলবে। একান্তই যাদের জানার ইচ্ছা, তারা গুগল ও ইউটিউব থেকে জানতে পারেন, তবে আমাদের জন্য যেসব পেপারস,গবেষণাপত্র,আর্টিকেল রয়েছে ,সেগুলোও অত্যন্ত কঠিন।

Share This Article

Search