AlgorithmData structure

বাইনারি হীপ (Heap) বা প্রায়োরিটি কিউ (Priority Queue)

Heap data structures Bangla tutorial.

হীপ মূলত একটি বাইনারি ট্রি। কমপ্লিট বাইনারি ট্রি (Complete binary tree) যাকে বলে। কমপ্লিট বাইনারি ট্রিএর শেষ লেভেল বাদে বাকি লেভেলের প্রতিটি নোডে সর্বোচ্চ সংখ্যক চাইল্ড নোড থাকে। শুধ শেষ নোডগুলো পূর্ণ নাও হতে পারে তবে এক্ষেত্রে বাম থেকে ডানে নোডগুলো সাজানো থাকে। নিচের চিত্রে একটি বাইনারি হীপ দেয়া আছে।

বাইনারি হীপ

হীপ এর প্রকারভেদ

হীপ দুইধরনের হতে পারে। ম্যাক্স হীপ এবং মিন হীপ (Max heap and Min heap)। ম্যাক্স হীপের জন্য প্যারেন্ট নোডের মান তার ডিসেন্ডেন্টের থেকে বড় হবে। অর্থাৎ ট্রিয়ের রুটে ট্রিয়ের সবথেকে বড় মান টি থাকবে। লেফট চাইল্ডে থাকবে লেফট সাবট্রির সবথেকে বড়মান এবং রাইট সাবট্রিতে রাইট সাবট্রির সবথেকে বড়মান থাকবে। এই শর্ত পূরণ করে আমরা ম্যাক্স হীপ বানাতে পারি। অপর দিকে মিন হীপের জন্য প্যারেন্ট নোডের মান ডিসেন্ডেন্টের থেকে ছোট হবে এবং লেফট চাইল্ডে লেফট সাবাট্রির সবথেকে ক্ষুদ্র মান এবং রাইট চাইল্ডে রাইট সাবট্রির সবথেকে ক্ষুদ্র মান থাকবে।
যদি কোনো হীপে n সংখ্যক ইলিমেন্ট (নোড) থাকে তবে তার উচ্চতা $log_2(n)$ হবে।

হীপ ডাটাস্ট্রাকচারটি আমরা কখন ব্যবহার করবো?

ম্যাক্স হীপ এর জন্য ধরা যাক আমাদের কিছু নাম্বার $2,7,19,25,26,17,1,90,3,36$ পর্যায়ক্রমে দেয়া হবে। এখন দেয়ার সময় যেকোনো মুহূর্তে আবার জিজ্ঞাসা করা হবে আমাদের এখন পর্যন্ত ম্যাক্সিমাম নাম্বার কত? ধরেন আমরা আমাদের ট্রিতে নাম্বার ঢুকাচ্ছি।
প্রথমেই আমাদেরকে বলা হলো ২ কে ট্রিতে রাখো। আমরা ২ কে প্রথম নোডে রেখে দিলাম। এরপর বলা হলো ৭ কে রাখো। এখন ৭ কে এই মুহূর্তে শেষ নোড বা দ্বিতীয় নোডে রেখে দিলাম। এখন আমাদের ট্রিতে কিছু প্রসেসিং করলাম তারপর জিজ্ঞাসা করা হলো আমাদের ট্রিয়ের সর্বোচ্চ এখন কতো। তখন আমাদের ৭ কে রিটার্ন করতে হবে।
এখন আবার দেয়া হলো ১৯,২৫,২৬। তারপর বলা হলো ট্রিয়ের সকল ইলিমেন্টকে বড় থেকে ছোট রিটার্ন করো। তখন আপনার যথাক্রমে ২৬,২৫,১৯,২ রিটার্ন করতে হবে। আশাকরি বুঝাগেছে। তারমানে আমরা প্রতিবার যেই ইলিমেন্টের মান বা প্রায়োরিটি বেশি তাকেই রিটার্ন করবো।

কিভাবে কোড করবো?

বাইনারি হীপের কোড করার জন্য আমরা ডাইনামিক মেমোরি অ্যালোকেশন ব্যবহার করে করবো (এই পোস্টে C++ STL Vector ব্যবহার করে দেখাবো)। বাইনারি ট্রিতে আমরা কিভাবে ইন্ডেক্সিং করবো? যারা সেগমেন্ট ট্রি এর লিখাটি দেখেছেন তারা হয়তো খেয়াল করেছেন আমাদের লেফট চাইল্ড এর ইনডেক্স $2n$ এবং রাইট চাইল্ড এর ইনডেক্স $2n+1$ ছিল। আমরা এখানেও এ পদ্ধতি ব্যবহার করবো।
সুতরাং আমাদের লেফট চাইল্ড $2n$ এবং রাইট চাইল্ড $2n+1$ উভয়েরই প্যারেন্ট নোড হলো $floor(\frac{Current\space index \space (2n/2n+1)}{2})$

এই পোস্টে আমরা ১ ভিত্তিক ইন্ডেক্সিং করবো। অর্থাৎ আমাদের শুরুর ইনডেক্স ০ না হয়ে ১ হবে।

আসুন আমরা কিভাবে আমাদের হীপ গঠন করবো তার একটা ভিজুয়াল উপস্থাপন দেখি।

পুনরায় বলি, আমাদের $2,7,19,25,26,17,1,90,3,36$ এই সংখ্যাগুলো দেয়া হবে পর্যায়ক্রমিক ভাবে ।

প্রথম ধাপে আমাদের ২ দেয়া হলো। আমরা ট্রিকে রাখার জন্য একটি নোড নিবো। এবং ২ কে রাখবো। নিচের মত করে।

 

দেখেতে পাচ্ছি আমাদের ২ কে ট্রি এর ১ নং ইনডেক্সে রেখে দিয়েছি।

এরপর, দ্বিতীয় ধাপে আমাদেরকে ৭ ইনপুট দেয়া হবে। ৭ কে রাখার জন্য আমরা ট্রিতে একটি নোড বানাবো যাকে আমরা অ্যারের ২ নং ইনডেক্সে প্রথমে রাখবো। যেহেতু ৭, ট্রিয়ের ২ নং ইনডেক্সে আছে এবং আমাদের ম্যাক্স হীপের শর্তানুসারে প্যারেন্ট নোড সবসময় চাইল্ড থেকে বড় হবে, তাই আমরা দেখবো ৭ তার প্যারেন্ট নোডের থেকে বড় কিনা। এখন আসি, ২ নং ইনডেক্সের প্যারেন্ট ইনডেক্স কত? ২ নং ইনডেক্সের প্যারেন্ট ইনডেক্স হলো $floor(\frac{2}{2})=1$ সুতরাং আমরা ২ নং ইনডেক্সের ৭ কে ১ নং ইনডেক্সের ২ এর সাথে তুলনা করবো। যেহেতু ২, ৭ থেকে ছোট তাই ৭ কে রুট নোডে সরিয়ে আমরা ২ কে ২ নং নোডে নিয়ে আসবো।

 

তৃতীয় ধাপে আমাদের ইনপুট দেয়া হবে ১৯। আমরা একইভাবে ১৯কে প্রথমে ট্রি এর ৩ নং ইনডেক্সে রেখে দিবো। এখন আমাদেরকে ১৯ এর সাথে ৩ নং ইনডেক্সের প্যারেন্ট নোড $floor(\frac{3}{2})=1$ নং ইনডেক্সের সাথে তুলনা করতে হবে। দেখা যাছে ১৯, ৭ এর থেকে বড়। তাই আমাদেরকে জায়গাবদল করে নিতে হবে।

Heap datastructure

চতুর্থ ধাপে আমরা ২৫ কে ট্রিতে রাখবো। এজন্য প্রথমে ২৫ কে ট্রিয়ের ৪ নং ইনডেক্সে রাখবো প্রথমে। তারপর এর প্যারেন্ট ইনডেক্স $floor(\frac{4}{2})=2$ নং ইনডেক্সের ইলিমেন্ট  ২ এর সাথে ২৫ এর তুলনা করবো। এখানে ২৫ বড়। তাই অবস্থান পরিবর্তন বা SWAP হবে।
আবার ২৫ কে ২ নং ইনডেক্সে নেয়ার পরে দেখতে হবে ২ নং ইনডেক্সের প্যারেন্ট ১ এর চেয়ে ২৫ বড় কিনা। যেহেতু ২৫ বড় তাই আমরা ২৫ কে ১ নং নোডে নিয়ে ১৯ কে ২ নং এ নিয়ে আসবো।

একই পদ্ধতিতে আমরা ২৬ এবং ১৭ কে ইনসার্ট করে নিবো। পরের ১ কে ইনসার্ট করার জন্য আমাদের ৩ নং নোডের সাথে কোনোরূপ অবস্থান পরিবর্তন করতে হবে না। ২৬,১৭,১ কে ইনসার্ট করে নিচেরমতো ট্রি পাবো।

এরপর ৯০ কে ইনসার্ট করবো ৮ নং নোড হিসাবে। সুতরাং ৯০ (৮ নং নোড) কে আমরা ৪ নং নোডের চাইল্ড হিসেবে এবং পর্যায়ক্রমে ১ নং ইনডেক্সে নিয়ে যাবো। ৩ কে ৯নং নোড হিসেবে ইনসার্ট করবো যার প্যারেন্টও ৪ নং নোড হবে। এখানে কোন সোয়াপ হবে না। কারণ ৯০ কে সোয়াপ করার পরে ৪ নং নোডে ২৫ থাকবে। যেহেতু ২৫, ৩ এর থেকে বড় তাই এখানে সোয়াপ হবে না।

সবশেষে ৩৬ কে ৫ নং ইনডেক্সের চাইল্ড হিসেবে ঢুকিয়ে নিয়মমতো প্রসেস করবো। সুতরাং আমাদের সর্বশেষ ট্রি নিচের মত দেখা যাবে।

Final heap

বাইনারি ম্যাক্স হীপ কোড করা

হীপ কোড করা একেবারেই সহজ। হীপ কোড করতে হলে রিকার্শন নিয়ে ধারনা থাকাটা গুরুত্তপুর্ন। বাইনারি হীপে ইনসার্ট করা খুবই সহজ। যদি নতুন সংখ্যা থাকে তবে তাকে ট্রি অ্যারের শেষের ইনডেক্সের পরে নতুন মেমরি অ্যালোকেট করে বসাই (tree.size() তম ইনডেক্স)। তারপর তারপর রিকারশন এর মাধ্যমে প্যারেন্ট বের করে রুট পর্যন্ত যাবো, যতক্ষণ পর্যন্ত প্যারেন্ট আমার সংখ্যাটি থেকে বড় না হয় ততক্ষণ পর্যন্ত সোয়াপ করা যেতে থাকবো। যেহেতু ট্রি এর উচ্চতা $log_2(n)$ তাই আমাদের ইনসার্টে সময় লাগবে $O(log_2n)$

আবার যদি ম্যাক্স হীপ থেকে সবচেয়ে বড় সংখ্যা ডিলিট করা দরকার পরে তবে আমরা ট্রিয়ের শেষ সংখ্যাকে রুট নোড (১ নং ইনডেক্স) এ নিয়ে বসাবো। এরপর দেখতে হবে রুটের লেফট চাইল্ড বড় না রাইট চাইল্ড। যেটা বড়ো তার সাথে আমরা আমাদের রুটের সংখ্যাকে তুলনা করবো। যদি রুটের সংখ্যা আমাদের চাইল্ড থেকে বড় হয় তবে সোয়াপ হবে। এভাবে নিচে নামতে থাকবো।

নিচে একটি বাইনারি হীপের ডিলেশন প্রসেস দেখানো হলো।  ট্রি থেকে ৪৪ কে বাদ দেয়া হয়েছে।

C++ কোড

কোডের ব্যাখ্যা

আমরা কোডটিকে লক্ষ করলে দেখতে পাই main() বাদে আমাদের মোট ৫ তা ফাংশন আছে। যথা, insert(),pop(),heapify_bottom_to_root(),heapify_root_to_bottom(),top() এই ফাংশন গুলোদিয়ে আমরা আমাদের ট্রিতে বিভিন্ন অপারাশন করবো।

insert() function

insert() ফাংশন ব্যবহার করে আমরা আমাদের ট্রিতে একটি সংখ্যা ঢুকাতে পারবো। ফাংশনটি আবার দেখি।

আমাদের insert() ফাংশন দুইটি প্যারামিটার গ্রহণ করে। প্রথম টি একটি vector যার মাঝে আমরা আমাদের ট্রি কে রাখবো। এবং ২নং টি একটি সংখ্যা যাকে আমাদের রাখতে হবে।
আমরা শুরুতেই ট্রি (TREE) এর শেষে আমাদের সংখ্যাটি পুশ করেছি। তারপর পরবর্তি প্রসেস (Swaping) এর জন্য আমরা heapify_bottom_to_root()ফাংশন টি কল করেছি। ফাংশনটি দেখে নিই।

এই ফাংশনটি দুইটি প্যারামিটার গ্রহণ করে। একটি আমাদের tree vector এবং আরেকটি কত নং ইনডেক্সে আমরা সংখ্যাটি ঢুকিয়েছি তা। ফাংশনটি দ্বিতীয় লাইনে প্রথমেই আমাদের প্যারেন্ট নোডের ইনডেক্স বের করে নেয়। যেহেতু আমরা ১ ভিত্তিক ইন্ডেক্সিং করছি, তাই প্যারেন্ট নোডের মান শুন্য আসলে বুঝা যাবে বর্তমান নোডই আমাদের শেষ নোড (৩ নং লাইন)। ৮ নং লাইনে দেখেছি বর্তমান নোডের মান তার প্যারেন্টের থেকে ছোট না বড়। বড় হলে সোয়াপ করে নিয়েছি, এবং রিকার্শনের মাধ্যমে পরে বর্তমান নোড হিসেবে প্যারেন্ট নোডকে প্রসেসে দিয়েছি।

insert()এর টাইম কমপ্লেক্সিটি $O(log_2n)$

pop() function

pop()  ফাংশন দিয়ে আমরা ট্রি থেকে কোন ইলিমেন্ট বাদ দিতে পারবো। নিচে কোড টি দেখে নেই।

ফাংশনটি শুধু ১ টি প্যারামিটার নেয়। আমাদের ট্রি কে। ২ নং লাইনে চেক করে দেখা হয়েছে, আমাদের ট্রিয়ের সাইজ ১ কিনা। ট্রি এর সাইজ ১ হলে বুঝাযায় আমাদের ট্রি তে রুট নেই। তারমানে ট্রি খালি। যেহেতু রুট এর ইনডেক্স ১, তাই রুট থাকলে আমাদের ট্রিয়ের সাইজ ২ হতো।

আমরা প্রথমে ট্রি এর রুট ইলিমেন্ট বা সর্বোচ্চ ইলিমেন্ট কে max নামক চলকে নিয়ে নিয়েছি (৩ নং লাইন)। তারপর ট্রিয়ের শেষ ইলিমেন্টকে আমরা রুটে ইলিমেন্টে রেখেছি (৪ নং লাইন)। ৫ নং লাইনে আমরা ট্রিয়ের শেষ উপাদানকে ডিলিট করে দিয়েছি। তারপর রিকারশনের মাধ্যমে আমরা আমাদের ট্রিকে পুনরায় বিন্যাস করেছি।  heapify_root_to_bottom()   ফাংশনটি সকল প্রভাবিত সাবট্রিকে পুনারায় সজ্জিত করবে। heapify_root_to_bottom()   কোডটি দেখি।

২ এবং ৩ নং লাইনে আমাদের বর্তমান নোডের লেফট এবং রাইট চাইল্ড বের করা হয়েছে। ৫ নং লাইনে দেখা হয়েছে লেফট চাইল্ড রাইট চাইল্ড থেকে বড় কিনা একই সাথে লেফট চাইল্ড বর্তমান ইলিমেন্টের থেকে বড় কিনা। যদি সর্ত ঠিক থাকে তবে আমরা বর্তমান নোডকে লেফট নোডের সাথে সোয়াপ করবো। এবং রিকার্শন এর মাধ্যমে লেফট সাব ট্রি ঠিক করবো। অন্যথায় একইরকম শর্ত দিয়ে রাইট সাবট্রিতে কাজ করবো। যখন সোয়াপ হবে না তখন রিকার্শন থেমে যাবে।

pop() এর টাইম কমপ্লেক্সিটি $O(log_2n)$

top() function

এই ফাংশন শুধু রুট নোডের মান রিটার্ন করবে।

এখানে লক্ষণীয়, আমরা কিন্তু ট্রিতে কোন সংখ্যা এত দ্রুত খুঁজে বের করতে পারবো না। এজন্য আমাদের প্রত্যেকটা নোডকেই খুঁজে দেখতে হবে।

শেষ করা উচিত এখন 🙂

হীপ কে আমরা কখনও প্রায়োরিটি কিউ (Priority queue) বলি। কিউ থেকে আমরা জানি, যে আগে আসবে সে আগে বের হয়ে যাবে। কিন্তু প্রায়োরিটি কিউ এর জন্য বিষয়টা অন্যরকম। কে আগে যাবে তা নির্ধারণ হবে কে কত টাকাওয়ালা তার উপর ;p । যাইহোক, C++ STL এ priority_queue<> নামে একটা ডাটাস্ট্রাকচার আছে। এটি দিয়েও সহজে হীপ ইমপ্লেমেন্ট করা যাবে।

আজকে যাচ্ছি, বড় লিখা, ভুল চোখে পরলে কমেন্ট অথবা ইনবক্সে জানাতে অনুরুধ করছি। কারও কোনও সমস্যা হলেও জানাতে ভুলবেন না।

Tags

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Close
Close