সার্চ ইঞ্জিন কিভাবে কাজ করে?

সার্চ ইঞ্জিন কিভাবে কাজ করে – বিষয়টি ডিজিটাল জগতের একটি প্রাসঙ্গিক প্রশ্ন।

আপনি যদি ব্লগিং করতে চান বা অনলাইন ইনকাম এর জন্য ওয়েবসাইটের মাধ্যমে নিজের ব্যবসাকে উপস্থাপন করতে চান বা যদি একজন ডিজিটাল মার্কেটার হিসাবে নিজেকে প্রতিষ্ঠিত করতে চান, তাহলে এই পোষ্টটি আপনার জন্য।

আলোচ্য পোষ্টে সার্চ ইঞ্জিন কি, সার্চ ইঞ্জিন কিভাবে কাজ করে এবং এর সাথে আরোও সংশ্লিষ্ট কিছু বিষয় নিয়ে কথা বলা হবে।

চলুন শুরু করি।

সার্চ ইঞ্জিন কি

সার্চ ইঞ্জিন একটি টুলের নাম যা ইন্টারনেট ব্যবহারকারিদের ওয়েব জগত থেকে কাংখিত তথ্য খুঁজে পেতে সহায়তা করে। একজন ইউজার অনলাইন উৎস থেকে যে বিষয়ে তথ্য পেতে চায় ঐ বিষয়ের উপর একটি কিওয়ার্ড লিখে যে টুলের সাহায্যে অনুসন্ধান কার্যক্রম চালিয়ে যায় তার নামই সার্চ ইঞ্জিন।

সার্চ ইঞ্জিনের সার্চ বারে বিষয় সম্পর্কিত কিওয়ার্ড লিখে সার্চ বাটনে ক্লিক করার পর তার ফলাফল হিসাবে যে সব কনটেন্ট প্রদর্শন করে তা মুলত: টেক্সট, ইমেজ, ভিডিও ইত্যাদি আকারে পাওয়া যায়। সার্চ ইঞ্জিনের ডাটাবেজ এ সংরক্ষিত তথ্য ভান্ডার থেকে যে তথ্যগুলো সার্চ কিওয়ার্ডের সাথে সবচেয়ে বেশী সম্পর্কযুক্ত শুধু ঐ কনটেন্টগুলোই রেজাল্ট আকারে প্রদর্শন করে। যে কনটেন্ট ‍সমুহ সবচেয়ে ভাল তা রেজাল্ট পেজ এর প্রথম দিকে এরপর ধারাবাহিক ক্রমানুসারে দেখানো হয়।

ইন্টারনেট ব্যবহারকারির নিকট সার্চ ইঞ্জিন কর্তৃক কনটেন্ট এর যে তালিকা প্রদর্শন করা হয় তাকে search engine result page বা SERP বলা হয়।

প্রতিটি সার্চ ইঞ্জিন দু’টি প্রধান অংশে বিভক্ত থাকে –

  • সার্চ ইনডেক্স : সকল ওয়েব পেজ এর তথ্য নিয়ে গঠিত একটি ডিজিটাল লাইব্রেরি বা ডাটাবেজ।
  • সার্চ এলগরিদম : কম্পিউটার প্রোগ্রাম যা সার্চ কিওয়ার্ডের সাথে মিল রয়েছে এমন কনটেন্ট সার্চ ইনডেক্স এর ডাটাবেজ থেকে তুলে নিয়ে সার্চ ইঞ্জিন রেজাল্ট পেজ এ প্রদর্শন করে।

সার্চ ইঞ্জিনের জনক কে

রয়্যাল ইনস্টিটিউট অফ টেকনোলজি এর প্রফেসর মার্ক স্যান্ডারসন বলেন Fletcher সার্চ ইঞ্জিনের জনক। কারণ, তিনি ১৯৯৩ সালে বিশ্বের সর্বপ্রথম ওয়েব ক্রাউলার তৈরি করেন। যখন তিনি যুক্তরাজ্যের Stirling University এর কম্পিউটার ল্যাবে কর্মরত ছিলেন।

তবে, সার্চ ইঞ্জিনের জনক কে – তা নিয়ে বেশ মতভেদ আছে।

জনপ্রিয় কয়েকটি সার্চ ইঞ্জিনের নাম

কয়েকটি জনপ্রিয় ও বহুল ব্যবহৃত সার্চ ইঞ্জিনের নাম এবং সার্চ ইঞ্জনসমুহের বাজারে তার অবস্থান বা মার্কেট শেয়ার কেমন, তা এক এক করে নিচে দেওয়া হল-

  • গুগল – 92%
  • বিঙ্গ – ২.৫%
  • ইয়াহু – ১.৫%
  • বায়ডু – ১.৩%
  • ইয়ানডেক্স – ০.৫৫%
  • অন্যান্য – ১.২%

সুত্র: Ahrefs

সার্চ ইঞ্জিন কিভাবে কাজ করে

সার্চ ইঞ্জিন পরস্পর সম্পর্কযুক্ত এমন কিছু কলা কৌশল যা ওয়েব কনটেন্ট থেকে সুনির্দিষ্ট কোন তথ্য বের করে দিতে ঐক্যবদ্ধভাবে কাজ করে। ওয়েব কনটেন্টের মধ্যে ইমেজ, ভিডিও, টেক্সট ইত্যাদি উল্লেখযোগ্য। যে বিষয়ে তথ্য পাওয়ার জন্য সার্চ ইঞ্জিন ব্যবহার করছেন ঐ বিষয়ের উপর সুনির্দিষ্ট একটি কিওয়ার্ড সার্চ ইঞ্জিনের সার্চ বারে লিখে সার্চ বাটনে ক্লিক করলেই সার্চ ইঞ্জিন তার ডাটাবেজ-এ রক্ষিত তথ্য সমুদ্র থেকে আপনার কাংখিত বিষয়টি সামনে হাজির করবে।

ইউজার এর তার সুনির্দিষ্ট কিওয়ার্ডের বিপরীতে অনুসন্ধানের পর সার্চ ইঞ্জিনের রেজাল্ট পেজ -এ নিজ নিজ ওয়েব কনটেন্ট প্রদর্শিত হোক – এটি সকল ওয়েবসাইটের মালিকেরই সমান প্রত্যাশা।

কিন্তু এত লক্ষ লক্ষ ওয়েবসাইটের মাঝে সার্চ ইঞ্জিন তার রেজাল্ট পেজ এর প্রথম দিকে কোন কোন ওয়েবসাইট প্রদর্শন করবে এবং কেন করবে? এই অত্যন্ত গুরত্বপূর্ন প্রশ্নটির উত্তর ওয়েব জগতের সাথে সংশ্লিষ্ট প্রত্যেকেরই জানা উচিত।

এর উত্তর এক কথায় সার্চ ইঞ্জিন অপটিমাইজেশন কাজ যা আপনার ওয়েবসাইটের প্রতিটি কনটেন্টের জন্য একান্ত অপরিহার্য। অর্থাৎ, আপনার ওয়েব কনটেন্টকে সার্চ ইঞ্জিন বান্ধব করে অপটিমাইজ করতে হবে। তাহলেই, আপনার কনটেন্ট এর অন্যান্য ক্রাইটেরিয়া ঠিক থাকলে সার্চ ইঞ্জিনের প্রথম পেজ এ প্রদর্শিত হওয়ার সম্ভাবনা তৈরি হবে।

যাইহোক, এখনকার আলোচ্য বিষয় – সার্চ ইঞ্জিন কিভাবে কাজ করে? মানে — আপনার ওয়েব কনটেন্ট যাতে ইউজার খুজে পায় তা কিভাবে নিশ্চিত করার জন্য সার্চ ইঞ্জিন কিভাবে কাজ করে। চলুন সে বিষয়ে আলোচনা শুরু করি।

এই উদ্দেশ্য সাধনের জন্য সার্চ ইঞ্জিন মুলত: নিচের তিনটি উপায়ে কাজ করে-

  • ওয়েব ক্রাউলিং
  • সার্চ ইনডেক্স
  • সার্চ এলগোরিদম

ওয়েব ক্রাউলিং

সার্চ ইঞ্জিন বিশেষ করে গুগল সম্পূর্ন স্বয়ংক্রিয় একটি সফ্টওয়ার ব্যাবহার করে যা বিভিন্ন সার্চ ইঞ্জিন ভেদে ওয়েব ক্রাউলার, স্পাইডার বা বট নামে ডাকা হয়। ওয়েব ক্রাউলার এর কাজ হচ্ছে নিয়মিতভাবে ওয়েব জগত ঘুরে বেড়ানো যাতে নতুন কোন সাইটের আবির্ভাব হলে অথবা কেউ তার ওয়েবসাইটে নতুন কোন কনটেন্ট প্রকাশ করলে তা সার্চ ইঞ্জিন জানতে পারে।

মজার বিষয় হল, বেশীরভাগ ওয়েবসাইট মালিক তাদের ওয়েবসাইট সার্চ ইঞ্জিনের সাথে পরিচয় করিয়ে দেওয়ার জন্য ম্যানুয়ালি কাজ করে না। কিন্তু, ওয়েব ক্রাউলার নামের এই প্রোগ্রামের কার্যকারিতার প্রভাবে তা অটোমেটিক্যালি সার্চ ইঞ্জিনের ডাটাবেজ এ যোগ হয়ে যায়।

ওয়েব ক্রাউলার নিয়মিত ভাবে অনুসন্ধানে লিপ্ত এজন্য যে কেউ তার ওয়েবসাইটে নতুন কোন পেজ বা পোষ্ট দিল কিনা বা বিদ্যমান কোন কনটেন্ট আপডেট করল কিনা। অনুসন্ধানের পর ওয়েব ক্রাউলার এর উপর ভিত্তি করে যে সব নতুন তথ্য বা কনটেন্ট খুঁজে পায় তার ঠিকানা বা পেজ URL একটি বৃহত লিস্ট আকারে সংরক্ষণ করে পরবর্তিতে ভাল করে দেখে নেওয়ার জন্য।

ইনডেক্স

ক্রাউল করার পর প্রাপ্ত ফলাফল প্রক্রিয়াজাতকরণের পরের ধাপ হচ্ছে ইনডেক্সিং। ওয়েব ক্রাউলার ওয়েব জগতে প্রতিনিয়ত ঘুরে বেড়িয়ে যে সব নতুন তথ্য পেল তাকে এবার ভেলিডেট এবং স্টোর করে রাখার পালা। সার্চ ইঞ্জিনের ডাটাবেজ –এ ক্রাউলিং এর ফসল হিসাবে প্রাপ্ত তথ্যগুলোকে সংরক্ষণ করার প্রক্রিয়াকে ইনডেক্সিং বলে। যাকে সকল ওয়েবসাইটের সমন্বয়ে গঠিত অনেক বড় মাপের একটি লাইব্রেরি বলতে ভুল হবে না।

ইনডেক্সিং এর এ পর্যায়ে ক্রাউলিং এর মাধ্যমে প্রাপ্ত নতুন কনটেন্ট বা সাইটগুলোকে গুগল পরবর্তিতে সময় নিয়ে ভিজিট করে তার বস্তুনিষ্ঠতা যাচাই করে। বিশ্লেষণ করে দেখে, নতুন কনটেন্ট কোন বিষয়ের উপর; তার মান কেমন বা সেখানে কোন প্রকার ডুপ্লিকেসি রয়েছে কিনা।

গুগলের যাচাই বা বিশ্লেষণ পরবর্তি ফলাফলসমুহ সযত্নে তার ইনডেক্স ডাটাবেজে সংরক্ষণ করে। যদি তা মানসম্পন্ন হিসাবে মার্কি থাকে, তাহলে আপনি ইউজার হিসাবে ঐ কনটেন্ট এর সাথে সম্পর্কিত কোন কিওয়ার্ড লিখে সার্চ দিলে রেজাল্ট পেজের প্রথম দিকে তা এক সময় প্রদর্শিত হবে।

মনে রাখতে হবে, ক্রাউলিং এবং ইনডেক্সিং উভয়েই চলমান প্রক্রিয়। যা সার্চ ইঞ্জিনের ডাটাবেজ সতেজ ও আপডেট রাখতে অনবরত চলতে থাকে।

একটি সাধারণ জিজ্ঞাসা – ইনডেক্সিং হয়েছে কিনা কিভাবে পরীক্ষা করবেন?

আপনার ওয়েবসাইটের কনটেন্ট কতটুকু ইনডেক্স হয়েছে তা পরীক্ষা করার জন্য গুগল সার্চ কনসোল ব্যবহার করতে পারেন। এছাড়া, ইনডেক্সিং বুঝার আর  একটি উপায় হল গুগলের সার্চ বারে নিচের সার্চ অপারেটর লিখে সার্চ দিন।

Site:yourdomain.com

র‌্যাংকিং

সার্চ ইঞ্জিন কিভাবে কাজ করে – আলোচ্য পোষ্টের সার্চ ইঞ্জিনের কাজের শেষ ধাপ হচ্ছে র‌্যাংকিং। এই পর্যায়ে সার্চ ইঞ্জিনের ইনডেক্স ডাটাবেজ থেকে সার্চ কিওয়ার্ডের বিপরীতে সংশ্লিষ্ট কনটেন্ট সমুহের তালিকা সার্চ ইঞ্জিন রেজাল্ট পেজে প্রদর্শন করা। এক্ষেত্রে, সার্চ ইঞ্জিন এলগরিদম অনুযায়ি, সাধারণত: সবচেয়ে ভাল কনটেন্ট সার্চ ইঞ্জিনের প্রথম দিকে প্রদর্শন করানো হয়।

তবে, র‌্যাংকিং ক্রাইটেরিয়া হিসাবে এক এক সার্চ ইঞ্জিন এক এক রকম সিগনাল ব্যবহার করে। যার অধিকাংশই স্ব স্ব সার্চ ইঞ্জিন কর্তৃপক্ষ গোপনীয়ভাবে রেখে দেয়। পাবলিকলি প্রকাশ করে না।

সার্চ ইঞ্জিন এলগরিদম কি?

সার্চ ইঞ্জিন এলগরিদম এমন একটি জটিল প্রক্রিয়া যার মাধ্যমে প্রতিটি কিওয়ার্ডের জন্য সার্চ ইঞ্জিনের ইনডেক্সড ডাটাবেজের সংশ্লিষ্ট কনটেন্টসমুহ মুল্যায়ন করা হয়। এরপর নির্ধারণ করা হয় সুনির্দিষ্ট query এর বিপরীতে কোন কোন কনটেন্ট সার্চ ইঞ্জিন রেজাল্ট পেজ এ প্রদর্শন করা হবে।

যেমন, গুগলের কথাই ধরুন। তাদের এলগরিদম –এ কয়েক ডজন ফ্যাক্টর রয়েছে যার উপর ভিত্তি করে এই সিদ্ধান্ত গ্রহন করা হয়। এই ফ্যাক্টরসমুহের অনেকগুলো প্রকাশিত হলেও কিছু কিছু বিষয়ে তারা গোপনিয়তা বজায় রাখে।

গুগল এলগরিদম এর কয়েকটি ফ্যাক্টর উদাহারণ হিসাবে নিচে উল্লেখ করা হলো-

  • Search query: এর মাধ্যমে ইউজার যে শব্দটি লিখে অনুসন্ধান করে তার সঠিক অর্থ বুজার চেষ্টা করা হয় এবং এর পিছনে অনুসন্ধানকারির মনের আকাংখা কি তাও আমলে নেওয়া হয়।
  • Page relevance: সার্চ ইঞ্জিন যে সব পেজ প্রদর্শন করবে সেখানে অনুসন্ধানকারির প্রশ্নের যথাযথ উত্তর পাওয়া যাবে কিনা।
  • Content quality: সার্চ রেজাল্ট পেজে যে সব ওয়েব পেজ search query এর ফলাফল হিসাবে প্রদর্শন করা হয় তা ইনডেক্স ডাটাবেজের সকল তথ্যের মধ্যে সবচেয়ে ভাল ও মান সম্পন্ন কিনা তা খতিয়ে দেখা হয়। এর পিছনে আভ্যন্তরীণ বিষয়াদির সাথে বাহ্যিক কিছু বিষয়ও জড়িত থাকে। যেমন, ব্যাকলিংক এর সংখ্যা এবং তাদের মান কেমন, ব্যাকলিংক সমুহ কনটেন্টর এর সাথে সম্পর্কযুক্ত কিনা – ইত্যাদি।
  • Page usability: ওয়েবপেজ এর মান নির্ধারণে কারিগরি কিছু বিষয় বিবেচনা করা হয়। যেমন, ওয়েবপেজ এর responsiveness, এর স্পীড কেমন, নিরাপত্তা বিষয়াদি ইত্যাদি।

বন্ধুগন, সার্চ ইঞ্জিন কিভাবে কাজ করে – শিরোনামে প্রকাশিত পোষ্টের বিষয়ে কোন প্রশ্ন থাকলে কমেন্টের মাধ্যমে জানাবেন। ধন্যবাদ

Leave a Comment