Canonical URL কি, কিভাবে করা হয় তা নিয়ে কি আপনি চিন্তিত? চিন্তার কিছু নেই, আসলে এটি কঠিন কিছু নয়। খুবই সহজ একটি ধারণা। তবে, বিষয়টি গুরত্বপূর্ণ।
আপনি যখন টেকনিক্যাল এসইও এর গভীরে প্রবেশ করবেন তখন এই Canonical URL নামের এই টার্মের সাথে পরিচিত হবেন।
বিষয়টি সম্পর্কে যদি আপনার ধারণা না যেমন Canonical URL কি এবং এটি দিয়ে কি হয় তাহলে পরবর্তিতে সমস্যায় পরতে পারেন।
আর এই পোষ্টের উদ্দেশ্য হলো আপনার সেই সমস্যাকে দুর করা এবং এই ধারণার সাথে আপনাদের পরিচিত করানো যাতে সহজেই বিষয়টি বুঝে সঠিকভাবে তা নিজের সাইটে ব্যবহার করতে পারেন।
Table of Contents
Canonical URL কি বা কাকে বলে?
আপনার ওয়েবসাইট যখন সময়ের পথ পরিক্রমায় ধীরে ধীরে বড় হতে থাকবে তখন আপনার সাইটের একটি পেজ এর কনটেন্ট আর একটি পেজ এর সাথে পুরোপুরি না হলেও আংশিক মিলে যেতে পারে। যা আপনার সাইটের পরস্পর পেজ এর মাঝে ডুপ্লিকেট কনটেন্ট নামের একটি ইস্যু তৈরি করবে।
ধরে নেই, আপনার যদি একই রকম দু’টি পেজ থাকে যারা একই কিওয়ার্ডের ক্ষেত্রে গুগলে র্যাংক করার যোগ্য তখন কোন পেজটিকে র্যাংক করাতে হবে তা নিয়ে সার্চ ইঞ্জিন সন্দেহে পড়ে যাবে।
এই ইস্যুটিকে সমাধানের জন্য চলে এসেছে Canonical URL নামের ধারণাটি। যার মাধ্যমে আপনি নিজে থেকে এই দু’টোর মধ্যে একটি নির্বাচন করে সার্চ ইঞ্জিনকে জানাতে পারবেন।
তাহলে, Canonical URL কি – আশা করি বিষয়টির উপর কিছুটা হলেও ধারণা পেয়ে গেছেন।
এক কথায় বলতে গেলে কোন ওয়েবসাইটে একই কনটেন্টের উপর একাধিক ইউআরএল। এক্ষেত্রে Canonical URL হচ্ছে সেই সমস্যার টেকনিক্যাল সমাধান।
যেমন ধরুন, আপনার ব্লগের দু’টি ভিন্ন ক্যাটাগরির আওতায় একই রকমের দু’টি পোষ্ট রয়েছে যার উদাহারণ নিম্নরুপ-
https://example.com/black-shoes/black-and-red-shoes/
https://example.com/red-shoes/black-and-red-shoes/
উপরের URL দু’টো যদি একই পণ্যের উপর হয়ে থাকে, তাহলে আপনি Canonical URL ব্যবহার করে সার্চ ইঞ্জিনকে বার্তা দিতে পারেন এই অর্থে যে এই দু’টো URL এর মধ্যে সার্চ ইঞ্জিন র্যাংকিং এর ক্ষেত্রে কোনটিকে গ্রহণ করবে।
এছাড়াও, আপনার সাইটের কোন আর্টিকেলের অরিজিনাল ভার্শন কোনটি তার উপরেও Canonical সার্চ ইঞ্জিনকে নির্দেশনা দিতে পারে।
উদাহরণ স্বরুপ, ধরে নেই, আপনি আপনার এক ক্লায়েন্টের জন্য একটি আর্টিকেল লিখে তাদের ওয়েবসাইটে পাবলিশ করলেন। এখন যদি আপনি নিজের সাইটেও সেই একই আর্টিকেলটি পাবলিশ করতে চান তখন এই Canonical ট্যাগ ব্যবহার করে আপনি অরিজিনাল ভার্শন উল্লেখ করতে পারেন।
Canonical URL কিভাবে সনাক্ত করবেন?
এই Canonical URL ভিজিটরের নিকট দৃশ্যমান হয় না। এটিকে শুধ সার্চ ইঞ্জিনের ক্রাউলার দেখতে পারে। ইহা ওয়েবসাইটের head অংশের ভিতর অর্থাৎ এভাবে এই ট্যাগের ভিতর <HEAD></HEAD> বিদ্যমান থাকে।
আপনি যদি, ওয়েব পেজটির source code দেখতে পারেন তখন এর নিম্নরুপ গঠন বা ফরমেট দেখতে পাবেন-
<link rel="canonical" href="CANONICAL-URL"/>
কখন ও কিভাবে Canonical URL ব্যবহার করবেন?
যে কোন ওয়েবসাইটে ডুপ্লিকেট কনটেন্ট বিষয়ে কোন ইস্যু বা সমস্যা থাকতেই পারে। এমনকি আপনি যদি ইচ্ছাকৃতভাবে কনটেন্ট কপি না করেন তারপরও ডুপ্লিকেট কনটেন্ট জাতীয় সমস্যা দেখা দিতে পারে।
কিভাবে ডুপ্লিকেট কনটেন্ট তৈরি হতে পারে তার কয়েকটি উদাহারণ নিচে দেওয়া হলো –
১) আপনার সাইট URL –এ যদি www থাকে অথবা না থাকে; যেমন-
http://seosheba.com/post-title
এবং
http://www.seosheba.com/post-title
২) আপনার ওয়েবসাইট URL –এ যদি http এবং https উভয় প্রোটোকলের মাধ্যমে প্রবেশের সুযোগ থাকে, যেমন
http://seosheba.com/post-title
এবং
https://www.seosheba.com/post-title
৩) আপনার ওয়েব পেজ এ যদি প্রিন্ট বান্ধব ভার্শন থাকে; যেমন
http://seosheba.com/post-title
এবং
http://www.seosheba.com/post-title/?print=true
৪) আপনার ওয়েবসাইটে একই কনটেন্ট এর উপর যদি একাধিক ভিন্ন ভিন্ন url থাকে; যেমন –
http://seosheba.com/courses/seo-course
এবং
http://www.seosheba.com/seo-course
5) ই-কমার্স ওয়েবসাইটের ক্ষেত্রে প্রোডাক্ট ক্যাটাগরি পেজ এ একই কনটেন্ট থাকলে; যেমন-
http://seosheba.com/products/shoes/?color=white
এবং
http:// seosheba.com/products/shoes/
উভয় পেজ url এর কনটেন্ট একই। পার্থক্য শুধু পণ্যের রঙের মধ্যে। তবে, গুগল এটিকেও ডুপ্লিকেট কনটেন্ট হিসাবে ধরে নেয়।
যাহোক, উপরে বর্ণিত প্রতিটি ক্ষেত্রেই আপনি Canonical URL ব্যবহার করে এ সমস্যার সমাধান করতে পারেন। যার মাধ্যমে কোন পেজ URL টি গুগল তার সার্চ রেজাল্ট পেজ -এ প্রদর্শন করবে সেটি পরিস্কার হবে।
এখানে একটি প্রাসঙ্গিক প্রশ্ন উঠতে পারে –
যে ওয়েব পেজ –এ অরিজিনাল কনটেন্ট থাকবে সেখানেও কি এই Canonical URL ব্যবহারের কোন প্রয়োজনীয়তা আছে?
উত্তর – হ্যা। এর প্রধান কারণ হলো এর মাধ্যমে আপনার অরিজিনাল কনটেন্ট ডুপ্লিকেট হওয়া থেকে সুরক্ষিত থাকবে। কেউ যদি কখনোও আপনার অরিজিনাল কনটেন্ট কপি করে তার বা অন্য কোন ওয়েবসাইটে প্রকাশ করে, তখন এই Canonical URL এর ফলে সার্চ ইঞ্জিন বুঝতে পারবে উক্ত কনটেন্ট এর সত্যিকার উৎস কোথায়।
আর একটি বিষয় – কনটেন্ট সিনডিকেশন এর বেলায় Canonical URL এর ভূমিকা।
এর মানে হলো, আপনার নিজের সাইটে প্রকাশিত অরিজিনাল কনটেন্ট যদি অন্য জায়গায় পুনরায় পোষ্ট করতে চান, তখন কি হবে?
যেমন ধরুন – আপনার কোন অরিজিনাল কনটেন্ট আপনি ফেসবুক, মিডিয়াম বা লিংকডইন –এ পুনরায় প্রকাশ করবেন।
সেক্ষেত্রে এই Canonical URL আপনার নিজ ওয়েবসাইটে প্রকাশিত সেই অরিজিনাল কনটেন্ট কে সুরক্ষা দিবে। যার মাধ্যমে গুগল জেনে যাবে যে, এটি হচ্ছে আপনার সাইটের প্রকাশিত সেই মুল কনটেন্ট এর হুবুহু অনুলিপি।
আপনার ডোমেইন এর url স্ট্রাকচার কিভাবে সুনির্দিষ্ট করবেন?
যে ওয়েবসাইটে ভিন্ন ভিন্ন url দিয়ে প্রবেশ করা যায় তা গুগলের কাছে পৃথক পৃথক ওয়েবসাইট হিসাবেই বিবেচিত ।
একই ওয়েবসাইটের ভিন্ন ভিন্ন url কথাটির উদাহারণ পূর্বে যদিও একবার বলা হয়েছে, তবুও আরেক বার বলছি-
যেমন-
http://seosheba.com
https://seosheba.com
http://www.seosheba.com
https://www.seosheba.com
উপরে একই ডোমেইনের চার ধরণের url স্ট্রাকচার এর উদাহরণ দেয়া হয়েছে, যা সার্চ ইঞ্জিনের নিকট চারটি পৃথক পৃথক ওয়েবসাইট হিসাবে বিবেচিত হবে।
এতে করে গুগল সন্দের মধ্যে নিমজ্জিত হবে এই ভেবে যে তাকে সুনির্দিষ্ট কোন সাইট কে ইনডেক্স করাতে হবে। তখন আপনি এই canonical url ব্যবহার করে গুগলকে বার্তা প্রদান করবেন যে এই স্ট্রাকচার বিশিষ্ট url কে তুমি ইনডেক্স করো।
অতিতে বিষয়টি গুগল সার্চ কনসোল ব্যবহার করে করা যেত। কিন্তু এখন আর সেখান থেকে করা যায় না। তাই canonical url একমাত্র উপায় যা ব্যবহার করে সমস্যাটি সমাধান করতে পারবেন।
আপনি সমস্যাটির সমাধান নিম্নোক্ত উপায়ে করতে পারেন –
- আপনার সাইটের হোমপেজ এ ক্যানোনিকাল ইউ আর এল বসিয়ে দিন;
- সাইটের মুল ইউ আর এল এ এটি বসিয়ে দিন যাতে আপনার ওয়েবসাইটের সমস্ত পেজ এর আওতায় আসে;
- আপনার সমস্ত ক্যানোনিকাল ট্যাগে একই ইউ আর এল ফরমেট ব্যবহার করে।
উদাহারণ স্বরুপ-
আপনার হোমপেজ কে ক্যানোনিকাল ইউ আর এল দিয়ে যদি সুনির্দিষ্ট করতে চান তাহলে নিম্নোক্ত উপায়ে তা করতে পারেন-
<link rel="canonical" href="https://www.seosheba.com/"/>
উপরের ফরমেট মোতাবেক, তখন ঐ সাইটে ক্যানোনিকাল ইউ আর এল ব্যবহারের প্রতিটি ক্ষেত্রেই আপনাকে www এবং https ফরমেট ব্যবহার করতে হবে।
এর মাধ্যমে আপনার নির্বাচিত ডোমেইন কোনটি তা গুগলের নিকট পরিস্কার হয়ে যাবে।
ক্যানোনিকাল url কিভাবে কাজ করে?
ক্যানোনিকাল url কিভাবে সেট করতে হয় তা নিচের উদাহারণের মাধ্যমে বুঝানো চেষ্টা করছি-
যেমন ধরে নেই, নিচের দু’টি পেজ এর কনটেন্ট একই রকম এবং আপনি চান যে, গুগল যেন দ্বিতীয় পেজ কে ইনডেক্স করে।
https://www.seosheba.com/courses/SEO-Course
https://www. seosheba.com/seo-course
এখন, দ্বতীয় পেজ এর url কে ইনডেক্স করাতে হলে, canonical url নিচের উপায়ে সেট করতে হবে।
প্রথমত: প্রথম পেজ এর canonical url যাতে নিজ পেজ ব্যতিরেকে অন্য পেজ অর্থাৎ যে পেজকে আপনি ইনডেক্স করাতে চান সেই পেজ এর দিকে point করাতে হবে যা নিম্নরুপ-
<link rel="canonical" href="https://www.seosheba.com/seo-course"/>
অপরদিকে, দ্বিতীয় পেজ যাকে গুগল ইনডেক্স করার কথা বলা হবে সেখানে canonical url নিজ পেজ বরাবর পয়েন্ট করতে হবে, যেমন-
<link rel="canonical" href="https://www.seosheba.com/seo-course"/>
এই ভাবেই আপনি গুগলকে বলে দিবেন একই কনটেন্ট এর দু’টি পেজ এর মধ্যে সে কোনটিকে ইনডেক্স করবে।
Canonical url ব্যবহারের উত্তম চর্চা কেমন?
১) প্রতিটি পেজেই canonical url থাকতে হবে। হতে পারে তা নিজ পেজ এর জন্য বা অন্য পেজ এর জন্য।
২) প্রতিটি পেজ একটি মাত্র canonical url থাকতে পারবে।
৩) ক্যানোনিকাল ট্যাগ head ট্যাগের ভিতর থাকবে।
৪) যে url কে rel=”canonical” tag এর মধ্যে নির্দিষ্ট করা হবে বাস্তবে তা সক্রিয় থাকতে হবে এবং সেখানে noindex এট্রিবিউট রাখা চলবে না।
৫) যে পেজ এর canonical url নিজের দিকে পয়েন্ট করা থাকে না সেই পেজ এর দিকে অন্য কোন পেজ এর canonical url পয়েন্ট করা যাবে না। এটি করা হলে লুপ তৈরি হবে এবং ক্রাউলার সন্দেহে পরে যাবে।
৬) Canonical url এর ধারণাটি প্রয়োগ করুন যদি একাধিক পেজ এ ডুপ্লিকেট কনটেন্ট থাকে। কোন পেজ এ ডুপ্লিকেট কনটেন্ট না থাকলে মুল কনটেন্ট নির্দেশ করার লক্ষ্যে এটি ব্যবহারের প্রয়োজন নেই।
৭) Canonical url যে পেজকে পয়েন্ট করবে তা যেন একই ভাষার হয়। বহুভাষি ওয়েবসাইটের বিভিন্ন ভার্শন জন্য আপনি “href lang” এট্রিবিউট ব্যবহার করতে পারেন।
৮) হোম পেজ এ canonical url ডিফাইন থাকতে হবে য কিনা আপনার নির্বাচিত ডোমেইন এবং তার url ফরমেট নির্দিষ্ট করবে।
৯। সমস্ত canonical url এর ফরমেট হোম পেজ এর মত হতে হবে।
১০) আপনার সাইটে যদি AMP ভার্শন থাকে তাহলে তার canonical url এর প্রতিটি পেজ যেন অরিজিনাল বা non-AMP ভার্শনের দিকে পয়েন্ট করা থাকে।