একটি ওয়েবসাইটের কী কী সমস্যা হতে পারে এবং কেন ঘটে জেনে নিন।
ওয়েবসাইট সম্পর্কে আমরা সবাই পরিচিত, কেউ হয়ত কম কেউ হয়তো বেশি জানে।তো আজকের এই ব্লগে আমি আপনাদেরকে জানাবো যে একটি ওয়েবসাইটের কী কী সমস্যা হতে পারে,কেন এসব সমস্যা ঘটে থাকে এবং এসব সমস্যা একটি ওয়েবসাইটে দেখা দিলে আপনাদের করণীয় কী কী? সমস্ত বিষয় আমি আলোচনা করবো।আশা করি ধৈর্য ধরে সম্পূর্ণ পোস্টটি পড়বেন।আজকে আমি ব্লগ ওয়েবসাইটের সমস্যাগুলোর আলোচনা করবো।তো চলুন মেইন টপিকে যাই।
ওয়েবসাইট সমস্যা কী
ওয়েবসাইটের বিভিন্ন সমস্যা হয়ে থাকলে তাই হলো ওয়েবসাইট সমস্যা। একটি ওয়েবসাইটের বিভিন্ন ধরনের সমস্যা হয়ে থাকে। যেমন - Alternative page with proper canonical tag, Duplicate without user-selected canonical, Not found (404), Blocked due to access forbidden (403), Blocked by robots.txt, Redirect Error, Page with redirect, Crawled - Currently not indexed, Discovered - currently not indexed. ইত্যাদি আরো অনেক ধরনের সমস্যা হয়ে থাকে।এসব সমস্যার সমাধানও রয়েছে।নিচে সবকিছুর বিস্তারিত আলোচনা করা হলো।
(১) alternative page with proper canonical tag :
অল্টারনেটিভ পেজ উইথ প্রপার ক্যানোনিকাল ট্যাগ হচ্ছে একটি ওয়েবপেজ যা একই ধরনের বিষয়বস্তু আরেকটি পেজের বিকল্প হিসেবে কাজ করে।মূলত SEO - (Search Engine Optimization) এর ক্ষেত্রে কনফিউশন এড়াতে আসল পেজের দিকে ইঙ্গিত দেখাতে ক্যানোনিকাল ট্যাগ ব্যবহার করা হয়।
আরো ক্লিয়ার করে বুঝাচ্ছি Canonical Tag হচ্ছে একটি HTML এলিমেন্ট যা কি না সার্চ ইঞ্জিনকে জানায় যে কোনটি আসল পেজ আর কোনটি সংস্করণ পেজ।
মনে করেন আপনার একটি ওয়েবসাইটে একই কন্টেন্ট দুটি URL এ আছে - (1) www.example.com
(2) www.example.com/education?ref=124
এই ক্ষেত্রে এই পেজটি কিন্তু বিকল্প পেজ।তখন আপনি আপনার ওয়েবসাইটের একটি
Canonical tag যোগ করতে পারেন যা মূল পেজকে নির্দেশ করবে।
যেমন - <link rel="canonical"
href='https://example.com/education"/>
এটি আপনার ব্লগারের থিম অপশনে গিয়ে html edit অপশনে গেলে পেয়ে যাবেন।
(২) Duplicate without user-selected canonica:
ডুপ্লিকেট উইথআউট ইউজার - সেলেক্টেড ক্যানোনিকাল এর মানে হচ্ছে SEO সম্পর্কিত একটি শর্ত।এটি এমন একটি অবস্থা নির্দেশ করে যেখানে ওয়েবপেজের কন্টেন্ট হুবহু একই রকম অন্য একটি পেজের সাথে মিলে যায়। নির্দিষ্ট কোনো url সেট করা হয়নি।
যেমন আপনার দুটি পেজ দেখতে এরকম
www.example.com/edit
www.example.com/edit?=xyz
দুটি URL এ একই কন্টেন্ট দেখায়।কিন্তু যদি Canonical tag সেট না করা থাকে, তাহলে এটি Duplicate without user-selected canonical হিসেবে গণ্য হবে।এর সমাধান হিসেবে আপনি একটি ট্যাগ ব্যবহার করতে পারেন : <link rel="canonical"
href='https://example.com/edit এটি দিলে সার্চ ইঞ্জিন বুঝতে পারবে কোনটি আসল পেজ।
(২) Not found 404 :
নট ফাউন্ড ৪০৪ হচ্ছে একটি HTTPS স্ট্যাটাস কোড যা দ্বারা বুঝায় যে আপনি পেজ বা তথ্য ব্রাউজারে খুজছেন তা সার্ভারে নেই।যখন আপনি কোনো URL ব্রাউজারে প্রবেশ করাবেন, আর সেই URL টি সার্ভারে না থাকে তাহলে Not found 404 দেখাবে।
এটি ঘটার কয়েকটি কারণ থাকতে পারে।যেমন - আপনি url টাইপ করেছেন সেটি ভুল ছিল,আপনি যে url টাইপ করেছেন সেটি হয়তো মুছে গেছে বা কেউ ডিলেট করে দিয়েছে।অথবা সার্ভারে কোনো সমস্যা হলে।
(৩) blocked due to access forbidden :
ব্লকেড ডিউ টু এক্সেস ফরবিডেন (403) অর্থাৎ একটি একটি স্ট্যাটাস কোড যা দ্বারা বুঝায় যে আপনি যে ওয়েবপেজে ঢুকতে চাইছেন সেটিতে প্রবেশ করা নিষিদ্ধ বা প্রবেশ করা যাচ্ছে না।
এটি বিভিন্ন কারণে হতে পারে। যেমন - ওয়েবপেজের মালিক এক্সেস বন্ধ করে রেখেছে, অনুমতি নেই আরকি।
সার্ভারে আপনার আইপি ব্লক করা থাকতে পারে,ওয়েবপেজের সঠিক অনুমতি সেট করা হয় নি,আপনার লোকেশন এমন হতে পারে যেখান থেকে ওয়েবপেজে প্রবেশ করা নিষিদ্ধ, সার্ভারের নিরাপত্তা.htacces বন্ধ থাকতে পারে, ইত্যদি কারণে এটি ঘটে।
(৪) Blocked by robots.txt :
এর মানে হচ্ছে একটি ওয়েবসাইটের robots.txt ফাইল অনুসারে নির্দিষ্ট একটি অংশ বট ক্রল করবে না।Robots.txt হচ্ছে একটি টেক্সট ফাইল। এটি ওয়েবসাইটের সার্ভারে রাখা হয়।এটি দ্বারা বুঝায় যে আপনি বটকে নির্দেশনা দিচ্ছেন যে আপনার কোন পেজটি ক্রল করবেন আর কোন পেজটি ক্রল করবেন না।
এটি মূলত কিছু কারণে মালিকরা এটি করে থাকে।যেমন- কারো ব্যক্তিগত কিছু থাকলে, কনফিডেনশিয়াল কিছু যদি থাকে,ওয়েবসাইটের কিছু অংশ গোপন রাখতে চাওয়া ইত্যাদি কারণে।
robots.txt ফাইল দেখতে এমন হয় -user agent :*
Diallow / privacy.
(৫) Redirect error :
রিডাইরেক্ট ইরোর তখন ঘটে যখন একটি ওয়েব ব্রাউজার বা ক্লায়েন্ট একটি ওয়েবসাইটে পৌঁছাতে চায় তখন ভুলভাবে পুনর্নির্দেশ হয়।এটি সাধারণত সার্ভার কনফিগারেশন সমস্যা হলে,URL সেটআপ করা হলে ইত্যদি কারণে হয়ে থাকে।
একটি URL থেকে যখন অন্য আরেকটি url এ সেটআপ করা হয় তখনই এই সমস্যা হয়ে থাকে।
যেমন - www.example.com/pubish থেকে আপনি
www.exapmple.com/publish-2024 সেটআপ করবেন তাহলে রিডাইরেক্ট ইরোর দেখাবে।কারণ আগে আপনি একটি দিয়ে ওয়েবপেজে প্রবেশ করতেন কিন্তু এখন আপনি ওয়েবপেজের ঠিকানা চেঞ্জ করায় আপনার পেজটি রিডাইরেক্ট দেখায়।নতুনটি দিয় প্রবেশ করলে কোনো সমস্যা হবে না।
(৬) Crawled - Currently not indexed :
এর মানে হচ্ছে আপনার যে কন্টেন্ট আপনি পাবলিশ করেছেন তা গুগল বট ক্রল করেছে কিন্তু তা সার্চ ফলাফলে দেখাবে না।অর্থাৎ আপনার পেজটি ক্রল করেছে ঠিকই কিন্তু ইন্ডেক্স করেনি ফলে গুগল সার্চ রেজাল্টে দেখাচ্ছে না।
এটি কিছু কারণে হয়ে থাকে যেমন - কন্টেন্টের মান গুনগত না হলে, কপি করা কন্টেন, পেজে এমন কোনো ক্যানোনিকাল ট্যাগ ব্যবহার করা হয়েছে যেখানে নির্দেশ দেয়া হয়েছে যে ইন্ডেক্স না করতে,সাইটম্যাপ সমস্যা থাকলে ইত্যাদি এসব কারণে বেশি ঘটে থাকে এমন।
(৭) Discovered - Currently not indexed :
এর মানে হলো এই যে বট আপনার ওয়েব পেজটি খুঁজে পেয়েছে কিন্তু তা ইন্ডেক্স করেনি।পেজে যদি noindex ট্যাগ নির্দেশ করা হলে তা ইন্ডেক্স করবে না।কন্টেন্টের মান উন্নত করলে ক্রল করবে।
শেষ কথা
বন্ধুরা এই ব্লগ পোস্টে দিলাম ওয়েবসাইটের বড় কিছু সমস্যার কারণ কি। পরে একটি দেখাবো এগুলোর সমাধান কী কী।
আসলে একটি ওয়েবসাইট চালাতে গেলে তা নিয়মিত পরীক্ষা ও পর্যবেক্ষণ রাখা উচিত।কি কি সমস্যা হচ্ছে কি ঘটছে এর কার্যকারিতা ইত্যাদি বিষয়ে ফলো রাখা উচিত।
সময় মতো এই সমস্যাগুলো সমাধান করে ওয়েবসাইটকে আপডেট রাখাটা জরুরি। তাই এসব সমস্যা সম্পর্কে জানা জরুরি।
Tags
SEO