What Is Search Engine

একটি সার্চ ইঞ্জিন হল একটি তথ্য পুনরুদ্ধার সিস্টেম যা একটি কম্পিউটার সিস্টেমে সংরক্ষিত তথ্য খুঁজে পেতে সাহায্য করার জন্য ডিজাইন করা হয়েছে। অনুসন্ধানের ফলাফলগুলি সাধারণত একটি তালিকায় উপস্থাপিত হয় এবং সাধারণত হিট (hits) বলা হয়।

এটিকে আপনি মাকড়সার সাথে তুলনা করতে পারেন। যা পুরো নেট দুনিয়ায় জালের মত ছড়িয়ে থাকে নিজের তথ্য সংগ্রহ করার জন্য।

আপনি যখন ইন্টারনেটে কোন তথ্য সার্চ করেন তখন Search Engine নিজের কাছে জমিয়ে রাখা কোটি কোটি ওয়েবপেইজ থেকে বাছাই করে আপনার তথ্যটি খুঁজে দেয়।

How Search Engines Work:

একটি “সার্চ ইঞ্জিন” হল বেশ কয়েকটি আন্তlসংযুক্ত প্রক্রিয়া যা ওয়েব সামগ্রীর টুকরোগুলি চিহ্নিত করার জন্য একসাথে কাজ করে – ছবি, ভিডিও, ওয়েবসাইট পৃষ্ঠা ইত্যাদি – আপনি যে সার্চ বারে টাইপ করেন তার উপর ভিত্তি করে। সাইটের মালিকরা সার্চ ইঞ্জিন অপ্টিমাইজেশান ব্যবহার করে যাতে তাদের সাইটে কন্টেন্ট সার্চ রেজাল্টে দেখা যায়।

সার্চ ইঞ্জিন তিনটি মৌলিক প্রক্রিয়া ব্যবহার করে:

ওয়েব ক্রলার: বট যা ক্রমাগত নতুন পৃষ্ঠাগুলির জন্য ওয়েব ব্রাউজ করে। ক্রলাররা একটি পৃষ্ঠা সঠিকভাবে ইনডেক্স করার জন্য প্রয়োজনীয় তথ্য সংগ্রহ করে এবং হাইপারলিংক ব্যবহার করে অন্যান্য পেজে চলে যায় এবং সেগুলিও সূচী করে।

সার্চ ইনডেক্স: অনলাইনে সমস্ত ওয়েব পেজের রেকর্ড, এমনভাবে সংগঠিত যা কীওয়ার্ড পদ এবং পৃষ্ঠার বিষয়বস্তুর মধ্যে সংযোগ স্থাপনের অনুমতি দেয়। সার্চ ইঞ্জিনগুলির তাদের সূচীতে বিষয়বস্তুর মান নির্ধারণের উপায় রয়েছে।

অনুসন্ধান অ্যালগরিদম: গণনা যা ওয়েব পেজের গুণমান নির্ধারণ করে, সেই পৃষ্ঠাটি একটি অনুসন্ধান শব্দটির সাথে কতটা প্রাসঙ্গিক তা নির্ধারণ করুন এবং গুণমান এবং জনপ্রিয়তার ভিত্তিতে ফলাফলগুলি কীভাবে র‍্যাঙ্কিং করা হয় তা নির্ধারণ করুন।

সার্চ ইঞ্জিনগুলি প্রতিটি ব্যবহারকারীর জন্য সবচেয়ে দরকারী ফলাফল দেওয়ার চেষ্টা করে যাতে বিপুল সংখ্যক ব্যবহারকারী বারবার ফিরে আসে। এটি ব্যবসার অর্থবোধ করে, কারণ বেশিরভাগ সার্চ ইঞ্জিন বিজ্ঞাপনের মাধ্যমে অর্থ উপার্জন করে।

How Search Engines Crawl, Index, and Rank Content

সার্চ ইঞ্জিনগুলো বাইরে থেকে সরল দেখায়। আপনি একটি কীওয়ার্ড টাইপ করুন, এবং আপনি প্রাসঙ্গিক পৃষ্ঠাগুলির একটি তালিকা পাবেন। কিন্তু সেই প্রতারণামূলকভাবে সহজ বিনিময়ের জন্য প্রচুর গণনীয় ভারী উত্তোলন ব্যাকস্টেজ প্রয়োজন।

আপনি অনুসন্ধান করার আগে কঠোর পরিশ্রম শুরু হয়। সার্চ ইঞ্জিন চব্বিশ ঘন্টা কাজ করে, বিশ্বের ওয়েবসাইট থেকে তথ্য সংগ্রহ করে এবং সেই তথ্য সংগঠিত করে, তাই এটি খুঁজে পাওয়া সহজ। এটি প্রথমে ওয়েব পেজ ক্রল করা, সেগুলিকে ইনডেক্স করা, তারপর সার্চ অ্যালগরিদম দিয়ে তাদের র‍্যাঙ্কিং করার একটি তিন ধাপের প্রক্রিয়া।

ক্রলিং ( Crawling )
সার্চ ইঞ্জিন ক্রলারদের উপর নির্ভর করে – স্বয়ংক্রিয় স্ক্রিপ্ট – তথ্যের জন্য ওয়েবকে ঘিরে। ক্রলাররা ওয়েবসাইটের একটি তালিকা দিয়ে শুরু করে। অ্যালগরিদম – কম্পিউটেশনাল নিয়মগুলির সেট – স্বয়ংক্রিয়ভাবে সিদ্ধান্ত নেয় যে এই সাইটগুলির মধ্যে কোনটি ক্রল করতে হবে। অ্যালগরিদমগুলিও নির্দেশ করে যে কত পৃষ্ঠা ক্রল করতে হবে এবং কত ঘন ঘন।

ক্রলাররা তালিকাভুক্ত প্রতিটি সাইট ভিজিট করে, HREF এবং SRC এর মতো ট্যাগের মাধ্যমে লিঙ্কগুলি অনুসরণ করে অভ্যন্তরীণ বা বহিরাগত পৃষ্ঠায় যেতে। সময়ের সাথে সাথে, ক্রলাররা আন্তlসংযুক্ত পৃষ্ঠাগুলির একটি ক্রমবর্ধমান মানচিত্র তৈরি করে।

বিপণনকারীদের জন্য টেকওয়ে ( Takeaway for Marketers )
নিশ্চিত করুন যে আপনার সাইট ক্রলারদের কাছে সহজেই অ্যাক্সেসযোগ্য। যদি বটগুলি ক্রল করতে না পারে, তারা এটি সূচী করতে পারে না, এবং এর মানে হল যে আপনার সাইট অনুসন্ধান ফলাফলে উপস্থিত হবে না। আপনি নিম্নলিখিতগুলি বাস্তবায়নের মাধ্যমে ক্রলার অ্যাক্সেসযোগ্যতার নিশ্চয়তা দিতে সাহায্য করতে পারেন:

লজিক্যাল সাইট শ্রেণিবিন্যাস( Logical site hierarchy ): একটি লজিক্যাল সাইট আর্কিটেকচার সংজ্ঞায়িত করুন যা ডোমেইন থেকে বিভাগ থেকে উপশ্রেণীতে প্রবাহিত হয়। এটি ক্রলারগুলিকে আপনার সাইটের মাধ্যমে আরও দ্রুত যেতে দেয়, যাতে সাইটটি তার ক্রল বাজেটের মধ্যে থাকে।

লিঙ্ক ( Links ): প্রতিটি পৃষ্ঠায় অভ্যন্তরীণ ব্যবহার করুন। ক্রলারদের পৃষ্ঠার মধ্যে সরানোর জন্য লিঙ্ক প্রয়োজন। কোন লিঙ্ক ছাড়া পৃষ্ঠাগুলি ক্রল করা যায় না এবং অতএব আন-ইন্ডেক্সযোগ্য।

এক্সএমএল সাইটম্যাপ ( XML sitemap ): ব্লগ পোস্ট সহ আপনার ওয়েবসাইটের সমস্ত পৃষ্ঠার একটি তালিকা তৈরি করুন। এই তালিকা ক্রলারদের জন্য একটি নির্দেশিকা ম্যানুয়াল হিসাবে কাজ করে, তাদের বলছে কোন পৃষ্ঠাগুলি ক্রল করতে হবে। এখানে প্লাগইন এবং টুলস আছে – যেমন ইয়োস্ট এবং গুগল এক্সএমএল সাইটম্যাপ – যা আপনি নতুন কন্টেন্ট প্রকাশ করার সময় আপনার সাইটম্যাপ তৈরি এবং আপডেট করবেন।

ইনডেক্সিং (Indexing)
একটি পৃষ্ঠা খোঁজার পর, একটি বট আপনার ব্রাউজারের মতই এটিকে (বা রেন্ডার) করে। তার মানে ছবি, ভিডিও বা অন্যান্য ধরনের ডাইনামিক পেজ কন্টেন্ট সহ আপনি যা দেখছেন তা বটকে দেখতে হবে।

বট এই বিষয়বস্তুকে ছবি, সিএসএস এবং এইচটিএমএল, পাঠ্য এবং কীওয়ার্ড ইত্যাদিতে বিভাগগুলিতে সংগঠিত করে। এই প্রক্রিয়াটি ক্রলারকে পৃষ্ঠায় কী আছে তা “বোঝার” অনুমতি দেয়, কোন কীওয়ার্ড অনুসন্ধানের জন্য পৃষ্ঠাটি প্রাসঙ্গিক তা নির্ধারণ করার জন্য একটি প্রয়োজনীয় অগ্রদূত।

সার্চ ইঞ্জিনগুলি এই তথ্যটি একটি সূচীতে সংরক্ষণ করে, একটি বিশাল ডাটাবেস যার একটি ক্যাটালগ এন্ট্রি রয়েছে প্রতিটি ওয়েবপেজে প্রতিটি সূচী দেখা যায়। গুগলের ইনডেক্স, ক্যাফিন ইনডেক্স, প্রায় 100,000,000 গিগাবাইট গ্রহণ করে এবং “সার্ভার ফার্ম” পূরণ করে, হাজার হাজার কম্পিউটার যা কখনও বন্ধ হয় না, বিশ্বজুড়ে।

বিপণনকারীদের জন্য টেকওয়ে ( Takeaway for Marketers ):
নিশ্চিত করুন যে ক্রলাররা আপনার সাইটকে “দেখুন” আপনি তাদের কীভাবে চান; সাইটের কোন অংশগুলিকে আপনি ইন্ডেক্স করার অনুমতি দেন তা নিয়ন্ত্রণ করুন।

ইউআরএল পরিদর্শন সরঞ্জাম ( URL Inspection Tool ): যদি আপনি জানতে চান যে ক্রলাররা আপনার সাইটে অবতরণের সময় কী দেখেন, তাহলে URL পরিদর্শন সরঞ্জামটি ব্যবহার করুন। ক্রলাররা কেন পৃষ্ঠাটি ইন্ডেক্স করছে না বা গুগলকে ক্রল করার অনুরোধ করছে তা জানতে আপনি টুলটি ব্যবহার করতে পারেন।

Robots.txt: আপনি চাইবেন না ক্রলাররা আপনার সাইটের প্রতিটি পৃষ্ঠা SERPs এ দেখান; উদাহরণস্বরূপ, লেখক পৃষ্ঠা বা পৃষ্ঠার পৃষ্ঠাগুলি সূচী থেকে বাদ দেওয়া যেতে পারে। কোন পৃষ্ঠাগুলি ক্রল করতে পারে তা বটকে জানিয়ে অ্যাক্সেস নিয়ন্ত্রণ করতে একটি robots.txt ফাইল ব্যবহার করুন।

Ranking:
চূড়ান্ত ধাপে, সার্চ ইঞ্জিনগুলি সূচীকৃত তথ্যের মাধ্যমে বাছাই করে এবং প্রতিটি প্রশ্নের জন্য সঠিক ফলাফল প্রদান করে। তারা সার্চ অ্যালগরিদম, নিয়ম যা বিশ্লেষণ করে যে একজন অনুসন্ধানকারী কী খুঁজছেন এবং কোন ফলাফলটি প্রশ্নের উত্তরের সর্বোত্তম উত্তর দেয়।

অ্যালগরিদমগুলি তাদের সূচীতে পৃষ্ঠাগুলির গুণমান নির্ধারণ করতে অসংখ্য কারণ ব্যবহার করে। প্রাসঙ্গিক ফলাফলের র‍্যাঙ্ক করার জন্য গুগল অ্যালগরিদমগুলির একটি সম্পূর্ণ সিরিজ ব্যবহার করে। এই অ্যালগরিদমগুলিতে ব্যবহৃত Ranking ফ্যাক্টরগুলির মধ্যে অনেকগুলি বিষয়বস্তুর একটি সাধারণ জনপ্রিয়তা বিশ্লেষণ করে এবং এমনকি ব্যবহারকারীদের পৃষ্ঠায় অবতরণের সময় তাদের গুণগত অভিজ্ঞতাও বিশ্লেষণ করে। এই কারণগুলির মধ্যে রয়েছে:

Backlink quality
Mobile-friendliness
“Freshness,” or how recently content was updated
Engagement
Page speed
অ্যালগরিদমগুলি তাদের কাজ সঠিকভাবে করছে কিনা তা নিশ্চিত করার জন্য, গুগল অ্যালগরিদম পরীক্ষা এবং পরিমার্জন করার জন্য মানব সার্চ কোয়ালিটি রেটার ব্যবহার করে। সার্চ ইঞ্জিনগুলি কীভাবে কাজ করে তাতে মানুষ নয়, প্রোগ্রামগুলি জড়িত থাকে।

বিপণনকারীদের জন্য টেকওয়ে ( Takeaway for Marketers )

সার্চ ইঞ্জিনগুলি সবচেয়ে প্রাসঙ্গিক, ব্যবহারযোগ্য ফলাফল দেখাতে চায়। এটি অনুসন্ধানকারীদের খুশি রাখে এবং বিজ্ঞাপনের আয় বাড়িয়ে দেয়। এই কারণেই বেশিরভাগ সার্চ ইঞ্জিনের Ranking ফ্যাক্টরগুলি আসলে একই বিষয় যা মানব অনুসন্ধানকারীরা পৃষ্ঠার গতি, নতুনত্ব এবং অন্যান্য সহায়ক সামগ্রীর লিঙ্ক দ্বারা বিষয়বস্তু বিচার করে।

My success rate is higher than my failure.

In my career, I’ve had the privilege to work in many different industries and for clients such as travel agencies, design agencies, IT companies, non-profits, and private clients.