আমি কীভাবে আমার এআই এজেন্ট প্রকল্পের সাফল্য নিশ্চিত করতে পারি?

আপনার এআই এজেন্ট প্রকল্পের সাফল্য নিশ্চিত করতে, কাজটি এক বাক্যে স্পষ্টভাবে সংজ্ঞায়িত করুন এবং আপনি যে স্বায়ত্তশাসনের স্তরে স্বাচ্ছন্দ্যবোধ করেন তা নির্ধারণ করুন। এছাড়াও, সাধারণ ত্রুটিগুলি এড়াতে এবং আরও ভালোভাবে সমস্যা সমাধানের সুযোগ করে দিতে কঠোর টুল স্কিমা, লগিং এবং যাচাইকরণ কৌশল প্রয়োগ করুন।.

আমার এআই এজেন্টের জন্য টুল ডিজাইন করার সময় আমার কী কী বিষয় বিবেচনা করা উচিত?

আপনার এআই এজেন্টের জন্য টুল ডিজাইন করার সময়, নিশ্চিত করুন যে সেগুলি সুনির্দিষ্ট, টাইপযুক্ত এবং অনুমতি-সাপেক্ষ। এমন সাধারণ টুল পরিহার করুন যা যেকোনো কাজ করতে পারে। এর পরিবর্তে, নিরাপত্তা ও নির্ভরযোগ্যতা বজায় রাখার জন্য নির্দিষ্ট ফাংশন কল তৈরি করুন যা এজেন্ট ব্যবহার করতে পারে।.

আমার এআই এজেন্টের জন্য কীভাবে সুস্পষ্ট স্টপ কন্ডিশন সেট করব?

আপনার এআই এজেন্টের জন্য সুস্পষ্ট থামার শর্ত নির্ধারণ করতে, এটি সর্বোচ্চ কতগুলো ধাপ নিতে পারবে তার একটি সংখ্যা, সেইসাথে টাইমআউট এবং কাজ সম্পন্ন হওয়ার যাচাইকরণ ব্যবস্থা সংজ্ঞায়িত করুন। এটি এজেন্টকে লুপে আটকে যাওয়া থেকে রক্ষা করতে এবং প্রয়োজনে সমস্যাগুলো ঊর্ধ্বতন কর্তৃপক্ষের কাছে জানাতে পারার বিষয়টি নিশ্চিত করতে সাহায্য করবে।.

একটি এআই এজেন্টের মেমরি ব্যবস্থাপনার সর্বোত্তম উপায় কী?

আপনার এআই এজেন্টের মেমরিকে স্বল্পমেয়াদী এবং দীর্ঘমেয়াদী অংশে বিভক্ত করে পরিচালনা করুন। স্বল্পমেয়াদী মেমরিকে সংক্ষিপ্ত রাখুন এবং বর্তমান পদক্ষেপ ও পরিকল্পনার উপর মনোযোগ দিন, অন্যদিকে দীর্ঘমেয়াদী মেমরি ব্যবহারকারীর পছন্দ এবং সাংগঠনিক নিয়মের মতো স্থিতিশীল তথ্যের জন্য ব্যবহার করুন।.

একটি এআই এজেন্টের মধ্যে কার্য পরিকল্পনা করার কোনো নির্দিষ্ট প্যাটার্ন আছে কি?

হ্যাঁ, বিভিন্ন পরিকল্পনা পদ্ধতি ব্যবহার করা যেতে পারে, যেমন—পূর্বাভাসযোগ্য কাজের জন্য চেকলিস্ট, টুলের আউটপুটের সাথে খাপ খাইয়ে নেওয়ার জন্য রিঅ্যাক্ট লুপ, এবং জটিল প্রোজেক্টের জন্য ভূমিকা পৃথকীকরণে সক্ষম সুপারভাইজার-কর্মী মডেল। আপনার এজেন্টের নির্দিষ্ট প্রয়োজন অনুযায়ী একটি পরিকল্পনা পদ্ধতি বেছে নিন।.

আমি কীভাবে আমার এআই এজেন্টের কর্মক্ষমতা কার্যকরভাবে মূল্যায়ন করতে পারি?

আপনার এআই এজেন্টের কর্মক্ষমতা মূল্যায়ন করতে, হ্যাপি পাথ, এজ কেস এবং অস্পষ্ট অনুরোধ সহ একটি সিনারিও স্যুট তৈরি করুন। এর সক্ষমতা ক্রমাগত উন্নত করার জন্য, টাস্ক সফলতার হার, প্রতিক্রিয়ার সময় এবং ত্রুটি থেকে পুনরুদ্ধারের মতো মেট্রিকের উপর ভিত্তি করে ফলাফলগুলোকে স্কোর করুন।.

কীভাবে একটি এআই এজেন্ট তৈরি করবেন [ভিডিও এবং কুইজ]

সংক্ষিপ্ত উত্তর: বাস্তবে কার্যকর একটি এআই এজেন্ট তৈরি করতে, এটিকে একটি নিয়ন্ত্রিত লুপ হিসেবে বিবেচনা করুন: ইনপুট নিন, পরবর্তী পদক্ষেপের সিদ্ধান্ত নিন, একটি নির্দিষ্ট পরিসরের টুলকে নির্দেশ দিন, ফলাফল পর্যবেক্ষণ করুন এবং একটি সুস্পষ্ট “সম্পন্ন” চেক পাস না হওয়া পর্যন্ত পুনরাবৃত্তি করুন। কাজটি যখন একাধিক ধাপের এবং টুল-নির্ভর হয়, তখনই এটি কার্যকর হয়; যদি একটিমাত্র নির্দেশেই সমাধান হয়ে যায়, তবে এজেন্টকে এড়িয়ে যান। কঠোর টুল স্কিমা, ধাপের সীমা, লগিং এবং একটি ভ্যালিডেটর/ক্রিটিক যোগ করুন, যাতে টুল ব্যর্থ হলে বা ইনপুট অস্পষ্ট হলে, এজেন্ট লুপে না গিয়ে পরবর্তী ধাপে যায়।

মূল বিষয়গুলি:

কন্ট্রোলার লুপ: সুস্পষ্ট থামার শর্ত এবং সর্বোচ্চ ধাপসহ ইনপুট→কার্য→পর্যবেক্ষণ পুনরাবৃত্তি বাস্তবায়ন করুন।

টুল ডিজাইন: অপরিকল্পিত বিশৃঙ্খলা রোধ করতে টুলগুলোকে সীমিত, টাইপ-ভিত্তিক, অনুমতি-যুক্ত এবং যাচাইকৃত রাখুন।

স্মৃতির স্বাস্থ্যবিধি: সংক্ষিপ্ত স্বল্পমেয়াদী অবস্থা এবং দীর্ঘমেয়াদী পুনরুদ্ধার ব্যবহার করুন; সম্পূর্ণ প্রতিলিপি ডাম্প করা এড়িয়ে চলুন।

অপব্যবহার প্রতিরোধ: ঝুঁকিপূর্ণ কাজের জন্য অ্যালাওলিস্ট, রেট লিমিট, আইডম্পোটেন্সি এবং “ড্রাই-রান” যোগ করুন।

পরীক্ষাযোগ্যতা: একটি দৃশ্যকল্প স্যুট (ব্যর্থতা, অস্পষ্টতা, ইনজেকশন) বজায় রাখুন এবং প্রতিটি পরিবর্তন পুনরায় চালান।

কিভাবে একজন এআই এজেন্ট তৈরি করবেন? ইনফোগ্রাফিক

এর পরে আপনি যে প্রবন্ধগুলি পড়তে পছন্দ করতে পারেন:

🔗 এআই কর্মক্ষমতা কীভাবে পরিমাপ করা যায়
গতি, নির্ভুলতা এবং নির্ভরযোগ্যতা নির্ধারণের জন্য ব্যবহারিক মেট্রিক্স শিখুন।.

🔗 এআই-এর সাথে কীভাবে কথা বলবেন
আরও ভালো উত্তর পেতে প্রম্পট, প্রসঙ্গ এবং ফলো-আপ ব্যবহার করুন।.

🔗 এআই মডেলগুলি কীভাবে মূল্যায়ন করবেন
পরীক্ষা, রুব্রিক এবং বাস্তব-বিশ্বের কাজের ফলাফল ব্যবহার করে মডেলগুলির তুলনা করুন।.

🔗 এআই মডেলগুলি কীভাবে অপ্টিমাইজ করা যায়
টিউনিং, ছাঁটাই এবং পর্যবেক্ষণের মাধ্যমে মান এবং খরচ উন্নত করুন।.

১) একজন এআই এজেন্ট কী, সাধারণ মানুষের ভাষায় 🧠

একটি এআই এজেন্ট হলো একটি লুপ। ল্যাংচেইন “এজেন্টস” ডক্স

এই তো। মাঝখানে একটা মস্তিষ্কের লুপ।.

ইনপুট → চিন্তা → কাজ → পর্যবেক্ষণ → পুনরাবৃত্তি। রিঅ্যাক্ট পেপার (যুক্তি + কাজ)

কোথায়:

ইনপুট হল একটি ব্যবহারকারীর অনুরোধ বা একটি ইভেন্ট (নতুন ইমেল, সহায়তা টিকিট, সেন্সর পিং)।
চিন্তা হলো পরবর্তী ধাপ সম্পর্কে যুক্তি প্রদানের একটি ভাষা মডেল।
আইন হল একটি টুল কল করা (অভ্যন্তরীণ ডক্স অনুসন্ধান করুন, কোড চালান, একটি টিকিট তৈরি করুন, একটি উত্তর খসড়া করুন)। OpenAI ফাংশন কলিং গাইড
অবজেক্ট টুল আউটপুট পড়ছে।
পুনরাবৃত্তিই এটিকে ‘আলাপচারী’ না হয়ে ‘কর্মঠ’ করে তোলে। ল্যাংচেইন “এজেন্টস” ডক্স।

কিছু এজেন্ট মূলত স্মার্ট ম্যাক্রো। অন্যরা একজন জুনিয়র অপারেটরের মতো কাজ করে যারা কাজগুলিকে ঝাঁকুনি দিতে পারে এবং ত্রুটিগুলি থেকে পুনরুদ্ধার করতে পারে। উভয়ই গুরুত্বপূর্ণ।.

আর, তোমার পূর্ণ স্বায়ত্তশাসনের প্রয়োজন নেই। আসলে... তুমি সম্ভবত এটা চাও না 🙃

২) কখন আপনার এজেন্ট তৈরি করা উচিত (এবং কখন করা উচিত নয়) 🚦

এজেন্ট তৈরি করুন যখন:

কাজটি বহু-পদক্ষেপ বিশিষ্ট এবং মাঝপথে কী ঘটে তার উপর নির্ভর করে পরিবর্তিত হয়।
এই কাজের জন্য টুল ব্যবহারের (ডাটাবেস, সিআরএম, কোড এক্সিকিউশন, ফাইল জেনারেশন, ব্রাউজার, ইন্টারনাল এপিআই)। ল্যাংচেইন “টুলস” ডক্স।
তুমি কেবল একবারের উত্তর নয়, বরং রেলিং দিয়ে পুনরাবৃত্তিযোগ্য ফলাফল চাও ।
আপনি "সম্পন্ন" কে এমনভাবে সংজ্ঞায়িত করতে পারেন যেভাবে একটি কম্পিউটার পরীক্ষা করতে পারে, এমনকি আলগাভাবেও।.

নিম্নলিখিত ক্ষেত্রে এজেন্ট তৈরি করবেন না:

একটি সহজ প্রম্পট + প্রতিক্রিয়া সমস্যার সমাধান করে (অতিরিক্ত পরিশ্রম করো না, পরে তুমি নিজেকে ঘৃণা করবে)।.
আপনার নিখুঁত নিয়তিবাদ প্রয়োজন (এজেন্টগুলি সামঞ্জস্যপূর্ণ হতে পারে, কিন্তু রোবোটিক নয়)।.
আপনার কাছে সংযোগ করার জন্য কোনও সরঞ্জাম বা ডেটা নেই - তাহলে এটি বেশিরভাগই কেবল ভাইবস।.

স্পষ্ট করে বলতে পারি: "এআই এজেন্ট প্রজেক্ট"-এর অর্ধেকই কিছু শাখা প্রশাখার নিয়ম মেনে একটি কর্মপ্রবাহ হতে পারে। কিন্তু কখনও কখনও আবেগও গুরুত্বপূর্ণ 🤷♂️

৩) একজন এআই এজেন্টের ভালো সংস্করণ কী তৈরি করে ✅

"কী একটি ভালো সংস্করণ তৈরি করে" বিভাগটি আপনি চেয়েছিলেন, আমি একটু স্পষ্ট করে বলব:

একটি ভালো এআই এজেন্ট নয় যেটি সবচেয়ে বেশি চিন্তা করে। বরং সেটিই ভালো, যা:

কী করার অনুমতি আছে তা জানে (কার্যপরিধির সীমা)।
টুলগুলির নির্ভরযোগ্য ব্যবহার (স্ট্রাকচার্ড কল, রিট্রাই, টাইমআউট) ওপেনএআই ফাংশন কলিং গাইড এডব্লিউএস “জিটার সহ টাইমআউট, রিট্রাই এবং ব্যাকঅফ”
স্টেট পরিষ্কারভাবে রাখে (মেমরি যা নষ্ট হয় না) ল্যাংচেইন “মেমরি ওভারভিউ”
এর কার্যক্রম ব্যাখ্যা করে (নিরীক্ষা বিবরণী, গোপন যুক্তির বিবরণ নয়) এনআইএসটি এআই আরএমএফ ১.০ (বিশ্বাসযোগ্যতা ও স্বচ্ছতা)
যথাযথভাবে থামে (সম্পূর্ণতা যাচাই, সর্বোচ্চ ধাপ, ঊর্ধ্বতন কর্তৃপক্ষের কাছে প্রেরণ) ল্যাংচেইন “এজেন্টস” ডক্স
নিরাপদে ব্যর্থ হয় (সাহায্য চায়, কর্তৃত্বের অলীক কল্পনা করে না) NIST AI RMF 1.0
পরীক্ষাযোগ্য (আপনি এটি ক্যানড পরিস্থিতিতে চালাতে পারেন এবং ফলাফল স্কোর করতে পারেন)

যদি আপনার এজেন্ট পরীক্ষা করা না যায়, তাহলে এটি মূলত একটি খুব আত্মবিশ্বাসী স্লট মেশিন। পার্টিতে মজা, প্রোডাকশনে ভয়াবহ 😬

৪) একটি এজেন্টের মূল গঠন উপাদান ("শারীরস্থান" 🧩)

বেশিরভাগ কঠিন এজেন্টের এই অংশগুলি থাকে:

ক) কন্ট্রোলার লুপ 🔁

এই হলেন অর্কেস্ট্রেটর:

লক্ষ্য নির্ধারণ করা
পরবর্তী পদক্ষেপের জন্য মডেলকে জিজ্ঞাসা করুন
রান টুল
পর্যবেক্ষণ যোগ করুন
সম্পন্ন না হওয়া পর্যন্ত পুনরাবৃত্তি করুন ল্যাংচেইন “এজেন্টস” ডক্স

খ) সরঞ্জাম (ওরফে ক্ষমতা) 🧰

টুলস একজন এজেন্টকে কার্যকর করে তোলে: ল্যাংচেইন “টুলস” ডক্স

ডাটাবেস কোয়েরি
ইমেল পাঠানো
ফাইল টানা
চলমান কোড
অভ্যন্তরীণ API গুলিকে কল করা হচ্ছে
স্প্রেডশিট বা সিআরএম-এ লেখা

গ) স্মৃতি 🗃️

দুই ধরণের বিষয়:

স্বল্পমেয়াদী স্মৃতি: বর্তমান চলমান প্রেক্ষাপট, সাম্প্রতিক পদক্ষেপ, বর্তমান পরিকল্পনা
দীর্ঘমেয়াদী স্মৃতি: ব্যবহারকারীর পছন্দ, প্রকল্পের প্রেক্ষাপট, সংগৃহীত জ্ঞান (প্রায়শই এম্বেডিং + একটি ভেক্টর স্টোরের মাধ্যমে) RAG পেপার

ঘ) পরিকল্পনা ও সিদ্ধান্ত নীতি 🧭

এমনকি যদি আপনি এটিকে "পরিকল্পনা" নাও বলেন, আপনার একটি পদ্ধতির প্রয়োজন:

চেকলিস্ট
রিঅ্যাক্ট-শৈলীর “ভাবুন তারপর টুল” রিঅ্যাক্ট পেপার
টাস্ক গ্রাফ
সুপারভাইজার-কর্মীর ধরণ
সুপারভাইজার-কর্মী প্যাটার্ন মাইক্রোসফ্ট অটোজেন (মাল্টি-এজেন্ট ফ্রেমওয়ার্ক)

ঙ) রেলিং এবং মূল্যায়ন 🧯

অনুমতি
নিরাপদ টুল স্কিমা OpenAI স্ট্রাকচার্ড আউটপুট
আউটপুট বৈধতা
ধাপের সীমা
লগিং
NIST AI RMF 1.0 পরীক্ষা করে

হ্যাঁ, এটা প্ররোচনার চেয়ে বেশি প্রকৌশলগত। যা... কিছুটা মূল কথা।.

৫) তুলনা সারণী: এজেন্ট তৈরির জনপ্রিয় উপায় 🧾

নিচে একটি বাস্তবসম্মত "তুলনা সারণী" দেওয়া হল - কিছু অদ্ভুত বৈশিষ্ট্য সহ, কারণ আসল দলগুলি অদ্ভুত 😄

টুল / ফ্রেমওয়ার্ক	পাঠকবর্গ	দাম	কেন এটি কাজ করে	নোট (ছোট বিশৃঙ্খলা)
ল্যাংচেইন	লেগো-স্টাইলের উপাদান পছন্দ করেন এমন নির্মাতারা	ফ্রি-ইশ + ইনফ্রা	সরঞ্জাম, স্মৃতি, শৃঙ্খলের জন্য বৃহৎ বাস্তুতন্ত্র	স্পষ্টভাবে নাম না বললে স্প্যাগেটি-ফাস্ট হতে পারে
লামাইন্ডেক্স	RAG-ভারী দল	ফ্রি-ইশ + ইনফ্রা	শক্তিশালী পুনরুদ্ধার নিদর্শন, সূচীকরণ, সংযোগকারী	যখন আপনার এজেন্ট মূলত "অনুসন্ধান + কাজ" করে তখন দুর্দান্ত... যা সাধারণ
ওপেনএআই সহকারীর স্টাইল পদ্ধতি	দ্রুত সেটআপ চাওয়া দলগুলো	ব্যবহার-ভিত্তিক	অন্তর্নির্মিত টুল কলিং প্যাটার্ন এবং রান স্টেট	কিছু কোণে কম নমনীয়, কিন্তু অনেক অ্যাপের জন্য পরিষ্কার	ওপেনএআই রানস এপিআই ওপেনএআই অ্যাসিস্ট্যান্টস ফাংশন কলিং
শব্দার্থিক কার্নেল	যারা কাঠামোগত অর্কেস্ট্রেশন চান এমন ডেভেলপাররা	স্বাধীনচেতা	দক্ষতা/কার্যকরীতার জন্য সুন্দর বিমূর্তকরণ	"এন্টারপ্রাইজ পরিপাটি" মনে হয় - কখনও কখনও এটি প্রশংসার যোগ্য 😉
অটোজেন	মাল্টি-এজেন্ট পরীক্ষক	স্বাধীনচেতা	এজেন্ট-টু-এজেন্ট সহযোগিতার ধরণ	অতিরিক্ত কথা বলতে পারে; কঠোর বরখাস্তের নিয়ম নির্ধারণ করতে পারে
CrewAI সম্পর্কে	"এজেন্টদের দল" ভক্তরা	স্বাধীনচেতা	ভূমিকা + কাজ + হ্যান্ডঅফ প্রকাশ করা সহজ	কাজগুলো যখন মসৃণ না হয়ে মসৃণ হয়, তখন সবচেয়ে ভালো কাজ করে
খড়ের গাদা	অনুসন্ধান + পাইপলাইনের মানুষ	স্বাধীনচেতা	কঠিন পাইপলাইন, পুনরুদ্ধার, উপাদান	"এজেন্ট থিয়েটার" কম, "ব্যবহারিক কারখানা" বেশি
নিজের মতো করে রোল করুন (কাস্টম লুপ)	নিয়ন্ত্রণ পাগল (স্নেহশীল)	তোমার সময়	ন্যূনতম জাদু, সর্বোচ্চ স্পষ্টতা	সাধারণত দীর্ঘমেয়াদী সেরা... যতক্ষণ না আপনি সবকিছু নতুন করে তৈরি করেন 😅

কোনো একক বিজয়ী নেই। সেরা পছন্দটি নির্ভর করে আপনার এজেন্টের প্রধান কাজ ডেটা পুনরুদ্ধার, টুল এক্সিকিউশন, একাধিক এজেন্টের মধ্যে সমন্বয়, নাকি ওয়ার্কফ্লো অটোমেশন—এর।

৬) ধাপে ধাপে কীভাবে একটি এআই এজেন্ট তৈরি করবেন (প্রকৃত রেসিপি) 🍳🤖

এই অংশটি বেশিরভাগ মানুষ এড়িয়ে যায়, তারপর ভাবি কেন এজেন্টটি প্যান্ট্রিতে র‍্যাকুনের মতো আচরণ করে।.

ধাপ ১: এক বাক্যে কাজটি সংজ্ঞায়িত করুন 🎯

উদাহরণ:

"নীতি এবং টিকিটের প্রেক্ষাপট ব্যবহার করে গ্রাহকের উত্তরের খসড়া তৈরি করুন, তারপর অনুমোদনের জন্য জিজ্ঞাসা করুন।"
"একটি বাগ রিপোর্ট তদন্ত করুন, এটি পুনরুত্পাদন করুন এবং একটি সমাধান প্রস্তাব করুন।"
"অসম্পূর্ণ মিটিং নোটগুলিকে কাজ, মালিক এবং সময়সীমাতে পরিণত করুন।"

যদি তুমি এটাকে সহজভাবে সংজ্ঞায়িত করতে না পারো, তাহলে তোমার এজেন্টও পারবে না। আমি বলতে চাইছি এটা পারে, কিন্তু এটা উন্নতি করবে, এবং উন্নতির মাধ্যমেই বাজেটের মৃত্যু ঘটে।.

ধাপ ২: স্বায়ত্তশাসনের মাত্রা নির্ধারণ করুন (নিম্ন, মাঝারি, মশলাদার) 🌶️

কম স্বায়ত্তশাসন: পদক্ষেপের পরামর্শ দেয়, মানুষ “অনুমোদন” ক্লিক করে।
মাধ্যম: সরঞ্জাম চালায়, আউটপুট খসড়া করে, অনিশ্চয়তার উপর বৃদ্ধি পায়
উচ্চ: এন্ড-টু-এন্ড এক্সিকিউট করে, শুধুমাত্র ব্যতিক্রমগুলিতে মানুষকে পিং করে

তুমি যতটা চাও তার চেয়ে নিচুতে শুরু করো। পরে তুমি যেকোনো সময় এটিকে ক্র্যাঙ্ক করতে পারো।.

ধাপ ৩: আপনার মডেল কৌশল বেছে নিন 🧠

আপনি সাধারণত বেছে নেন:

সবকিছুর জন্য একটি শক্তিশালী মডেল (সহজ)
একটি শক্তিশালী মডেল + সস্তা ধাপের জন্য ছোট মডেল (শ্রেণীবিভাগ, রাউটিং)
প্রয়োজনে বিশেষায়িত মডেল (দৃষ্টি, কোড, বক্তৃতা)

এছাড়াও সিদ্ধান্ত নিন:

সর্বোচ্চ টোকেন
তাপমাত্রা
আপনি কি অভ্যন্তরীণভাবে দীর্ঘ যুক্তির চিহ্নগুলিকে অনুমতি দেন (আপনি পারেন, কিন্তু শেষ ব্যবহারকারীদের কাছে কাঁচা চিন্তার শৃঙ্খলা প্রকাশ করবেন না)

ধাপ ৪: কঠোর স্কিমা সহ টুলগুলি সংজ্ঞায়িত করুন 🔩

সরঞ্জামগুলি হওয়া উচিত:

সংকীর্ণ
টাইপ করা হয়েছে
অনুমোদিত
যাচাইকৃত OpenAI স্ট্রাকচার্ড আউটপুট

do_anything(input: string) নামক একটি টুলের পরিবর্তে , তৈরি করুন:

search_kb(কোয়েরি: স্ট্রিং) -> ফলাফল[]
create_ticket(শিরোনাম: স্ট্রিং, বডি: স্ট্রিং, অগ্রাধিকার: enum) -> ticket_id
send_email(to: string, subject: string, body: string) -> status OpenAI ফাংশন কলিং গাইড

যদি তুমি এজেন্টকে একটি চেইনসো দাও, তাহলে যখন সে বেড়াটিও সরিয়ে একটি হেজ ছাঁটাই করবে তখন অবাক হবেন না।.

ধাপ ৫: কন্ট্রোলার লুপ তৈরি করুন 🔁

সর্বনিম্ন লুপ:

লক্ষ্য + প্রাথমিক প্রেক্ষাপট দিয়ে শুরু করুন
মডেলকে জিজ্ঞাসা করুন: "পরবর্তী পদক্ষেপ?"
যদি টুল কল - এক্সিকিউট টুল
পর্যবেক্ষণ যোগ করুন
স্টপের অবস্থা পরীক্ষা করুন
সর্বোচ্চ ধাপ সহ LangChain “Agents” ডক্স

যোগ করুন:

টাইমআউট
পুনরায় চেষ্টা (সতর্ক থাকুন - পুনরায় চেষ্টার প্রক্রিয়াটি চক্রাকারে চলতে পারে) AWS “জিটার সহ টাইমআউট, পুনরায় চেষ্টা এবং ব্যাকঅফ”
টুল ত্রুটি বিন্যাস (স্পষ্ট, কাঠামোগত)

ধাপ ৬: সাবধানে মেমরি যোগ করুন 🗃️

স্বল্পমেয়াদী: প্রতিটি ধাপে একটি সংক্ষিপ্ত “অবস্থা সারাংশ” আপডেট রাখুন। ল্যাংচেইন “মেমরি ওভারভিউ”
দীর্ঘমেয়াদী: টেকসই তথ্য সংরক্ষণ করুন (ব্যবহারকারীর পছন্দ, সংস্থার নিয়ম, স্থিতিশীল নথি)।

মূল নিয়ম:

যদি এটি ঘন ঘন পরিবর্তিত হয় - এটি স্বল্পমেয়াদী রাখুন
যদি এটি স্থিতিশীল থাকে - দীর্ঘমেয়াদী সংরক্ষণ করুন
যদি এটি সংবেদনশীল হয় - ন্যূনতম পরিমাণে সংরক্ষণ করুন (অথবা একেবারেই নয়)

ধাপ ৭: বৈধতা এবং একটি "সমালোচক" পাস যোগ করুন 🧪

একটি সস্তা, ব্যবহারিক প্যাটার্ন:

এজেন্ট ফলাফল তৈরি করে
যাচাইকারী কাঠামো এবং সীমাবদ্ধতা পরীক্ষা করে
অনুপস্থিত পদক্ষেপ বা নীতি লঙ্ঘনের জন্য ঐচ্ছিক সমালোচক মডেল পর্যালোচনা NIST AI RMF 1.0

নিখুঁত নয়, কিন্তু এতে প্রচুর পরিমাণে বাজে কথা ধরা পড়ে।.

ধাপ ৮: লগ ইন না করার জন্য আপনার যা কিছু অনুশোচনা হবে তার সবকিছু লগ ইন করুন 📜

লগ:

টুল কল + ইনপুট + আউটপুট
সিদ্ধান্ত নেওয়া হয়েছে
ত্রুটি
চূড়ান্ত ফলাফল
টোকেন এবং ল্যাটেন্সি ওপেনটেলিমেট্রি পর্যবেক্ষণযোগ্যতা প্রাইমার

ভবিষ্যৎ-তুমি তোমাকে ধন্যবাদ জানাবে। বর্তমান-তুমি ভুলে যাবে। এটাই জীবন 😵💫

৭) এমন একটি হাতিয়ার যা আপনার আত্মাকে ভেঙে দেয় না 🧰😵

টুল কলিং হলো সেই জায়গা যেখানে "কিভাবে একজন এআই এজেন্ট তৈরি করবেন" আসল সফটওয়্যার ইঞ্জিনিয়ারিং হয়ে ওঠে।.

সরঞ্জামগুলিকে নির্ভরযোগ্য করে তুলুন (নির্ভরযোগ্যতা ভালো)

নির্ভরযোগ্য সরঞ্জামগুলি হল:

নিয়তিবাদী
পরিধি সংকীর্ণ
পরীক্ষা করা সহজ
স্ট্রাইপের "আইডম্পোটেন্ট অনুরোধ" পুনরায় চালানো নিরাপদ ।

টুল লেয়ারে কেবল প্রম্পট নয়, গার্ডেল যোগ করুন

প্রম্পটগুলি ভদ্র পরামর্শ। টুল ভ্যালিডেশন একটি লকড দরজা। OpenAI স্ট্রাকচার্ড আউটপুট

কর:

অ্যালাউলিস্ট (কোন টুলগুলি চালানো যেতে পারে)
ইনপুট যাচাইকরণ
হার সীমা OpenAI হার সীমা নির্দেশিকা
প্রতি ব্যবহারকারী/সংস্থার অনুমতি পরীক্ষা
ঝুঁকিপূর্ণ কর্মকাণ্ডের জন্য "ড্রাই-রান মোড"

আংশিক ব্যর্থতার জন্য নকশা

টুলগুলি ব্যর্থ। নেটওয়ার্কগুলি টলমল করছে। প্রমাণীকরণের মেয়াদ শেষ। একজন এজেন্টকে অবশ্যই:

ভুল ব্যাখ্যা করা
উপযুক্ত হলে ব্যাকঅফ দিয়ে পুনরায় চেষ্টা করুন গুগল ক্লাউড পুনরায় চেষ্টা কৌশল (ব্যাকঅফ + জিটার)
বিকল্প সরঞ্জাম নির্বাচন করুন
আটকে গেলে আরও জোর দিন

একটি শান্তভাবে কার্যকর কৌশল: কাঠামোগত ত্রুটিগুলি ফেরত দিন যেমন:

ধরণ: auth_error
ধরণ: খুঁজে পাওয়া যায়নি
টাইপ: rate_limited
যাতে মডেলটি আতঙ্কিত না হয়ে বুদ্ধিমত্তার সাথে সাড়া দিতে পারে।

৮) স্মৃতি যা আপনাকে তাড়া করার পরিবর্তে সাহায্য করে 👻🗂️

স্মৃতিশক্তি শক্তিশালী, কিন্তু এটি একটি আবর্জনার ড্রয়ারেও পরিণত হতে পারে।.

স্বল্পমেয়াদী স্মৃতি: এটিকে সংকুচিত রাখুন

ব্যবহার:

শেষ N ধাপ
একটি চলমান সারাংশ (প্রতিটি লুপ আপডেট করা হয়েছে)
বর্তমান পরিকল্পনা
বর্তমান সীমাবদ্ধতা (বাজেট, সময়, নীতি)

যদি আপনি সবকিছু প্রসঙ্গে ফেলে দেন, তাহলে আপনি পাবেন:

বেশি খরচ
ধীর লেটেন্সি
আরও বিভ্রান্তি (হ্যাঁ, তবুও)

দীর্ঘমেয়াদী স্মৃতি: "স্টাফিং" এর উপর পুনরুদ্ধার

বেশিরভাগ "দীর্ঘমেয়াদী স্মৃতি" এরকম:

এম্বেডিং
ভেক্টর স্টোর
পুনরুদ্ধার বৃদ্ধি প্রজন্ম (RAG) RAG কাগজ

এজেন্ট মুখস্থ করে না। এটি রানটাইমে সবচেয়ে প্রাসঙ্গিক অংশগুলো পুনরুদ্ধার করে। LlamaIndex “Introduction to RAG”

ব্যবহারিক স্মৃতির নিয়ম

"পছন্দ" কে স্পষ্ট তথ্য হিসেবে সংরক্ষণ করুন: "ব্যবহারকারী বুলেট সারাংশ পছন্দ করেন এবং ইমোজি ঘৃণা করেন" (হা হা, এখানে নয় 😄)
টাইমস্ট্যাম্প বা সংস্করণ সহ "সিদ্ধান্ত" সংরক্ষণ করুন (অন্যথায় দ্বন্দ্ব জমে যাবে)
সত্যিই প্রয়োজন না হলে কখনোই গোপনীয়তা সংরক্ষণ করো না

আর এখানে আমার অসম্পূর্ণ রূপক: স্মৃতি হলো একটা রেফ্রিজারেটরের মতো। যদি তুমি কখনো এটি পরিষ্কার না করো, তাহলে অবশেষে তোমার স্যান্ডউইচের স্বাদ পেঁয়াজের মতো এবং আফসোসের মতো হয়ে যাবে।.

৯) পরিকল্পনার ধরণ (সহজ থেকে অভিনব) 🧭✨

পরিকল্পনা হলো নিয়ন্ত্রিত পচন। এটাকে রহস্যময় করে তুলবেন না।.

প্যাটার্ন A: চেকলিস্ট প্ল্যানার ✅

মডেল ধাপগুলির একটি তালিকা প্রদর্শন করে
ধাপে ধাপে কার্যকর করা হয়
চেকলিস্টের স্থিতি আপডেট করে

অনবোর্ডিংয়ের জন্য দুর্দান্ত। সহজ, পরীক্ষাযোগ্য।.

প্যাটার্ন বি: রিঅ্যাক্ট লুপ (কারণ + অ্যাক্ট) 🧠→🧰

মডেল পরবর্তী টুল কলের সিদ্ধান্ত নেয়
আউটপুট পর্যবেক্ষণ করে
রিঅ্যাক্ট পেপার পুনরাবৃত্তি করে

এটিই ক্লাসিক এজেন্ট অনুভূতি।.

প্যাটার্ন সি: সুপারভাইজার-কর্মী 👥

সুপারভাইজার লক্ষ্যকে কাজে ভাগ করেন
কর্মীরা বিশেষায়িত কাজ সম্পাদন করেন
সুপারভাইজার ফলাফল একত্রিত করে মাইক্রোসফ্ট অটোজেন (মাল্টি-এজেন্ট ফ্রেমওয়ার্ক)

যখন কাজগুলি সমান্তরাল করা যায়, অথবা যখন আপনি বিভিন্ন "ভূমিকা" চান যেমন:

গবেষক
কোডার
সম্পাদক
QA পরীক্ষক

প্যাটার্ন ডি: পুনঃপরিকল্পনা সহ পরিকল্পনা করুন-তারপর-কার্যকর করুন 🔄

পরিকল্পনা তৈরি করুন
সম্পাদন করা
যদি টুলের ফলাফল বাস্তবতা পরিবর্তন করে, তাহলে পুনরায় পরিকল্পনা করুন

এটি এজেন্টকে একগুঁয়েভাবে খারাপ পরিকল্পনা অনুসরণ করতে বাধা দেয়। মানুষও এটি করে, যদি না তারা ক্লান্ত হয়, তবে সেক্ষেত্রে তারাও খারাপ পরিকল্পনা অনুসরণ করে।.

১০) নিরাপত্তা, নির্ভরযোগ্যতা, এবং চাকরিচ্যুত না হওয়া 🔐😅

আপনার এজেন্ট যদি কোনো পদক্ষেপ নিতে পারে, তাহলে আপনার নিরাপত্তা নকশা প্রয়োজন। এটা ঐচ্ছিক নয়। অপরিহার্য। NIST AI RMF 1.0

কঠিন সীমা

প্রতি দৌড়ে সর্বোচ্চ পদক্ষেপ
প্রতি মিনিটে সর্বোচ্চ টুল কল
প্রতি সেশনে সর্বোচ্চ ব্যয় (টোকেন বাজেট)
অনুমোদনের পিছনে সীমাবদ্ধ সরঞ্জাম

ডেটা হ্যান্ডলিং

লগিং করার আগে সংবেদনশীল ইনপুটগুলি সম্পাদনা করুন
পৃথক পরিবেশ (ডেভেলপার বনাম উৎপাদন)
ন্যূনতম-সুবিধাপ্রাপ্ত সরঞ্জামের অনুমতি

আচরণগত সীমাবদ্ধতা

এজেন্টকে অভ্যন্তরীণ প্রমাণের টুকরো উদ্ধৃত করতে বাধ্য করুন (বাহ্যিক লিঙ্ক নয়, কেবল অভ্যন্তরীণ রেফারেন্স)
আত্মবিশ্বাস কম থাকলে অনিশ্চয়তার পতাকা প্রয়োজন
যদি ইনপুটগুলি অস্পষ্ট হয় তবে "স্পষ্টকারী প্রশ্ন জিজ্ঞাসা করুন" প্রয়োজন

একজন নির্ভরযোগ্য এজেন্ট সবচেয়ে আত্মবিশ্বাসী নয়। সে জানে কখন সে অনুমান করছে... এবং তাই বলে।.

১১) পরীক্ষা এবং মূল্যায়ন (যে অংশটি সবাই এড়িয়ে চলে) 🧪📏

তুমি যা পরিমাপ করতে পারো না, তা উন্নত করতে পারো না। হ্যাঁ, এই লাইনটা তেতো, কিন্তু এটা বিরক্তিকরভাবে সত্য।.

একটি দৃশ্যকল্প সেট তৈরি করুন

৩০-১০০টি টেস্ট কেস তৈরি করুন:

সুখী পথ
প্রান্ত কেস
"টুল ব্যর্থ" ক্ষেত্রে
অস্পষ্ট অনুরোধ
প্রতিকূল প্রম্পট (প্রম্পট ইনজেকশনের প্রচেষ্টা) LLM অ্যাপের জন্য OWASP শীর্ষ ১০ OWASP LLM01 প্রম্পট ইনজেকশন

স্কোরের ফলাফল

এর মতো মেট্রিক্স ব্যবহার করুন:

কাজের সাফল্যের হার
সমাপ্তির সময়
সরঞ্জাম ত্রুটি পুনরুদ্ধারের হার
হ্যালুসিনেশনের হার (প্রমাণ ছাড়া দাবি)
মানুষের অনুমোদনের হার (যদি তত্ত্বাবধানে থাকে)

প্রম্পট এবং সরঞ্জামগুলির জন্য রিগ্রেশন পরীক্ষা

আপনি যখনই পরিবর্তন করবেন:

টুল স্কিমা
সিস্টেম নির্দেশাবলী
পুনরুদ্ধার যুক্তি
মেমরি ফর্ম্যাট
স্যুটটি আবার চালান।

এজেন্টরা সংবেদনশীল প্রাণী। ঘরের গাছের মতো, কিন্তু বেশি দামি।.

১২) এমন স্থাপনার ধরণ যা আপনার বাজেট গলে না 💸🔥

একটি মাত্র পরিষেবা দিয়ে শুরু করুন

এজেন্ট কন্ট্রোলার API
এর পিছনে সরঞ্জাম পরিষেবা
লগিং + পর্যবেক্ষণ ওপেনটেলিমেট্রি পর্যবেক্ষণযোগ্যতা প্রাইমার

খরচ নিয়ন্ত্রণ তাড়াতাড়ি যোগ করুন

ক্যাশিং পুনরুদ্ধার ফলাফল
সারাংশ ব্যবহার করে কথোপকথনের অবস্থা সংকুচিত করা
রাউটিং এবং নিষ্কাশনের জন্য ছোট মডেল ব্যবহার করা
"গভীর চিন্তাভাবনা" কে কঠিনতম ধাপের মধ্যে সীমাবদ্ধ রাখা

সাধারণ স্থাপত্য পছন্দ

স্টেটলেস কন্ট্রোলার + এক্সটার্নাল স্টেট স্টোর (DB/redis)
টুল কলগুলি যেখানে সম্ভব আইডম্পোটেন্ট হয় স্ট্রাইপ "আইডম্পোটেন্ট অনুরোধ"
দীর্ঘ কাজের জন্য সারিবদ্ধ থাকা (যাতে আপনার কোনও ওয়েব অনুরোধ চিরতরে খোলা না থাকে)

এছাড়াও: একটি "কিল সুইচ" তৈরি করুন। আপনার এটির প্রয়োজন হবে না যতক্ষণ না আপনার এটি সত্যিই প্রয়োজন 😬

১৩) সমাপনী নোট - কীভাবে একজন এআই এজেন্ট তৈরি করবেন তার সংক্ষিপ্ত সংস্করণ 🎁🤖

যদি তোমার আর কিছু মনে না থাকে, তাহলে এটা মনে রেখো:

কীভাবে একটি এআই এজেন্ট তৈরি করবেন, তার মূল বিষয় হলো একটি মডেলকে ঘিরে একটি নিরাপদ লুপ তৈরি করা। ল্যাংচেইন “এজেন্টস” ডক্স।
একটি স্পষ্ট লক্ষ্য, কম স্বায়ত্তশাসন এবং কঠোর সরঞ্জাম দিয়ে শুরু করুন। OpenAI স্ট্রাকচার্ড আউটপুট
অবিরাম প্রসঙ্গ স্টাফিং নয়, পুনরুদ্ধারের মাধ্যমে মেমরি যোগ করুন। RAG পেপার
পরিকল্পনা করা সহজ হতে পারে - চেকলিস্ট এবং পুনর্পরিকল্পনা অনেক দূর এগিয়ে যায়।.
লগিং এবং পরীক্ষাগুলি এজেন্ট বিশৃঙ্খলাকে এমন কিছুতে পরিণত করে যা আপনি পাঠাতে পারেন। ওপেনটেলিমেট্রি পর্যবেক্ষণযোগ্যতা প্রাইমার
গার্ডেলগুলি কেবল প্রম্পটে নয়, কোডে অন্তর্ভুক্ত। LLM অ্যাপের জন্য OWASP শীর্ষ ১০

একজন এজেন্ট জাদু নয়। এটি এমন একটি ব্যবস্থা যা প্রায়শই মূল্যবান হওয়ার জন্য যথেষ্ট ভালো সিদ্ধান্ত নেয়... এবং ক্ষতি করার আগেই পরাজয় স্বীকার করে। শান্তভাবে সান্ত্বনাদায়ক, একরকম 😌

আর হ্যাঁ, যদি তুমি এটা ঠিকভাবে তৈরি করো, তাহলে এটা এমন একটা ছোট্ট ডিজিটাল ইন্টার্ন নিয়োগের মতো মনে হবে যে কখনো ঘুমায় না, মাঝে মাঝে আতঙ্কিত হয় এবং কাগজপত্র ভালোবাসে। তাহলে, মূলত একজন ইন্টার্ন।.

বাস্তব উদাহরণ: একটি সাপোর্ট ট্রায়েজ এআই এজেন্ট তৈরি করা 🎫🤖

দৃশ্যকল্প

ধরুন, একটি ছোট SaaS টিম সপ্তাহে ১২০-১৮০টি সাপোর্ট টিকেট পায়। বেশিরভাগ টিকেটই জটিল নয়, কিন্তু তবুও এগুলোতে সময় লাগে: যেমন—পাসওয়ার্ড রিসেট, বিলিং সংক্রান্ত প্রশ্ন, বাগ রিপোর্ট, ফিচার রিকোয়েস্ট, এবং “এটি কি প্রত্যাশিত আচরণ?”-এর মতো মেসেজ।.

একটি সাধারণ চ্যাটবট উত্তরের খসড়া তৈরি করতে পারে, কিন্তু এটি নির্ভরযোগ্যভাবে অ্যাকাউন্টের অবস্থা পরীক্ষা করতে, নলেজ বেস অনুসন্ধান করতে, জরুরি অবস্থা শ্রেণীবদ্ধ করতে, বা কখন একজন মানুষের হস্তক্ষেপ প্রয়োজন তা নির্ধারণ করতে পারে না। এখানেই একজন এজেন্টের প্রয়োজনীয়তা বোঝা যায়।.

এর লক্ষ্য সাপোর্টকে পুরোপুরি প্রতিস্থাপন করা নয়। এর লক্ষ্য হলো এমন একটি স্বল্প-স্বায়ত্তশাসনসম্পন্ন এজেন্ট তৈরি করা, যা একটি নতুন টিকেট পড়বে, প্রাসঙ্গিক তথ্য সংগ্রহ করবে, একটি উত্তরের খসড়া তৈরি করবে এবং টিকেটটিকে সঠিক কিউতে পাঠিয়ে দেবে। গ্রাহক-সম্পর্কিত যেকোনো কিছু একজন মানুষই অনুমোদন করবে।.

সহকারীর যা প্রয়োজন

নিরাপদে কাজ করার জন্য এজেন্টের একটি সীমিত ও নিয়ন্ত্রিত উপকরণ ও সরঞ্জাম প্রয়োজন:

আগত টিকিটের পাঠ্য
গ্রাহকের প্ল্যানের ধরণ, অ্যাকাউন্টের মেয়াদ এবং সাম্প্রতিক বিলিং স্ট্যাটাস
সাম্প্রতিক পণ্যের পরিবর্তন লগ বা পরিচিত ঘটনা
অভ্যন্তরীণ সহায়তা কেন্দ্রের নিবন্ধগুলি
সীমিত ক্ষেত্র সহ একটি টিকিট আপডেট টুল
এটি একটি খসড়া উত্তর দেওয়ার টুল, ইমেল পাঠানোর টুল নয়।
একটি সুস্পষ্ট উত্তেজনা নীতি

সরঞ্জামের তালিকাটি ইচ্ছাকৃতভাবে সংক্ষিপ্ত রাখা উচিত:

অনুসন্ধান_সহায়তা_কেন্দ্র(কোয়েরি)
get_customer_status(customer_id)
পরিচিত ঘটনাগুলি পরীক্ষা করুন (পণ্য এলাকা)
update_ticket_category(ticket_id, category, priority)
draft_reply(ticket_id, reply_text)
escalate_to_human(ticket_id, reason)

লক্ষ্য করুন কী নেই: এখানে “গ্রাহককে টাকা ফেরত”, “অ্যাকাউন্ট বন্ধ” বা “চূড়ান্ত উত্তর পাঠানো”-র মতো কোনো টুল নেই। প্রথম সংস্করণের জন্য এই কাজগুলো করা খুবই ঝুঁকিপূর্ণ।.

উদাহরণ নির্দেশাবলী

আপনি একটি SaaS পণ্যের সাপোর্ট ট্রায়েজ এজেন্ট।.

আপনার কাজ হলো আগত টিকেটগুলোকে শ্রেণিবদ্ধ করা, শুধু প্রয়োজনীয় তথ্য সংগ্রহ করা, একটি প্রস্তাবিত উত্তরের খসড়া তৈরি করা এবং টিকেটটি ঊর্ধ্বতন কর্তৃপক্ষের কাছে পাঠানো হবে কিনা সে বিষয়ে সিদ্ধান্ত নেওয়া।.

নিয়মাবলী:

গ্রাহকদের কাছে সরাসরি উত্তর পাঠাবেন না।.

পণ্য সম্পর্কিত প্রশ্নের উত্তর দেওয়ার আগে সহায়তা কেন্দ্র ব্যবহার করুন।.

বিলিং, প্ল্যান বা অ্যাক্সেস সংক্রান্ত প্রশ্নের উত্তর দেওয়ার আগে গ্রাহকের স্ট্যাটাস যাচাই করুন।.

যদি গ্রাহক আইনি হুমকি, তথ্য হারানো, নিরাপত্তাজনিত সমস্যা, অর্থপ্রদানে ব্যর্থতা, অ্যাকাউন্ট বাতিল বা রাগান্বিত ভাষার কথা উল্লেখ করেন, তবে বিষয়টি কোনো মানুষের কাছে হস্তান্তর করুন।.

যদি প্রাপ্ত হেল্প সেন্টার কন্টেন্ট বা অ্যাকাউন্ট ডেটা দ্বারা উত্তরটি সমর্থিত না হয়, তাহলে কী অনুপস্থিত তা বলুন এবং বিষয়টি ঊর্ধ্বতন কর্তৃপক্ষের কাছে জানান।.

সর্বোচ্চ ৬টি টুল কল করার পর থেমে যান।.

একটি টিকেট তখনই “সম্পন্ন” বলে গণ্য হয়, যখন সেটির একটি ক্যাটাগরি, প্রায়োরিটি, এভিডেন্স সামারি, ড্রাফট রিপ্লাই এবং “হিউম্যান অ্যাপ্রুভাল নিডেড” অথবা “এসকালেটেড” থাকে।.

কীভাবে এটি পরীক্ষা করবেন

লাইভ ব্যবহারকারীদের সাথে সংযোগ করার আগে ৩০টি টেস্ট টিকিট দিয়ে শুরু করুন:

১০টি সাধারণ টিকেট, যেমন পাসওয়ার্ড রিসেট, প্ল্যানের সীমা এবং সাধারণ ‘আমি কীভাবে করব?’ ধরনের প্রশ্ন।
৫টি বিলিং টিকিট
৫টি বাগ রিপোর্ট
অসম্পূর্ণ তথ্যসহ ৫টি অস্পষ্ট টিকিট
৫টি ঝুঁকিপূর্ণ টিকিট, যেমন নিরাপত্তা সংক্রান্ত উদ্বেগ, অর্থ ফেরতের দাবি এবং ক্ষুব্ধ অভিযোগ।

প্রতিটি টিকিটের জন্য স্কোর:

এটি কি সঠিক বিভাগটি বেছে নিয়েছে?
উত্তর দেওয়ার আগে এটি কি সঠিক সরঞ্জাম ব্যবহার করেছিল?
এটি কি ভিত্তিহীন দাবিগুলো এড়িয়ে গিয়েছিল?
এটি কি ঝুঁকিপূর্ণ টিকিটগুলোকে আরও গুরুতর করে তুলেছিল?
খসড়াটিতে কি ব্যাপক সম্পাদনার প্রয়োজন ছিল?

শুরুতে একটি সাধারণ পাস/ফেল স্প্রেডশিটই যথেষ্ট। এজেন্টটি কাজের মান নিশ্চিত করছে কিনা, তা জানার আগে মূল্যায়ন ব্যবস্থাটিকে অতিরিক্ত জটিল করবেন না।.

ফলাফল

দৃষ্টান্তমূলক ফলাফল: এই ওয়ার্কফ্লোটি ব্যবহার করার আগে ও পরে ৩০টি নমুনা টিকিটের সময় পরিমাপের ভিত্তিতে, একজন সাপোর্ট লিড নিম্নলিখিত বিষয়গুলো পরিমাপ করতে পারেন:

প্রতি টিকেটে গড় প্রাথমিক বাছাইয়ের সময় ৬ মিনিট থেকে কমে ৯০ সেকেন্ডে দাঁড়িয়েছে।
৩ ঘণ্টার পরিবর্তে ৪৫ মিনিটে ৩০টি টিকেট বাছাই করা হয়েছে।
৩০টি টিকিটের মধ্যে ২৭টি সঠিক বিভাগে রাখা হয়েছে।
৫টির মধ্যে ৫টি ঝুঁকিপূর্ণ টিকিট সঠিকভাবে উচ্চতর কর্তৃপক্ষের কাছে পাঠানো হয়েছে।
মানুষের অনুমোদন ছাড়া ০টি গ্রাহক উত্তর পাঠানো হয়েছে।

এই সংখ্যাগুলো একটি আনুমানিক উদাহরণ, কোনো প্রমাণিত মানদণ্ড নয়। এই পরিমাপটি সহজেই পুনরাবৃত্তি করা যায়: একই ব্যাচের টেস্ট টিকেটগুলোর সময় ম্যানুয়ালি পরিমাপ করুন, তারপর সেগুলোকে এজেন্টের মাধ্যমে চালান এবং ক্যাটাগরির নির্ভুলতা, এস্কেলেশনের নির্ভুলতা ও সম্পাদনার সময় তুলনা করুন।.

কী ভুল হতে পারে

এজেন্টটি তখনও খুব সাধারণ উপায়ে ব্যর্থ হতে পারে।.

এটি হয়তো একজন হতাশ কিন্তু সরল গ্রাহককে “জরুরি” হিসেবে চিহ্নিত করতে পারে, কারণ তার ভাষাটা রাগান্বিত শোনায়। এটি হয়তো একটি পুরোনো হেল্প আর্টিকেল থেকে আত্মবিশ্বাসী উত্তরের খসড়া তৈরি করতে পারে। যখন বিষয়টি ঊর্ধ্বতন কর্তৃপক্ষের কাছে পাঠানোই সঠিক পদক্ষেপ, তখন এটি হয়তো কেবল অনুসন্ধানই করতে থাকে। এটি হয়তো উত্তরের খসড়ায় অ্যাকাউন্টের অতিরিক্ত বিবরণ প্রকাশ করে ফেলতে পারে।.

সমাধানটা “আরও ভালো প্রম্পট লিখে” আশা করা নয়। কঠোর সীমা নির্ধারণ করুন:

বিলিং, নিরাপত্তা, আইনি বা বাতিলকরণ সংক্রান্ত ভাষা দেখা গেলে বিষয়টি ঊর্ধ্বতন কর্তৃপক্ষের কাছে জানান।
প্রমাণ সারাংশে অভ্যন্তরীণ সহায়ক নিবন্ধ থেকে উদ্ধৃতি আবশ্যক।
“উত্তর পাঠান” বিকল্পটি মানুষের অনুমোদনের অধীনে রাখুন।
প্রতিটি টুল কল এবং চূড়ান্ত খসড়া লগ করুন
প্রতিটি প্রম্পট, টুল বা পলিসি পরিবর্তনের পর ৩০-টিকিটের টেস্ট স্যুটটি পুনরায় চালান।

ব্যবহারিক শিক্ষা

একজন কার্যকর এজেন্টের ব্যাপক স্বায়ত্তশাসনের প্রয়োজন হয় না। এই উদাহরণে, এর কার্যকারিতা একটি নিয়ন্ত্রিত চক্র থেকে আসে: টিকেটটি পড়া, সঠিক প্রেক্ষাপট সংগ্রহ করা, সেটিকে শ্রেণিবদ্ধ করা, একটি উত্তরের খসড়া তৈরি করা এবং পর্যালোচনার জন্য থেমে যাওয়া। এমন একটি এজেন্টের চেয়ে একে বিশ্বাস করা, পরীক্ষা করা এবং উন্নত করা অনেক বেশি সহজ, যে এজেন্ট একটি বিশাল প্রম্পটের মাধ্যমে ‘সাপোর্ট সামলানোর’ চেষ্টা করে।.

প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

সহজ ভাষায়, একজন এআই এজেন্ট কী?

একটি এআই এজেন্ট মূলত একটি লুপ যা পুনরাবৃত্তি করে: ইনপুট নেওয়া, পরবর্তী পদক্ষেপ নির্ধারণ করা, একটি টুল ব্যবহার করা, ফলাফল পড়া এবং এটি সম্পন্ন না হওয়া পর্যন্ত পুনরাবৃত্তি করা। "এজেন্টিক" অংশটি কেবল চ্যাট করা নয়, অভিনয় এবং পর্যবেক্ষণ থেকে আসে। অনেক এজেন্ট কেবল টুল অ্যাক্সেস সহ স্মার্ট অটোমেশন, অন্যরা আরও বেশি করে একজন জুনিয়র অপারেটরের মতো আচরণ করে যা ত্রুটি থেকে পুনরুদ্ধার করতে পারে।.

শুধু প্রম্পট ব্যবহার না করে কখন আমার একটি AI এজেন্ট তৈরি করা উচিত?

যখন কাজটি বহু-পদক্ষেপের হয়, মধ্যবর্তী ফলাফলের উপর ভিত্তি করে পরিবর্তিত হয় এবং নির্ভরযোগ্য সরঞ্জাম ব্যবহারের প্রয়োজন হয় (API, ডাটাবেস, টিকিটিং, কোড সম্পাদন)। এজেন্টগুলি তখনও কার্যকর যখন আপনি গার্ডেল এবং "সম্পন্ন" চেক করার উপায় সহ পুনরাবৃত্তিযোগ্য ফলাফল চান। যদি একটি সহজ প্রম্পট-প্রতিক্রিয়া কাজ করে, তাহলে একজন এজেন্ট সাধারণত অপ্রয়োজনীয় ওভারহেড এবং অতিরিক্ত ব্যর্থতা মোড ব্যবহার করে।.

আমি কীভাবে এমন একটি এআই এজেন্ট তৈরি করব যা লুপে আটকে থাকবে না?

হার্ড স্টপ কন্ডিশন ব্যবহার করুন: সর্বোচ্চ ধাপ, সর্বোচ্চ টুল কল এবং পরিষ্কার সমাপ্তি পরীক্ষা। স্ট্রাকচার্ড টুল স্কিমা, টাইমআউট এবং রিট্রাই যোগ করুন যা চিরতরে পুনরায় চেষ্টা করবে না। সিদ্ধান্ত এবং টুল আউটপুট লগ করুন যাতে আপনি দেখতে পারেন এটি কোথায় লাইনচ্যুত হয়। একটি সাধারণ সুরক্ষা ভালভ হল এসকেলেশন: যদি এজেন্ট অনিশ্চিত থাকে বা ত্রুটি পুনরাবৃত্তি করে, তাহলে এটির উন্নতির পরিবর্তে সাহায্য চাওয়া উচিত।.

একজন এআই এজেন্ট কীভাবে তৈরি করবেন তার ন্যূনতম স্থাপত্য কত?

কমপক্ষে আপনার এমন একটি কন্ট্রোলার লুপ প্রয়োজন যা মডেলটিকে লক্ষ্য এবং প্রেক্ষাপট প্রদান করে, পরবর্তী পদক্ষেপের জন্য জিজ্ঞাসা করে, অনুরোধ করা হলে একটি টুল কার্যকর করে, পর্যবেক্ষণ সংযোজন করে এবং পুনরাবৃত্তি করে। আপনার কঠোর ইনপুট/আউটপুট আকার এবং "সম্পন্ন" চেক সহ টুলও প্রয়োজন। এমনকি একটি রোল-ইওর-ওন লুপও ভালোভাবে কাজ করতে পারে যদি আপনি স্টেট পরিষ্কার রাখেন এবং ধাপের সীমা প্রয়োগ করেন।.

আমি কীভাবে টুল কলিং ডিজাইন করব যাতে এটি উৎপাদনে নির্ভরযোগ্য হয়?

টুলগুলিকে সংকীর্ণ, টাইপ করা, অনুমতিপ্রাপ্ত এবং যাচাইকৃত রাখুন—একটি জেনেরিক "do_anything" টুল এড়িয়ে চলুন। কঠোর স্কিমা (যেমন স্ট্রাকচার্ড আউটপুট/ফাংশন কলিং) পছন্দ করুন যাতে এজেন্ট ইনপুটগুলিকে হাত দিয়ে নাড়াতে না পারে। টুল লেয়ারে অ্যালোলিস্ট, রেট লিমিট এবং ব্যবহারকারী/সংস্থার অনুমতি চেক যোগ করুন। আইডেম্পোটেন্সি প্যাটার্ন ব্যবহার করে, সম্ভব হলে পুনরায় চালানোর জন্য নিরাপদ টুল ডিজাইন করুন।.

এজেন্টকে আরও খারাপ না করে মেমরি যোগ করার সর্বোত্তম উপায় কী?

মেমোরিকে দুটি অংশে ভাগ করুন: স্বল্পমেয়াদী রান অবস্থা (সাম্প্রতিক পদক্ষেপ, বর্তমান পরিকল্পনা, সীমাবদ্ধতা) এবং দীর্ঘমেয়াদী পুনরুদ্ধার (পছন্দ, স্থিতিশীল নিয়ম, প্রাসঙ্গিক ডক্স)। সম্পূর্ণ ট্রান্সক্রিপ্ট নয়, চলমান সারাংশ দিয়ে স্বল্পমেয়াদী কম্প্যাক্ট রাখুন। দীর্ঘমেয়াদী মেমোরির জন্য, পুনরুদ্ধার (এম্বেডিং + ভেক্টর স্টোর/RAG প্যাটার্ন) সাধারণত সবকিছুকে প্রসঙ্গে "স্টাফ" করার এবং মডেলটিকে বিভ্রান্ত করার চেয়েও বেশি কার্যকর।.

আমার কোন পরিকল্পনা প্যাটার্ন ব্যবহার করা উচিত: চেকলিস্ট, রিঅ্যাক্ট, নাকি সুপারভাইজার-ওয়ার্কার?

যখন কাজগুলি অনুমানযোগ্য হয় এবং আপনি সহজে পরীক্ষা করার মতো কিছু চান তখন একটি চেকলিস্ট প্ল্যানার দুর্দান্ত। যখন টুলের ফলাফল আপনার পরবর্তী কাজ পরিবর্তন করে তখন ReAct-স্টাইলের লুপগুলি উজ্জ্বল হয়। সুপারভাইজার-ওয়ার্কার প্যাটার্ন (যেমন AutoGen-স্টাইলের ভূমিকা পৃথকীকরণ) সাহায্য করে যখন কাজগুলি সমান্তরাল করা যায় বা স্বতন্ত্র ভূমিকা (গবেষক, কোডার, QA) থেকে উপকৃত হতে পারে। একগুঁয়ে খারাপ পরিকল্পনা এড়াতে পরিকল্পনা-তারপর-সম্পাদনা করা একটি ব্যবহারিক মধ্যম ক্ষেত্র।.

যদি কোনও এজেন্ট বাস্তব পদক্ষেপ নিতে পারে, তাহলে আমি কীভাবে তাকে নিরাপদ করব?

অনুমোদন বা "ড্রাই-রান" মোডের পিছনে ঝুঁকিপূর্ণ সরঞ্জামগুলিকে সীমাবদ্ধ করুন এবং সর্বনিম্ন-সুবিধাপ্রাপ্ত অনুমতিগুলি ব্যবহার করুন। বাজেট এবং ক্যাপ যোগ করুন: সর্বাধিক পদক্ষেপ, সর্বোচ্চ ব্যয় এবং প্রতি-মিনিট টুল কল সীমা। লগিংয়ের আগে সংবেদনশীল ডেটা সংশোধন করুন এবং উৎপাদন পরিবেশ থেকে ডেভেলপারদের আলাদা করুন। যখন ইনপুটগুলি অস্পষ্ট হয় তখন অনিশ্চয়তার পতাকা বা স্পষ্টীকরণ প্রশ্ন প্রয়োজন, প্রমাণের পরিবর্তে আত্মবিশ্বাসকে প্রতিস্থাপন করতে দিন।.

সময়ের সাথে সাথে উন্নত করার জন্য আমি কীভাবে একজন AI এজেন্টকে পরীক্ষা এবং মূল্যায়ন করব?

হ্যাপি পাথ, এজ কেস, টুল ফেইলিওর, অ্যাম্বিসিভ রিকোয়েস্ট এবং প্রম্পট-ইনজেকশন অ্যাটেম্পট (OWASP-স্টাইল) সহ একটি সিনারিও স্যুট তৈরি করুন। টাস্ক সাকসেস, টাইম-টু-কমপ্লিশন, টুল এরর থেকে রিকভারি এবং প্রমাণ ছাড়াই দাবির মতো স্কোর ফলাফল। যেকোনো সময় আপনি টুল স্কিমা, প্রম্পট, রিট্রিভাল বা মেমরি ফর্ম্যাটিং পরিবর্তন করেন, স্যুটটি পুনরায় চালান। যদি আপনি এটি পরীক্ষা করতে না পারেন, তাহলে আপনি এটি নির্ভরযোগ্যভাবে পাঠাতে পারবেন না।.

বিলম্ব এবং খরচ না বাড়িয়ে আমি কীভাবে একজন এজেন্ট মোতায়েন করব?

একটি সাধারণ প্যাটার্ন হল একটি স্টেটলেস কন্ট্রোলার যার একটি এক্সটার্নাল স্টেট স্টোর (DB/Redis), এর পিছনে টুল সার্ভিস এবং শক্তিশালী লগিং/মনিটরিং (প্রায়শই OpenTelemetry) থাকে। পুনরুদ্ধার ক্যাশিং, কম্প্যাক্ট স্টেট সারাংশ, রাউটিং/এক্সট্রাকশনের জন্য ছোট মডেল এবং "গভীর চিন্তাভাবনা" কে কঠিনতম ধাপগুলিতে সীমাবদ্ধ করে খরচ নিয়ন্ত্রণ করুন। দীর্ঘ কাজের জন্য সারি ব্যবহার করুন যাতে আপনার ওয়েব অনুরোধগুলি খোলা না থাকে। সর্বদা একটি কিল সুইচ অন্তর্ভুক্ত করুন।.

তথ্যসূত্র

ন্যাশনাল ইনস্টিটিউট অফ স্ট্যান্ডার্ডস অ্যান্ড টেকনোলজি (NIST) - NIST AI RMF 1.0 (বিশ্বাসযোগ্যতা ও স্বচ্ছতা) - nvlpubs.nist.gov
ওপেনএআই - স্ট্রাকচার্ড আউটপুট - platform.openai.com
ওপেনএআই - ফাংশন কলিং গাইড - platform.openai.com
ওপেনএআই - হার সীমা নির্দেশিকা - platform.openai.com
OpenAI - চালায় API - platform.openai.com
ওপেনএআই - সহকারী ফাংশন কলিং - platform.openai.com
ল্যাংচেইন - এজেন্ট ডক্স (জাভাস্ক্রিপ্ট) - docs.langchain.com
ল্যাংচেইন - টুলস ডক্স (পাইথন) - docs.langchain.com
ল্যাংচেইন - মেমোরি ওভারভিউ - docs.langchain.com
arXiv - রিঅ্যাক্ট পেপার (কারণ + আইন) - arxiv.org
arXiv - RAG পেপার - arxiv.org
অ্যামাজন ওয়েব সার্ভিসেস (AWS) বিল্ডার্স লাইব্রেরি - জিটারের সাথে টাইমআউট, রিট্রাই এবং ব্যাকঅফ - aws.amazon.com
ওপেনটেলিমেট্রি - পর্যবেক্ষণযোগ্যতা প্রাইমার - opentelemetry.io
স্ট্রাইপ - অদম্য অনুরোধ - docs.stripe.com
গুগল ক্লাউড - পুনরায় চেষ্টা করার কৌশল (ব্যাকঅফ + জিটার) - docs.cloud.google.com
OWASP - বৃহৎ ভাষার মডেল অ্যাপ্লিকেশনের জন্য শীর্ষ ১০ - owasp.org
OWASP - LLM01 প্রম্পট ইনজেকশন - genai.owasp.org
LlamaIndex - RAG এর পরিচিতি - developers.llamaindex.ai
মাইক্রোসফট - সিমান্টিক কার্নেল - learn.microsoft.com
মাইক্রোসফট অটোজেন - মাল্টি-এজেন্ট ফ্রেমওয়ার্ক (ডকুমেন্টেশন) - microsoft.github.io
CrewAI - এজেন্টদের ধারণা - docs.crewai.com
খড়ের গাদা (ডিপসেট) - রিট্রিভার ডকুমেন্টেশন - docs.haystack.deepset.ai

অফিসিয়াল এআই অ্যাসিস্ট্যান্ট স্টোরে সর্বশেষ এআই খুঁজুন

আমাদের সম্পর্কে

ব্লগে ফিরে যান

অতিরিক্ত প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

আমি কীভাবে আমার এআই এজেন্ট প্রকল্পের সাফল্য নিশ্চিত করতে পারি?

আপনার এআই এজেন্ট প্রকল্পের সাফল্য নিশ্চিত করতে, কাজটি এক বাক্যে স্পষ্টভাবে সংজ্ঞায়িত করুন এবং আপনি যে স্বায়ত্তশাসনের স্তরে স্বাচ্ছন্দ্যবোধ করেন তা নির্ধারণ করুন। এছাড়াও, সাধারণ ত্রুটিগুলি এড়াতে এবং আরও ভালোভাবে সমস্যা সমাধানের সুযোগ করে দিতে কঠোর টুল স্কিমা, লগিং এবং যাচাইকরণ কৌশল প্রয়োগ করুন।.
আমার এআই এজেন্টের জন্য টুল ডিজাইন করার সময় আমার কী কী বিষয় বিবেচনা করা উচিত?

আপনার এআই এজেন্টের জন্য টুল ডিজাইন করার সময়, নিশ্চিত করুন যে সেগুলি সুনির্দিষ্ট, টাইপযুক্ত এবং অনুমতি-সাপেক্ষ। এমন সাধারণ টুল পরিহার করুন যা যেকোনো কাজ করতে পারে। এর পরিবর্তে, নিরাপত্তা ও নির্ভরযোগ্যতা বজায় রাখার জন্য নির্দিষ্ট ফাংশন কল তৈরি করুন যা এজেন্ট ব্যবহার করতে পারে।.
আমার এআই এজেন্টের জন্য কীভাবে সুস্পষ্ট স্টপ কন্ডিশন সেট করব?

আপনার এআই এজেন্টের জন্য সুস্পষ্ট থামার শর্ত নির্ধারণ করতে, এটি সর্বোচ্চ কতগুলো ধাপ নিতে পারবে তার একটি সংখ্যা, সেইসাথে টাইমআউট এবং কাজ সম্পন্ন হওয়ার যাচাইকরণ ব্যবস্থা সংজ্ঞায়িত করুন। এটি এজেন্টকে লুপে আটকে যাওয়া থেকে রক্ষা করতে এবং প্রয়োজনে সমস্যাগুলো ঊর্ধ্বতন কর্তৃপক্ষের কাছে জানাতে পারার বিষয়টি নিশ্চিত করতে সাহায্য করবে।.
একটি এআই এজেন্টের মেমরি ব্যবস্থাপনার সর্বোত্তম উপায় কী?

আপনার এআই এজেন্টের মেমরিকে স্বল্পমেয়াদী এবং দীর্ঘমেয়াদী অংশে বিভক্ত করে পরিচালনা করুন। স্বল্পমেয়াদী মেমরিকে সংক্ষিপ্ত রাখুন এবং বর্তমান পদক্ষেপ ও পরিকল্পনার উপর মনোযোগ দিন, অন্যদিকে দীর্ঘমেয়াদী মেমরি ব্যবহারকারীর পছন্দ এবং সাংগঠনিক নিয়মের মতো স্থিতিশীল তথ্যের জন্য ব্যবহার করুন।.
একটি এআই এজেন্টের মধ্যে কার্য পরিকল্পনা করার কোনো নির্দিষ্ট প্যাটার্ন আছে কি?

হ্যাঁ, বিভিন্ন পরিকল্পনা পদ্ধতি ব্যবহার করা যেতে পারে, যেমন—পূর্বাভাসযোগ্য কাজের জন্য চেকলিস্ট, টুলের আউটপুটের সাথে খাপ খাইয়ে নেওয়ার জন্য রিঅ্যাক্ট লুপ, এবং জটিল প্রোজেক্টের জন্য ভূমিকা পৃথকীকরণে সক্ষম সুপারভাইজার-কর্মী মডেল। আপনার এজেন্টের নির্দিষ্ট প্রয়োজন অনুযায়ী একটি পরিকল্পনা পদ্ধতি বেছে নিন।.
আমি কীভাবে আমার এআই এজেন্টের কর্মক্ষমতা কার্যকরভাবে মূল্যায়ন করতে পারি?

আপনার এআই এজেন্টের কর্মক্ষমতা মূল্যায়ন করতে, হ্যাপি পাথ, এজ কেস এবং অস্পষ্ট অনুরোধ সহ একটি সিনারিও স্যুট তৈরি করুন। এর সক্ষমতা ক্রমাগত উন্নত করার জন্য, টাস্ক সফলতার হার, প্রতিক্রিয়ার সময় এবং ত্রুটি থেকে পুনরুদ্ধারের মতো মেট্রিকের উপর ভিত্তি করে ফলাফলগুলোকে স্কোর করুন।.