কিভাবে একজন এআই এজেন্ট তৈরি করবেন

কিভাবে একজন এআই এজেন্ট তৈরি করবেন

সংক্ষিপ্ত উত্তর: বাস্তবে কাজ করে এমন একটি এআই এজেন্ট তৈরি করতে, এটিকে একটি নিয়ন্ত্রিত লুপ হিসাবে বিবেচনা করুন: ইনপুট নিন, পরবর্তী পদক্ষেপ নির্ধারণ করুন, একটি সংকীর্ণ স্কোপযুক্ত টুল কল করুন, ফলাফল পর্যবেক্ষণ করুন এবং একটি স্পষ্ট "সম্পন্ন" চেক পাস না হওয়া পর্যন্ত পুনরাবৃত্তি করুন। কাজটি বহু-পদক্ষেপ এবং টুল-চালিত হলে এটি তার স্থায়িত্ব অর্জন করে; যদি একটি একক প্রম্পট এটি সমাধান করে, এজেন্টটি এড়িয়ে যান। কঠোর টুল স্কিমা, ধাপের সীমা, লগিং এবং একটি যাচাইকারী/সমালোচক যোগ করুন যাতে যখন টুলগুলি ব্যর্থ হয় বা ইনপুটগুলি অস্পষ্ট হয়, তখন এজেন্ট লুপিংয়ের পরিবর্তে আরও বেড়ে যায়।

মূল বিষয়গুলি:

কন্ট্রোলার লুপ : স্পষ্ট স্টপ শর্ত এবং সর্বোচ্চ ধাপ সহ ইনপুট→অ্যাক্ট→পুনরাবৃত্তি পর্যবেক্ষণ করুন।

টুল ডিজাইন : "do_anything" বিশৃঙ্খলা রোধ করতে টুলগুলিকে সংকীর্ণ, টাইপ করা, অনুমোদিত এবং বৈধ রাখুন।

স্মৃতির স্বাস্থ্যবিধি : সংক্ষিপ্ত স্বল্পমেয়াদী অবস্থা এবং দীর্ঘমেয়াদী পুনরুদ্ধার ব্যবহার করুন; সম্পূর্ণ প্রতিলিপি ডাম্প করা এড়িয়ে চলুন।

অপব্যবহার প্রতিরোধ : ঝুঁকিপূর্ণ কর্মকাণ্ডের জন্য অ্যালাউলিস্ট, রেট সীমা, অযোগ্যতা এবং "ড্রাই-রান" যোগ করুন।

পরীক্ষাযোগ্যতা : একটি দৃশ্যকল্প স্যুট (ব্যর্থতা, অস্পষ্টতা, ইনজেকশন) বজায় রাখুন এবং প্রতিটি পরিবর্তন পুনরায় চালান।

কিভাবে একজন এআই এজেন্ট তৈরি করবেন? ইনফোগ্রাফিক
এর পরে আপনি যে প্রবন্ধগুলি পড়তে পছন্দ করতে পারেন:

🔗 এআই কর্মক্ষমতা কীভাবে পরিমাপ করা যায়
গতি, নির্ভুলতা এবং নির্ভরযোগ্যতা নির্ধারণের জন্য ব্যবহারিক মেট্রিক্স শিখুন।.

🔗 এআই-এর সাথে কীভাবে কথা বলবেন
আরও ভালো উত্তর পেতে প্রম্পট, প্রসঙ্গ এবং ফলো-আপ ব্যবহার করুন।.

🔗 এআই মডেলগুলি কীভাবে মূল্যায়ন করবেন
পরীক্ষা, রুব্রিক এবং বাস্তব-বিশ্বের কাজের ফলাফল ব্যবহার করে মডেলগুলির তুলনা করুন।.

🔗 এআই মডেলগুলি কীভাবে অপ্টিমাইজ করা যায়
টিউনিং, ছাঁটাই এবং পর্যবেক্ষণের মাধ্যমে মান এবং খরচ উন্নত করুন।.


১) একজন এআই এজেন্ট কী, সাধারণ মানুষের ভাষায় 🧠

একটি এআই এজেন্ট একটি লুপ। ল্যাংচেইন "এজেন্ট" ডক্স

এই তো। মাঝখানে একটা মস্তিষ্কের লুপ।.

ইনপুট → চিন্তা → কাজ → পর্যবেক্ষণ → পুনরাবৃত্তিরিঅ্যাক্ট পেপার (কারণ + কাজ)

কোথায়:

  • ইনপুট হল একটি ব্যবহারকারীর অনুরোধ বা একটি ইভেন্ট (নতুন ইমেল, সহায়তা টিকিট, সেন্সর পিং)।

  • চিন্তা হলো পরবর্তী ধাপ সম্পর্কে যুক্তি প্রদানের একটি ভাষা মডেল।

  • আইন হল একটি টুল কল করা (অভ্যন্তরীণ ডক্স অনুসন্ধান করুন, কোড চালান, একটি টিকিট তৈরি করুন, একটি উত্তর খসড়া করুন)। OpenAI ফাংশন কলিং গাইড

  • অবজেক্ট টুল আউটপুট পড়ছে।

  • পুনরাবৃত্তি হলো সেই অংশ যা "আড্ডাবাজ" এর পরিবর্তে "এজেন্টিক" মনে করে। ল্যাংচেইন "এজেন্টস" ডক্স

কিছু এজেন্ট মূলত স্মার্ট ম্যাক্রো। অন্যরা একজন জুনিয়র অপারেটরের মতো কাজ করে যারা কাজগুলিকে ঝাঁকুনি দিতে পারে এবং ত্রুটিগুলি থেকে পুনরুদ্ধার করতে পারে। উভয়ই গুরুত্বপূর্ণ।.

আর, তোমার পূর্ণ স্বায়ত্তশাসনের প্রয়োজন নেই। আসলে... তুমি সম্ভবত এটা চাও না 🙃


২) কখন আপনার এজেন্ট তৈরি করা উচিত (এবং কখন করা উচিত নয়) 🚦

এজেন্ট তৈরি করুন যখন:

  • কাজটি বহু-পদক্ষেপ বিশিষ্ট এবং মাঝপথে কী ঘটে তার উপর নির্ভর করে পরিবর্তিত হয়।

  • কাজের জন্য টুল ব্যবহার (ডাটাবেস, সিআরএম, কোড এক্সিকিউশন, ফাইল জেনারেশন, ব্রাউজার, অভ্যন্তরীণ এপিআই)। ল্যাংচেইন "টুল" ডক্স

  • কেবল একবারের উত্তর নয়, বরং রেলিং দিয়ে পুনরাবৃত্তিযোগ্য ফলাফল চাও

  • আপনি "সম্পন্ন" কে এমনভাবে সংজ্ঞায়িত করতে পারেন যেভাবে একটি কম্পিউটার পরীক্ষা করতে পারে, এমনকি আলগাভাবেও।.

নিম্নলিখিত ক্ষেত্রে এজেন্ট তৈরি করবেন না:

  • একটি সহজ প্রম্পট + প্রতিক্রিয়া সমস্যার সমাধান করে (অতিরিক্ত পরিশ্রম করো না, পরে তুমি নিজেকে ঘৃণা করবে)।.

  • আপনার নিখুঁত নিয়তিবাদ প্রয়োজন (এজেন্টগুলি সামঞ্জস্যপূর্ণ হতে পারে, কিন্তু রোবোটিক নয়)।.

  • আপনার কাছে সংযোগ করার জন্য কোনও সরঞ্জাম বা ডেটা নেই - তাহলে এটি বেশিরভাগই কেবল ভাইবস।.

স্পষ্ট করে বলতে পারি: "এআই এজেন্ট প্রজেক্ট"-এর অর্ধেকই কিছু শাখা প্রশাখার নিয়ম মেনে একটি কর্মপ্রবাহ হতে পারে। কিন্তু কখনও কখনও আবেগও গুরুত্বপূর্ণ 🤷♂️


৩) একজন এআই এজেন্টের ভালো সংস্করণ কী তৈরি করে ✅

"কী একটি ভালো সংস্করণ তৈরি করে" বিভাগটি আপনি চেয়েছিলেন, আমি একটু স্পষ্ট করে বলব:

একজন এআই এজেন্টের ভালো সংস্করণ নয় যে সবচেয়ে কঠিন চিন্তা করে। এটি সেই যে:

যদি আপনার এজেন্ট পরীক্ষা করা না যায়, তাহলে এটি মূলত একটি খুব আত্মবিশ্বাসী স্লট মেশিন। পার্টিতে মজা, প্রোডাকশনে ভয়াবহ 😬


৪) একটি এজেন্টের মূল গঠন উপাদান ("শারীরস্থান" 🧩)

বেশিরভাগ কঠিন এজেন্টের এই অংশগুলি থাকে:

ক) কন্ট্রোলার লুপ 🔁

এই হলেন অর্কেস্ট্রেটর:

  • লক্ষ্য নির্ধারণ করা

  • পরবর্তী পদক্ষেপের জন্য মডেলকে জিজ্ঞাসা করুন

  • রান টুল

  • পর্যবেক্ষণ যোগ করুন

  • শেষ না হওয়া পর্যন্ত পুনরাবৃত্তি করুন LangChain “এজেন্ট” ডক্স

খ) সরঞ্জাম (ওরফে ক্ষমতা) 🧰

সরঞ্জামগুলিই একজন এজেন্টকে কার্যকর করে তোলে: ল্যাংচেইন "সরঞ্জাম" ডক্স

  • ডাটাবেস কোয়েরি

  • ইমেল পাঠানো

  • ফাইল টানা

  • চলমান কোড

  • অভ্যন্তরীণ API গুলিকে কল করা হচ্ছে

  • স্প্রেডশিট বা সিআরএম-এ লেখা

গ) স্মৃতি 🗃️

দুই ধরণের বিষয়:

  • স্বল্পমেয়াদী স্মৃতি : বর্তমান চলমান প্রেক্ষাপট, সাম্প্রতিক পদক্ষেপ, বর্তমান পরিকল্পনা

  • দীর্ঘমেয়াদী স্মৃতি : ব্যবহারকারীর পছন্দ, প্রকল্পের প্রেক্ষাপট, সংগৃহীত জ্ঞান (প্রায়শই এম্বেডিং + একটি ভেক্টর স্টোরের মাধ্যমে) RAG পেপার

ঘ) পরিকল্পনা ও সিদ্ধান্ত নীতি 🧭

এমনকি যদি আপনি এটিকে "পরিকল্পনা" নাও বলেন, আপনার একটি পদ্ধতির প্রয়োজন:

ঙ) রেলিং এবং মূল্যায়ন 🧯

হ্যাঁ, এটা প্ররোচনার চেয়ে বেশি প্রকৌশলগত। যা... কিছুটা মূল কথা।.


৫) তুলনা সারণী: এজেন্ট তৈরির জনপ্রিয় উপায় 🧾

নিচে একটি বাস্তবসম্মত "তুলনা সারণী" দেওয়া হল - কিছু অদ্ভুত বৈশিষ্ট্য সহ, কারণ আসল দলগুলি অদ্ভুত 😄

টুল / ফ্রেমওয়ার্ক পাঠকবর্গ দাম কেন এটি কাজ করে নোট (ছোট বিশৃঙ্খলা)
ল্যাংচেইন লেগো-স্টাইলের উপাদান পছন্দ করেন এমন নির্মাতারা ফ্রি-ইশ + ইনফ্রা সরঞ্জাম, স্মৃতি, শৃঙ্খলের জন্য বৃহৎ বাস্তুতন্ত্র স্পষ্টভাবে নাম না বললে স্প্যাগেটি-ফাস্ট হতে পারে
লামাইন্ডেক্স RAG-ভারী দল ফ্রি-ইশ + ইনফ্রা শক্তিশালী পুনরুদ্ধার নিদর্শন, সূচীকরণ, সংযোগকারী যখন আপনার এজেন্ট মূলত "অনুসন্ধান + কাজ" করে তখন দুর্দান্ত... যা সাধারণ
ওপেনএআই সহকারীর স্টাইল পদ্ধতি দ্রুত সেটআপ চাওয়া দলগুলো ব্যবহার-ভিত্তিক অন্তর্নির্মিত টুল কলিং প্যাটার্ন এবং রান স্টেট কিছু কোণে কম নমনীয়, কিন্তু অনেক অ্যাপের জন্য পরিষ্কার OpenAI API চালায় OpenAI Assistants ফাংশন কলিং
শব্দার্থিক কার্নেল যারা কাঠামোগত অর্কেস্ট্রেশন চান এমন ডেভেলপাররা স্বাধীনচেতা দক্ষতা/কার্যকরীতার জন্য সুন্দর বিমূর্তকরণ "এন্টারপ্রাইজ পরিপাটি" মনে হয় - কখনও কখনও এটি প্রশংসার যোগ্য 😉
অটোজেন মাল্টি-এজেন্ট পরীক্ষক স্বাধীনচেতা এজেন্ট-টু-এজেন্ট সহযোগিতার ধরণ অতিরিক্ত কথা বলতে পারে; কঠোর বরখাস্তের নিয়ম নির্ধারণ করতে পারে
CrewAI সম্পর্কে "এজেন্টদের দল" ভক্তরা স্বাধীনচেতা ভূমিকা + কাজ + হ্যান্ডঅফ প্রকাশ করা সহজ কাজগুলো যখন মসৃণ না হয়ে মসৃণ হয়, তখন সবচেয়ে ভালো কাজ করে
খড়ের গাদা অনুসন্ধান + পাইপলাইনের মানুষ স্বাধীনচেতা কঠিন পাইপলাইন, পুনরুদ্ধার, উপাদান "এজেন্ট থিয়েটার" কম, "ব্যবহারিক কারখানা" বেশি
নিজের মতো করে রোল করুন (কাস্টম লুপ) নিয়ন্ত্রণ পাগল (স্নেহশীল) তোমার সময় ন্যূনতম জাদু, সর্বোচ্চ স্পষ্টতা সাধারণত দীর্ঘমেয়াদী সেরা... যতক্ষণ না আপনি সবকিছু নতুন করে তৈরি করেন 😅

কোনও একক বিজয়ী নেই। আপনার এজেন্টের প্রধান কাজ পুনরুদ্ধার , সরঞ্জাম সম্পাদন , মাল্টি-এজেন্ট সমন্বয় , নাকি ওয়ার্কফ্লো অটোমেশন ,


৬) ধাপে ধাপে কীভাবে একটি এআই এজেন্ট তৈরি করবেন (প্রকৃত রেসিপি) 🍳🤖

এই অংশটি বেশিরভাগ মানুষ এড়িয়ে যায়, তারপর ভাবি কেন এজেন্টটি প্যান্ট্রিতে র‍্যাকুনের মতো আচরণ করে।.

ধাপ ১: এক বাক্যে কাজটি সংজ্ঞায়িত করুন 🎯

উদাহরণ:

  • "নীতি এবং টিকিটের প্রেক্ষাপট ব্যবহার করে গ্রাহকের উত্তরের খসড়া তৈরি করুন, তারপর অনুমোদনের জন্য জিজ্ঞাসা করুন।"

  • "একটি বাগ রিপোর্ট তদন্ত করুন, এটি পুনরুত্পাদন করুন এবং একটি সমাধান প্রস্তাব করুন।"

  • "অসম্পূর্ণ মিটিং নোটগুলিকে কাজ, মালিক এবং সময়সীমাতে পরিণত করুন।"

যদি তুমি এটাকে সহজভাবে সংজ্ঞায়িত করতে না পারো, তাহলে তোমার এজেন্টও পারবে না। আমি বলতে চাইছি এটা পারে, কিন্তু এটা উন্নতি করবে, এবং উন্নতির মাধ্যমেই বাজেটের মৃত্যু ঘটে।.

ধাপ ২: স্বায়ত্তশাসনের মাত্রা নির্ধারণ করুন (নিম্ন, মাঝারি, মশলাদার) 🌶️

  • কম স্বায়ত্তশাসন : পদক্ষেপের পরামর্শ দেয়, মানুষের ক্লিক "অনুমোদন" দেয়

  • মাধ্যম : সরঞ্জাম চালায়, আউটপুট খসড়া করে, অনিশ্চয়তার উপর বৃদ্ধি পায়

  • উচ্চ : এন্ড-টু-এন্ড এক্সিকিউট করে, শুধুমাত্র ব্যতিক্রমগুলিতে মানুষকে পিং করে

তুমি যতটা চাও তার চেয়ে নিচুতে শুরু করো। পরে তুমি যেকোনো সময় এটিকে ক্র্যাঙ্ক করতে পারো।.

ধাপ ৩: আপনার মডেল কৌশল বেছে নিন 🧠

আপনি সাধারণত বেছে নেন:

  • সবকিছুর জন্য একটি শক্তিশালী মডেল (সহজ)

  • একটি শক্তিশালী মডেল + সস্তা ধাপের জন্য ছোট মডেল (শ্রেণীবিভাগ, রাউটিং)

  • প্রয়োজনে বিশেষায়িত মডেল (দৃষ্টি, কোড, বক্তৃতা)

এছাড়াও সিদ্ধান্ত নিন:

  • সর্বোচ্চ টোকেন

  • তাপমাত্রা

  • আপনি কি অভ্যন্তরীণভাবে দীর্ঘ যুক্তির চিহ্নগুলিকে অনুমতি দেন (আপনি পারেন, কিন্তু শেষ ব্যবহারকারীদের কাছে কাঁচা চিন্তার শৃঙ্খলা প্রকাশ করবেন না)

ধাপ ৪: কঠোর স্কিমা সহ টুলগুলি সংজ্ঞায়িত করুন 🔩

সরঞ্জামগুলি হওয়া উচিত:

do_anything(input: string) নামক একটি টুলের পরিবর্তে , তৈরি করুন:

  • search_kb(কোয়েরি: স্ট্রিং) -> ফলাফল[]

  • create_ticket(শিরোনাম: স্ট্রিং, বডি: স্ট্রিং, অগ্রাধিকার: enum) -> ticket_id

  • send_email(to: string, subject: string, body: string) -> status OpenAI ফাংশন কলিং গাইড

যদি তুমি এজেন্টকে একটি চেইনসো দাও, তাহলে যখন সে বেড়াটিও সরিয়ে একটি হেজ ছাঁটাই করবে তখন অবাক হবেন না।.

ধাপ ৫: কন্ট্রোলার লুপ তৈরি করুন 🔁

সর্বনিম্ন লুপ:

  1. লক্ষ্য + প্রাথমিক প্রেক্ষাপট দিয়ে শুরু করুন

  2. মডেলকে জিজ্ঞাসা করুন: "পরবর্তী পদক্ষেপ?"

  3. যদি টুল কল - এক্সিকিউট টুল

  4. পর্যবেক্ষণ যোগ করুন

  5. স্টপের অবস্থা পরীক্ষা করুন

  6. ল্যাংচেইন "এজেন্ট" ডক্স পুনরাবৃত্তি করুন (সর্বোচ্চ ধাপ সহ)

যোগ করুন:

ধাপ ৬: সাবধানে মেমরি যোগ করুন 🗃️

স্বল্পমেয়াদী: প্রতিটি ধাপে একটি সংক্ষিপ্ত "অবস্থার সারাংশ" আপডেট রাখুন। ল্যাংচেইন "মেমরি ওভারভিউ"
দীর্ঘমেয়াদী: টেকসই তথ্য সংরক্ষণ করুন (ব্যবহারকারীর পছন্দ, প্রতিষ্ঠানের নিয়ম, স্থিতিশীল ডক্স)।

মূল নিয়ম:

  • যদি এটি ঘন ঘন পরিবর্তিত হয় - এটি স্বল্পমেয়াদী রাখুন

  • যদি এটি স্থিতিশীল থাকে - দীর্ঘমেয়াদী সংরক্ষণ করুন

  • যদি এটি সংবেদনশীল হয় - ন্যূনতম পরিমাণে সংরক্ষণ করুন (অথবা একেবারেই নয়)

ধাপ ৭: বৈধতা এবং একটি "সমালোচক" পাস যোগ করুন 🧪

একটি সস্তা, ব্যবহারিক প্যাটার্ন:

  • এজেন্ট ফলাফল তৈরি করে

  • যাচাইকারী কাঠামো এবং সীমাবদ্ধতা পরীক্ষা করে

  • অনুপস্থিত পদক্ষেপ বা নীতি লঙ্ঘনের জন্য ঐচ্ছিক সমালোচক মডেল পর্যালোচনা NIST AI RMF 1.0

নিখুঁত নয়, কিন্তু এতে প্রচুর পরিমাণে বাজে কথা ধরা পড়ে।.

ধাপ ৮: লগ ইন না করার জন্য আপনার যা কিছু অনুশোচনা হবে তার সবকিছু লগ ইন করুন 📜

লগ:

ভবিষ্যৎ-তুমি তোমাকে ধন্যবাদ জানাবে। বর্তমান-তুমি ভুলে যাবে। এটাই জীবন 😵💫


৭) এমন একটি হাতিয়ার যা আপনার আত্মাকে ভেঙে দেয় না 🧰😵

টুল কলিং হলো সেই জায়গা যেখানে "কিভাবে একজন এআই এজেন্ট তৈরি করবেন" আসল সফটওয়্যার ইঞ্জিনিয়ারিং হয়ে ওঠে।.

সরঞ্জামগুলিকে নির্ভরযোগ্য করে তুলুন (নির্ভরযোগ্যতা ভালো)

নির্ভরযোগ্য সরঞ্জামগুলি হল:

টুল লেয়ারে কেবল প্রম্পট নয়, গার্ডেল যোগ করুন

প্রম্পটগুলি ভদ্র পরামর্শ। টুল ভ্যালিডেশন একটি লকড দরজা। OpenAI স্ট্রাকচার্ড আউটপুট

কর:

  • অ্যালাউলিস্ট (কোন টুলগুলি চালানো যেতে পারে)

  • ইনপুট যাচাইকরণ

  • হার সীমা OpenAI হার সীমা নির্দেশিকা

  • প্রতি ব্যবহারকারী/সংস্থার অনুমতি পরীক্ষা

  • ঝুঁকিপূর্ণ কর্মকাণ্ডের জন্য "ড্রাই-রান মোড"

আংশিক ব্যর্থতার জন্য নকশা

টুলগুলি ব্যর্থ। নেটওয়ার্কগুলি টলমল করছে। প্রমাণীকরণের মেয়াদ শেষ। একজন এজেন্টকে অবশ্যই:

একটি শান্তভাবে কার্যকর কৌশল: কাঠামোগত ত্রুটিগুলি ফেরত দিন যেমন:

  • ধরণ: auth_error

  • ধরণ: খুঁজে পাওয়া যায়নি

  • টাইপ: rate_limited
    যাতে মডেলটি আতঙ্কিত না হয়ে বুদ্ধিমত্তার সাথে সাড়া দিতে পারে।


৮) স্মৃতি যা আপনাকে তাড়া করার পরিবর্তে সাহায্য করে 👻🗂️

স্মৃতিশক্তি শক্তিশালী, কিন্তু এটি একটি আবর্জনার ড্রয়ারেও পরিণত হতে পারে।.

স্বল্পমেয়াদী স্মৃতি: এটিকে সংকুচিত রাখুন

ব্যবহার:

  • শেষ N ধাপ

  • একটি চলমান সারাংশ (প্রতিটি লুপ আপডেট করা হয়েছে)

  • বর্তমান পরিকল্পনা

  • বর্তমান সীমাবদ্ধতা (বাজেট, সময়, নীতি)

যদি আপনি সবকিছু প্রসঙ্গে ফেলে দেন, তাহলে আপনি পাবেন:

  • বেশি খরচ

  • ধীর লেটেন্সি

  • আরও বিভ্রান্তি (হ্যাঁ, তবুও)

দীর্ঘমেয়াদী স্মৃতি: "স্টাফিং" এর উপর পুনরুদ্ধার

বেশিরভাগ "দীর্ঘমেয়াদী স্মৃতি" এরকম:

  • এম্বেডিং

  • ভেক্টর স্টোর

  • পুনরুদ্ধার বৃদ্ধি প্রজন্ম (RAG) RAG কাগজ

এজেন্ট মুখস্থ করে না। রানটাইমে এটি সবচেয়ে প্রাসঙ্গিক স্নিপেটগুলি পুনরুদ্ধার করে। LlamaIndex “RAG এর ভূমিকা”

ব্যবহারিক স্মৃতির নিয়ম

  • "পছন্দ" কে স্পষ্ট তথ্য হিসেবে সংরক্ষণ করুন: "ব্যবহারকারী বুলেট সারাংশ পছন্দ করেন এবং ইমোজি ঘৃণা করেন" (হা হা, এখানে নয় 😄)

  • টাইমস্ট্যাম্প বা সংস্করণ সহ "সিদ্ধান্ত" সংরক্ষণ করুন (অন্যথায় দ্বন্দ্ব জমে যাবে)

  • সত্যিই প্রয়োজন না হলে কখনোই গোপনীয়তা সংরক্ষণ করো না

আর এখানে আমার অসম্পূর্ণ রূপক: স্মৃতি হলো একটা রেফ্রিজারেটরের মতো। যদি তুমি কখনো এটি পরিষ্কার না করো, তাহলে অবশেষে তোমার স্যান্ডউইচের স্বাদ পেঁয়াজের মতো এবং আফসোসের মতো হয়ে যাবে।.


৯) পরিকল্পনার ধরণ (সহজ থেকে অভিনব) 🧭✨

পরিকল্পনা হলো নিয়ন্ত্রিত পচন। এটাকে রহস্যময় করে তুলবেন না।.

প্যাটার্ন A: চেকলিস্ট প্ল্যানার ✅

  • মডেল ধাপগুলির একটি তালিকা প্রদর্শন করে

  • ধাপে ধাপে কার্যকর করা হয়

  • চেকলিস্টের স্থিতি আপডেট করে

অনবোর্ডিংয়ের জন্য দুর্দান্ত। সহজ, পরীক্ষাযোগ্য।.

প্যাটার্ন বি: রিঅ্যাক্ট লুপ (কারণ + অ্যাক্ট) 🧠→🧰

  • মডেল পরবর্তী টুল কলের সিদ্ধান্ত নেয়

  • আউটপুট পর্যবেক্ষণ করে

  • রিঅ্যাক্ট পেপার পুনরাবৃত্তি করে

এটিই ক্লাসিক এজেন্ট অনুভূতি।.

প্যাটার্ন সি: সুপারভাইজার-কর্মী 👥

যখন কাজগুলি সমান্তরাল করা যায়, অথবা যখন আপনি বিভিন্ন "ভূমিকা" চান যেমন:

  • গবেষক

  • কোডার

  • সম্পাদক

  • QA পরীক্ষক

প্যাটার্ন ডি: পুনঃপরিকল্পনা সহ পরিকল্পনা করুন-তারপর-কার্যকর করুন 🔄

  • পরিকল্পনা তৈরি করুন

  • সম্পাদন করা

  • যদি টুলের ফলাফল বাস্তবতা পরিবর্তন করে, তাহলে পুনরায় পরিকল্পনা করুন

এটি এজেন্টকে একগুঁয়েভাবে খারাপ পরিকল্পনা অনুসরণ করতে বাধা দেয়। মানুষও এটি করে, যদি না তারা ক্লান্ত হয়, তবে সেক্ষেত্রে তারাও খারাপ পরিকল্পনা অনুসরণ করে।.


১০) নিরাপত্তা, নির্ভরযোগ্যতা, এবং চাকরিচ্যুত না হওয়া 🔐😅

যদি আপনার এজেন্ট পদক্ষেপ নিতে পারে, তাহলে আপনার নিরাপত্তা নকশার প্রয়োজন। "থাকতে ভালো" নয়। প্রয়োজন। NIST AI RMF 1.0

কঠিন সীমা

  • প্রতি দৌড়ে সর্বোচ্চ পদক্ষেপ

  • প্রতি মিনিটে সর্বোচ্চ টুল কল

  • প্রতি সেশনে সর্বোচ্চ ব্যয় (টোকেন বাজেট)

  • অনুমোদনের পিছনে সীমাবদ্ধ সরঞ্জাম

ডেটা হ্যান্ডলিং

  • লগিং করার আগে সংবেদনশীল ইনপুটগুলি সম্পাদনা করুন

  • পৃথক পরিবেশ (ডেভেলপার বনাম উৎপাদন)

  • ন্যূনতম-সুবিধাপ্রাপ্ত সরঞ্জামের অনুমতি

আচরণগত সীমাবদ্ধতা

  • এজেন্টকে অভ্যন্তরীণ প্রমাণের টুকরো উদ্ধৃত করতে বাধ্য করুন (বাহ্যিক লিঙ্ক নয়, কেবল অভ্যন্তরীণ রেফারেন্স)

  • আত্মবিশ্বাস কম থাকলে অনিশ্চয়তার পতাকা প্রয়োজন

  • যদি ইনপুটগুলি অস্পষ্ট হয় তবে "স্পষ্টকারী প্রশ্ন জিজ্ঞাসা করুন" প্রয়োজন

একজন নির্ভরযোগ্য এজেন্ট সবচেয়ে আত্মবিশ্বাসী নয়। সে জানে কখন সে অনুমান করছে... এবং তাই বলে।.


১১) পরীক্ষা এবং মূল্যায়ন (যে অংশটি সবাই এড়িয়ে চলে) 🧪📏

তুমি যা পরিমাপ করতে পারো না, তা উন্নত করতে পারো না। হ্যাঁ, এই লাইনটা তেতো, কিন্তু এটা বিরক্তিকরভাবে সত্য।.

একটি দৃশ্যকল্প সেট তৈরি করুন

৩০-১০০টি টেস্ট কেস তৈরি করুন:

স্কোরের ফলাফল

এর মতো মেট্রিক্স ব্যবহার করুন:

  • কাজের সাফল্যের হার

  • সমাপ্তির সময়

  • সরঞ্জাম ত্রুটি পুনরুদ্ধারের হার

  • হ্যালুসিনেশনের হার (প্রমাণ ছাড়া দাবি)

  • মানুষের অনুমোদনের হার (যদি তত্ত্বাবধানে থাকে)

প্রম্পট এবং সরঞ্জামগুলির জন্য রিগ্রেশন পরীক্ষা

আপনি যখনই পরিবর্তন করবেন:

  • টুল স্কিমা

  • সিস্টেম নির্দেশাবলী

  • পুনরুদ্ধার যুক্তি

  • মেমরি ফর্ম্যাট
    স্যুটটি আবার চালান।

এজেন্টরা সংবেদনশীল প্রাণী। ঘরের গাছের মতো, কিন্তু বেশি দামি।.


১২) এমন স্থাপনার ধরণ যা আপনার বাজেট গলে না 💸🔥

একটি মাত্র পরিষেবা দিয়ে শুরু করুন

খরচ নিয়ন্ত্রণ তাড়াতাড়ি যোগ করুন

  • ক্যাশিং পুনরুদ্ধার ফলাফল

  • সারাংশ ব্যবহার করে কথোপকথনের অবস্থা সংকুচিত করা

  • রাউটিং এবং নিষ্কাশনের জন্য ছোট মডেল ব্যবহার করা

  • "গভীর চিন্তাভাবনা" কে কঠিনতম ধাপের মধ্যে সীমাবদ্ধ রাখা

সাধারণ স্থাপত্য পছন্দ

  • স্টেটলেস কন্ট্রোলার + এক্সটার্নাল স্টেট স্টোর (DB/redis)

  • সম্ভব হলে টুল কলগুলি অযোগ্য। স্ট্রাইপ "অযোগ্য অনুরোধ"

  • দীর্ঘ কাজের জন্য সারিবদ্ধ থাকা (যাতে আপনার কোনও ওয়েব অনুরোধ চিরতরে খোলা না থাকে)

এছাড়াও: একটি "কিল সুইচ" তৈরি করুন। আপনার এটির প্রয়োজন হবে না যতক্ষণ না আপনার এটি সত্যিই প্রয়োজন 😬


১৩) সমাপনী নোট - কীভাবে একজন এআই এজেন্ট তৈরি করবেন তার সংক্ষিপ্ত সংস্করণ 🎁🤖

যদি তোমার আর কিছু মনে না থাকে, তাহলে এটা মনে রেখো:

একজন এজেন্ট জাদু নয়। এটি এমন একটি ব্যবস্থা যা প্রায়শই মূল্যবান হওয়ার জন্য যথেষ্ট ভালো সিদ্ধান্ত নেয়... এবং ক্ষতি করার আগেই পরাজয় স্বীকার করে। শান্তভাবে সান্ত্বনাদায়ক, একরকম 😌

আর হ্যাঁ, যদি তুমি এটা ঠিকভাবে তৈরি করো, তাহলে এটা এমন একটা ছোট্ট ডিজিটাল ইন্টার্ন নিয়োগের মতো মনে হবে যে কখনো ঘুমায় না, মাঝে মাঝে আতঙ্কিত হয় এবং কাগজপত্র ভালোবাসে। তাহলে, মূলত একজন ইন্টার্ন।.


প্রায়শই জিজ্ঞাসিত প্রশ্নাবলী

সহজ ভাষায়, একজন এআই এজেন্ট কী?

একটি এআই এজেন্ট মূলত একটি লুপ যা পুনরাবৃত্তি করে: ইনপুট নেওয়া, পরবর্তী পদক্ষেপ নির্ধারণ করা, একটি টুল ব্যবহার করা, ফলাফল পড়া এবং এটি সম্পন্ন না হওয়া পর্যন্ত পুনরাবৃত্তি করা। "এজেন্টিক" অংশটি কেবল চ্যাট করা নয়, অভিনয় এবং পর্যবেক্ষণ থেকে আসে। অনেক এজেন্ট কেবল টুল অ্যাক্সেস সহ স্মার্ট অটোমেশন, অন্যরা আরও বেশি করে একজন জুনিয়র অপারেটরের মতো আচরণ করে যা ত্রুটি থেকে পুনরুদ্ধার করতে পারে।.

শুধু প্রম্পট ব্যবহার না করে কখন আমার একটি AI এজেন্ট তৈরি করা উচিত?

যখন কাজটি বহু-পদক্ষেপের হয়, মধ্যবর্তী ফলাফলের উপর ভিত্তি করে পরিবর্তিত হয় এবং নির্ভরযোগ্য সরঞ্জাম ব্যবহারের প্রয়োজন হয় (API, ডাটাবেস, টিকিটিং, কোড সম্পাদন)। এজেন্টগুলি তখনও কার্যকর যখন আপনি গার্ডেল এবং "সম্পন্ন" চেক করার উপায় সহ পুনরাবৃত্তিযোগ্য ফলাফল চান। যদি একটি সহজ প্রম্পট-প্রতিক্রিয়া কাজ করে, তাহলে একজন এজেন্ট সাধারণত অপ্রয়োজনীয় ওভারহেড এবং অতিরিক্ত ব্যর্থতা মোড ব্যবহার করে।.

আমি কীভাবে এমন একটি এআই এজেন্ট তৈরি করব যা লুপে আটকে থাকবে না?

হার্ড স্টপ কন্ডিশন ব্যবহার করুন: সর্বোচ্চ ধাপ, সর্বোচ্চ টুল কল এবং পরিষ্কার সমাপ্তি পরীক্ষা। স্ট্রাকচার্ড টুল স্কিমা, টাইমআউট এবং রিট্রাই যোগ করুন যা চিরতরে পুনরায় চেষ্টা করবে না। সিদ্ধান্ত এবং টুল আউটপুট লগ করুন যাতে আপনি দেখতে পারেন এটি কোথায় লাইনচ্যুত হয়। একটি সাধারণ সুরক্ষা ভালভ হল এসকেলেশন: যদি এজেন্ট অনিশ্চিত থাকে বা ত্রুটি পুনরাবৃত্তি করে, তাহলে এটির উন্নতির পরিবর্তে সাহায্য চাওয়া উচিত।.

একজন এআই এজেন্ট কীভাবে তৈরি করবেন তার ন্যূনতম স্থাপত্য কত?

কমপক্ষে আপনার এমন একটি কন্ট্রোলার লুপ প্রয়োজন যা মডেলটিকে লক্ষ্য এবং প্রেক্ষাপট প্রদান করে, পরবর্তী পদক্ষেপের জন্য জিজ্ঞাসা করে, অনুরোধ করা হলে একটি টুল কার্যকর করে, পর্যবেক্ষণ সংযোজন করে এবং পুনরাবৃত্তি করে। আপনার কঠোর ইনপুট/আউটপুট আকার এবং "সম্পন্ন" চেক সহ টুলও প্রয়োজন। এমনকি একটি রোল-ইওর-ওন লুপও ভালোভাবে কাজ করতে পারে যদি আপনি স্টেট পরিষ্কার রাখেন এবং ধাপের সীমা প্রয়োগ করেন।.

আমি কীভাবে টুল কলিং ডিজাইন করব যাতে এটি উৎপাদনে নির্ভরযোগ্য হয়?

টুলগুলিকে সংকীর্ণ, টাইপ করা, অনুমতিপ্রাপ্ত এবং যাচাইকৃত রাখুন—একটি জেনেরিক "do_anything" টুল এড়িয়ে চলুন। কঠোর স্কিমা (যেমন স্ট্রাকচার্ড আউটপুট/ফাংশন কলিং) পছন্দ করুন যাতে এজেন্ট ইনপুটগুলিকে হাত দিয়ে নাড়াতে না পারে। টুল লেয়ারে অ্যালোলিস্ট, রেট লিমিট এবং ব্যবহারকারী/সংস্থার অনুমতি চেক যোগ করুন। আইডেম্পোটেন্সি প্যাটার্ন ব্যবহার করে, সম্ভব হলে পুনরায় চালানোর জন্য নিরাপদ টুল ডিজাইন করুন।.

এজেন্টকে আরও খারাপ না করে মেমরি যোগ করার সর্বোত্তম উপায় কী?

মেমোরিকে দুটি অংশে ভাগ করুন: স্বল্পমেয়াদী রান অবস্থা (সাম্প্রতিক পদক্ষেপ, বর্তমান পরিকল্পনা, সীমাবদ্ধতা) এবং দীর্ঘমেয়াদী পুনরুদ্ধার (পছন্দ, স্থিতিশীল নিয়ম, প্রাসঙ্গিক ডক্স)। সম্পূর্ণ ট্রান্সক্রিপ্ট নয়, চলমান সারাংশ দিয়ে স্বল্পমেয়াদী কম্প্যাক্ট রাখুন। দীর্ঘমেয়াদী মেমোরির জন্য, পুনরুদ্ধার (এম্বেডিং + ভেক্টর স্টোর/RAG প্যাটার্ন) সাধারণত সবকিছুকে প্রসঙ্গে "স্টাফ" করার এবং মডেলটিকে বিভ্রান্ত করার চেয়েও বেশি কার্যকর।.

আমার কোন পরিকল্পনা প্যাটার্ন ব্যবহার করা উচিত: চেকলিস্ট, রিঅ্যাক্ট, নাকি সুপারভাইজার-ওয়ার্কার?

যখন কাজগুলি অনুমানযোগ্য হয় এবং আপনি সহজে পরীক্ষা করার মতো কিছু চান তখন একটি চেকলিস্ট প্ল্যানার দুর্দান্ত। যখন টুলের ফলাফল আপনার পরবর্তী কাজ পরিবর্তন করে তখন ReAct-স্টাইলের লুপগুলি উজ্জ্বল হয়। সুপারভাইজার-ওয়ার্কার প্যাটার্ন (যেমন AutoGen-স্টাইলের ভূমিকা পৃথকীকরণ) সাহায্য করে যখন কাজগুলি সমান্তরাল করা যায় বা স্বতন্ত্র ভূমিকা (গবেষক, কোডার, QA) থেকে উপকৃত হতে পারে। একগুঁয়ে খারাপ পরিকল্পনা এড়াতে পরিকল্পনা-তারপর-সম্পাদনা করা একটি ব্যবহারিক মধ্যম ক্ষেত্র।.

যদি কোনও এজেন্ট বাস্তব পদক্ষেপ নিতে পারে, তাহলে আমি কীভাবে তাকে নিরাপদ করব?

অনুমোদন বা "ড্রাই-রান" মোডের পিছনে ঝুঁকিপূর্ণ সরঞ্জামগুলিকে সীমাবদ্ধ করুন এবং সর্বনিম্ন-সুবিধাপ্রাপ্ত অনুমতিগুলি ব্যবহার করুন। বাজেট এবং ক্যাপ যোগ করুন: সর্বাধিক পদক্ষেপ, সর্বোচ্চ ব্যয় এবং প্রতি-মিনিট টুল কল সীমা। লগিংয়ের আগে সংবেদনশীল ডেটা সংশোধন করুন এবং উৎপাদন পরিবেশ থেকে ডেভেলপারদের আলাদা করুন। যখন ইনপুটগুলি অস্পষ্ট হয় তখন অনিশ্চয়তার পতাকা বা স্পষ্টীকরণ প্রশ্ন প্রয়োজন, প্রমাণের পরিবর্তে আত্মবিশ্বাসকে প্রতিস্থাপন করতে দিন।.

সময়ের সাথে সাথে উন্নত করার জন্য আমি কীভাবে একজন AI এজেন্টকে পরীক্ষা এবং মূল্যায়ন করব?

হ্যাপি পাথ, এজ কেস, টুল ফেইলিওর, অ্যাম্বিসিভ রিকোয়েস্ট এবং প্রম্পট-ইনজেকশন অ্যাটেম্পট (OWASP-স্টাইল) সহ একটি সিনারিও স্যুট তৈরি করুন। টাস্ক সাকসেস, টাইম-টু-কমপ্লিশন, টুল এরর থেকে রিকভারি এবং প্রমাণ ছাড়াই দাবির মতো স্কোর ফলাফল। যেকোনো সময় আপনি টুল স্কিমা, প্রম্পট, রিট্রিভাল বা মেমরি ফর্ম্যাটিং পরিবর্তন করেন, স্যুটটি পুনরায় চালান। যদি আপনি এটি পরীক্ষা করতে না পারেন, তাহলে আপনি এটি নির্ভরযোগ্যভাবে পাঠাতে পারবেন না।.

বিলম্ব এবং খরচ না বাড়িয়ে আমি কীভাবে একজন এজেন্ট মোতায়েন করব?

একটি সাধারণ প্যাটার্ন হল একটি স্টেটলেস কন্ট্রোলার যার একটি এক্সটার্নাল স্টেট স্টোর (DB/Redis), এর পিছনে টুল সার্ভিস এবং শক্তিশালী লগিং/মনিটরিং (প্রায়শই OpenTelemetry) থাকে। পুনরুদ্ধার ক্যাশিং, কম্প্যাক্ট স্টেট সারাংশ, রাউটিং/এক্সট্রাকশনের জন্য ছোট মডেল এবং "গভীর চিন্তাভাবনা" কে কঠিনতম ধাপগুলিতে সীমাবদ্ধ করে খরচ নিয়ন্ত্রণ করুন। দীর্ঘ কাজের জন্য সারি ব্যবহার করুন যাতে আপনার ওয়েব অনুরোধগুলি খোলা না থাকে। সর্বদা একটি কিল সুইচ অন্তর্ভুক্ত করুন।.

তথ্যসূত্র

  1. ন্যাশনাল ইনস্টিটিউট অফ স্ট্যান্ডার্ডস অ্যান্ড টেকনোলজি (NIST) - NIST AI RMF 1.0 (বিশ্বস্ততা এবং স্বচ্ছতা) - nvlpubs.nist.gov

  2. ওপেনএআই - স্ট্রাকচার্ড আউটপুট - platform.openai.com

  3. ওপেনএআই - ফাংশন কলিং গাইড - platform.openai.com

  4. ওপেনএআই - হার সীমা নির্দেশিকা - platform.openai.com

  5. OpenAI - চালায় API - platform.openai.com

  6. ওপেনএআই - সহকারী ফাংশন কলিং - platform.openai.com

  7. ল্যাংচেইন - এজেন্ট ডক্স (জাভাস্ক্রিপ্ট) - docs.langchain.com

  8. ল্যাংচেইন - টুলস ডক্স (পাইথন) - docs.langchain.com

  9. ল্যাংচেইন - মেমোরি ওভারভিউ - docs.langchain.com

  10. arXiv - রিঅ্যাক্ট পেপার (কারণ + আইন) - arxiv.org

  11. arXiv - RAG পেপার - arxiv.org

  12. অ্যামাজন ওয়েব সার্ভিসেস (AWS) বিল্ডার্স লাইব্রেরি - জিটার সহ টাইমআউট, রিট্রাই এবং ব্যাকঅফ - aws.amazon.com

  13. ওপেনটেলিমেট্রি - পর্যবেক্ষণযোগ্যতা প্রাইমার - opentelemetry.io

  14. স্ট্রাইপ - অদম্য অনুরোধ - docs.stripe.com

  15. গুগল ক্লাউড - পুনরায় চেষ্টা করার কৌশল (ব্যাকঅফ + জিটার) - docs.cloud.google.com

  16. OWASP - বৃহৎ ভাষার মডেল অ্যাপ্লিকেশনের জন্য শীর্ষ ১০ - owasp.org

  17. OWASP - LLM01 প্রম্পট ইনজেকশন - genai.owasp.org

  18. LlamaIndex - RAG এর পরিচিতি - developers.llamaindex.ai

  19. মাইক্রোসফট - সিমান্টিক কার্নেল - learn.microsoft.com

  20. মাইক্রোসফট অটোজেন - মাল্টি-এজেন্ট ফ্রেমওয়ার্ক (ডকুমেন্টেশন) - microsoft.github.io

  21. CrewAI - এজেন্টদের ধারণা - docs.crewai.com

  22. খড়ের গাদা (ডিপসেট) - রিট্রিভার ডকুমেন্টেশন - docs.haystack.deepset.ai

অফিসিয়াল এআই অ্যাসিস্ট্যান্ট স্টোরে সর্বশেষ এআই খুঁজুন

আমাদের সম্পর্কে

ব্লগে ফিরে যান