রাস্পবেরি পাই দিয়ে কীভাবে একটি DIY AI সহকারী তৈরি করবেন

আপনি কি এমন একটি ছোট্ট ভয়েস অ্যাসিস্ট্যান্ট চান যা সত্যিই আপনার নির্দেশ মেনে চলে, আপনার নিজের হার্ডওয়্যারে চলে এবং আপনার কথা ভুল শোনার কারণে ভুলবশত বারোটা আনারস অর্ডার করে ফেলবে না? রাস্পবেরি পাই দিয়ে নিজেই একটি এআই অ্যাসিস্ট্যান্ট তৈরি করা আশ্চর্যজনকভাবে সম্ভব, মজাদার এবং নমনীয়। আপনাকে একটি ওয়েক ওয়ার্ড, স্পিচ রিকগনিশন (ASR = অটোমেটিক স্পিচ রিকগনিশন), স্বাভাবিক ভাষার জন্য একটি ব্রেইন (নিয়ম বা একটি LLM), এবং টেক্সট-টু-স্পিচ (TTS) সংযোগ করতে হবে। এর সাথে কয়েকটি স্ক্রিপ্ট, এক বা দুটি সার্ভিস এবং কিছু সতর্ক অডিও টিউনিং যোগ করলেই আপনি পেয়ে যাবেন একটি পকেট-আকারের স্মার্ট স্পিকার যা আপনার নিয়ম মেনে চলে।

চলুন, আপনাকে শূন্য থেকে পাই-এর সাথে কথা বলার দিকে নিয়ে যাই, সাধারণ ঝামেলা ছাড়াই। আমরা যন্ত্রাংশ, সেটআপ, কোড, তুলনা, গোটা জিনিসপত্র... পুরো বুরিটো নিয়ে আলোচনা করব। 🌯

এর পরে আপনি যে প্রবন্ধগুলি পড়তে পছন্দ করতে পারেন:

🔗 কীভাবে কার্যকরভাবে AI অধ্যয়ন করবেন
একটি অধ্যয়ন রোডম্যাপ তৈরি করুন, প্রকল্প অনুশীলন করুন এবং অগ্রগতি ট্র্যাক করুন।

🔗 কিভাবে একটি এআই কোম্পানি শুরু করবেন
সমস্যা যাচাই করুন, MVP তৈরি করুন, দল তৈরি করুন, প্রাথমিক গ্রাহকদের সুরক্ষিত করুন।

🔗 আরও উৎপাদনশীল হতে AI কীভাবে ব্যবহার করবেন
রুটিন কাজগুলি স্বয়ংক্রিয় করুন, কর্মপ্রবাহকে সুবিন্যস্ত করুন এবং সৃজনশীল আউটপুট বৃদ্ধি করুন।

🔗 আপনার ব্যবসায় AI কীভাবে অন্তর্ভুক্ত করবেন
উচ্চ-প্রভাবশালী প্রক্রিয়াগুলি চিহ্নিত করুন, পাইলট বাস্তবায়ন করুন, ROI পরিমাপ করুন, স্কেল করুন।

রাস্পবেরি পাই দিয়ে কী করলে একটি ভালো DIY AI সহকারী তৈরি হয় ✅

ডিফল্টরূপে ব্যক্তিগত – সম্ভব হলে অডিও স্থানীয়ভাবে রাখুন। ডিভাইস থেকে কী বাইরে যাবে, তা আপনিই ঠিক করবেন।
মডিউলার – লেগোর মতো উপাদান অদলবদল করা যায়: ওয়েক ওয়ার্ড ইঞ্জিন, এএসআর, এলএলএম, টিটিএস।
সাশ্রয়ী – বেশিরভাগই ওপেন সোর্স, সাধারণ মাইক্রোফোন, স্পিকার এবং একটি পাই।
হ্যাক করা সম্ভব – হোম অটোমেশন, ড্যাশবোর্ড, রুটিন, কাস্টম স্কিল চান? খুবই সহজ।
নির্ভরযোগ্য – পরিষেবা দ্বারা পরিচালিত, স্বয়ংক্রিয়ভাবে বুট হয় এবং শোনা শুরু করে।
মজার ব্যাপার – আপনি অডিও, বিভিন্ন প্রক্রিয়া এবং ইভেন্ট-ড্রাইভেন ডিজাইন সম্পর্কে অনেক কিছু শিখবেন।

ছোট্ট টিপস: যদি আপনি রাস্পবেরি পাই ৫ ব্যবহার করেন এবং ভারী স্থানীয় মডেল চালানোর পরিকল্পনা করেন, তাহলে একটি ক্লিপ-অন কুলার দীর্ঘস্থায়ী লোডের মধ্যে সাহায্য করবে। (সন্দেহ থাকলে, পাই ৫ এর জন্য ডিজাইন করা অফিসিয়াল অ্যাক্টিভ কুলারটি বেছে নিন।) [1]

আপনার প্রয়োজনীয় যন্ত্রাংশ এবং সরঞ্জাম 🧰

রাস্পবেরি পাই: হেডরুমের জন্য পাই ৪ বা পাই ৫ সুপারিশ করা হয়।
মাইক্রোএসডি কার্ড: ৩২ জিবি+ সুপারিশকৃত।
ইউএসবি মাইক্রোফোন: একটি সাধারণ ইউএসবি কনফারেন্স মাইক দুর্দান্ত।
স্পিকার: USB অথবা 3.5 মিমি স্পিকার, অথবা একটি I2S amp HAT।
নেটওয়ার্ক: ইথারনেট অথবা ওয়াই-ফাই।
ঐচ্ছিক সুন্দর দিক: কেস, সক্রিয় কুলার , পুশ-টু-টকের জন্য পুশ বোতাম, LED রিং। [1]

অপারেটিং সিস্টেম এবং বেসলাইন সেটআপ

Raspberry Pi OS ফ্ল্যাশ করুন । আপনার পছন্দের প্রিসেট সহ একটি বুটেবল মাইক্রোএসডি পাওয়ার এটি একটি সহজ উপায়। [1]
বুট করুন, নেটওয়ার্কে সংযোগ করুন, তারপর প্যাকেজ আপডেট করুন:

sudo apt আপডেট && sudo apt আপগ্রেড -y

অডিও বেসিক : রাস্পবেরি পাই অপারেটিং সিস্টেমে আপনি ডেস্কটপ UI অথবা raspi-config এর মাধ্যমে ডিফল্ট আউটপুট, লেভেল এবং ডিভাইস সেট করতে পারেন । USB এবং HDMI অডিও বিভিন্ন মডেলে সমর্থিত; ব্লুটুথ সহ মডেলগুলিতে ব্লুটুথ আউটপুট উপলব্ধ। [1]
ডিভাইসগুলি যাচাই করুন:

আরেকর্ড -l aplay -l

তারপর ক্যাপচার এবং প্লেব্যাক পরীক্ষা করুন। যদি লেভেল অদ্ভুত মনে হয়, তাহলে মাইককে দোষারোপ করার আগে মিক্সার এবং ডিফল্ট পরীক্ষা করুন।

এক নজরে স্থাপত্য 🗺️

একটি বুদ্ধিমান DIY AI সহকারী দেখতে এরকম:

ওয়েক ওয়ার্ড → লাইভ অডিও ক্যাপচার → ASR ট্রান্সক্রিপশন → ইনটেন্ট হ্যান্ডলিং বা LLM → রেসপন্স টেক্সট → TTS → অডিও প্লেব্যাক → MQTT বা HTTP এর মাধ্যমে ঐচ্ছিক অ্যাকশন।

ওয়েক ওয়ার্ড: পোর্কুপাইন ছোট, নির্ভুল এবং প্রতি-কীওয়ার্ড সংবেদনশীলতা নিয়ন্ত্রণের মাধ্যমে স্থানীয়ভাবে চলে। [2]
ASR: Whisper একটি বহুভাষিক, সাধারণ-উদ্দেশ্যমূলক ASR মডেল যা প্রায় 680k ঘন্টা ধরে প্রশিক্ষিত; এটি উচ্চারণ/পটভূমির কোলাহলের বিরুদ্ধে শক্তিশালী। ডিভাইসে ব্যবহারের জন্য, whisper.cpp একটি সংক্ষিপ্ত C/C++ ইনফারেন্স পাথ প্রদান করে। [3][4]
মস্তিষ্ক: আপনার পছন্দ অনুযায়ী – এপিআই-এর মাধ্যমে ক্লাউড এলএলএম, একটি রুলস ইঞ্জিন, অথবা কার্যক্ষমতার ওপর নির্ভর করে লোকাল ইনফারেন্স।
TTS: পাইপার স্থানীয়ভাবে স্বাভাবিক বক্তৃতা তৈরি করে, যা সাধারণ হার্ডওয়্যারে দ্রুত প্রতিক্রিয়া জানাতে যথেষ্ট দ্রুত। [5]

দ্রুত তুলনা সারণী 🔎

টুল	সেরা জন্য	দামের মতো	কেন এটি কাজ করে
সজারু জাগানো শব্দ	সর্বদা শোনার ট্রিগার	বিনামূল্যে স্তর +	কম CPU, নির্ভুল, সহজ বাইন্ডিং [2]
হুইস্পার.সিপিপি	পাই-তে স্থানীয় ASR	ওপেন সোর্স	ভালো নির্ভুলতা, CPU-বান্ধব [4]
দ্রুত-ফিসফিসিয়ে	CPU/GPU তে দ্রুত ASR	ওপেন সোর্স	CTranslate2 অপ্টিমাইজেশন
পাইপার টিটিএস	স্থানীয় বক্তৃতা আউটপুট	ওপেন সোর্স	দ্রুত কণ্ঠস্বর, অনেক ভাষা [5]
ক্লাউড এলএলএম এপিআই	সমৃদ্ধ যুক্তি	ব্যবহার ভিত্তিক	ভারী কম্পিউট অফলোড করে
নোড-লাল	সাজানো কর্মকাণ্ড	ওপেন সোর্স	ভিজ্যুয়াল ফ্লো, MQTT বান্ধব

ধাপে ধাপে তৈরি: আপনার প্রথম ভয়েস লুপ 🧩

আমরা ওয়েক ওয়ার্ডের জন্য পোর্কুপাইন, ট্রান্সক্রিপশনের জন্য হুইস্পার, রিপ্লাইয়ের জন্য একটি হালকা "ব্রেন" ফাংশন (আপনার পছন্দের LLM দিয়ে প্রতিস্থাপন করুন) এবং স্পিচের জন্য পাইপার ব্যবহার করব। এটি ন্যূনতম রাখুন, তারপর পুনরাবৃত্তি করুন।

১) নির্ভরতা ইনস্টল করুন

sudo apt install -y python3-pip portaudio19-dev sox ffmpeg pip3 install sounddevice numpy

Porcupine: আপনার ভাষার জন্য SDK/বাইন্ডিং নিন এবং দ্রুত শুরু করার নির্দেশাবলী অনুসরণ করুন (অ্যাক্সেস কী + কীওয়ার্ড তালিকা + অডিও ফ্রেম → .process)। [2]
হুইস্পার (CPU-বান্ধব): বিল্ড whisper.cpp:

গিট ক্লোন https://github.com/ggml-org/whisper.cpp সিডি whisper.cpp && cmake -B বিল্ড && cmake --বিল্ড বিল্ড -j ./models/download-ggml-model.sh base.en ./build/bin/whisper-cli -m ./models/ggml-base.en.bin -f your.wav -otxt

উপরেরটি প্রকল্পের দ্রুত শুরুর প্রতিফলন। [4]

পাইথন পছন্দ করেন? faster-whisper (CTranslate2) প্রায়শই ছোট CPU গুলিতে ভ্যানিলা পাইথনের চেয়ে দ্রুত।

২) পাইপার টিটিএস সেট আপ করুন

git clone https://github.com/rhasspy/piper cd piper make # আপনার পছন্দের একটি ভয়েস মডেল ডাউনলোড করুন, যেমন, en_US-amy echo "হ্যালো সেখানে।" | ./piper --model voices/en/en_US-amy-medium.onnx --output_file hello.wav aplay hello.wav

পাইপার একাধিক ভয়েস/ভাষা বিকল্প সহ ডিভাইসে থাকা TTS-এর জন্য ডিজাইন করা হয়েছে। [5]

৩) পাইথনে একটি ন্যূনতম সহকারী লুপ

ইচ্ছাকৃতভাবে সংকুচিত: একটি ওয়েক ফ্রেজ (স্টাব) এর জন্য অপেক্ষা করে, রেকর্ড করে, whisper.cpp, একটি উত্তর (প্লেসহোল্ডার) তৈরি করে, তারপর পাইপারের মাধ্যমে কথা বলে। আপনার পছন্দের LLM বা রুল লজিক দিয়ে প্লেসহোল্ডারটি অদলবদল করুন।

import os, subprocess, wave import sounddevice as sd WAKE_WORD = "hey computer" # উৎপাদনে Porcupine এর জন্য অদলবদল [2] RECORD_SECONDS = 6 SAMPLE_RATE = 16000 CHANNELS = 1 WORKDIR = "/home/pi/assistant" ASR_BIN = "/home/pi/whisper.cpp/build/bin/whisper-cli" # [4] ASR_MODEL = "/home/pi/whisper.cpp/models/ggml-base.en.bin" PIPER_BIN = "/home/pi/piper/build/piper" # [5] PIPER_VOICE = "/home/pi/piper/voices/en/en_US-amy-medium.onnx" os.makedirs(WORKDIR, exist_ok=True) def record_wav(path, seconds=RECORD_SECONDS): অডিও = sd.rec(int(seconds * SAMPLE_RATE), samplerate=SAMPLE_RATE, channels=CHANNELS, dtype='int16') sd.wait() wave.open(path, 'wb') সহ w: w.setnchannels(CHANNELS); w.setsampwidth(2); w.setframerate(SAMPLE_RATE) w.writeframes(audio.tobytes()) def transcribe(path): cmd = [ASR_BIN, "-m", ASR_MODEL, "-f", path, "-otxt"] subprocess.run(cmd, check=True, cwd=WORKDIR) open(path.replace(".wav", ".txt"), "r", encoding="utf-8") f হিসেবে ব্যবহার করুন: f.read().strip() def generate_reply(prompt): if "weather" in prompt.lower(): return "আমি মেঘ দেখতে পাচ্ছি না, তবে ঠিক থাকতে পারে। যদি সম্ভব হয় তাহলে জ্যাকেট আনুন।" "আপনি বলেছেন: " + প্রম্পট def speak(text): proc = subprocess.Popen([PIPER_BIN, "--model", PIPER_VOICE, "--output_file", f"{WORKDIR}/reply.wav"], stdin=subprocess.PIPE) proc.stdin.write(text.encode("utf-8")); proc.stdin.close(); proc.wait() subprocess.run(["aplay", f"{WORKDIR}/reply.wav"], check=True) print("Assistant ready. test করার জন্য wake phrase টাইপ করুন।") while True: typed = input("> ").strip().lower() if typed == WAKE_WORD: wav_path = f"{WORKDIR}/input.wav" record_wav(wav_path) text = transcribe(wav_path) reply = generate_reply(text) print("User:", text); print("Assistant:", reply) speak(reply) else: print("loop পরীক্ষা করার জন্য wake phrase টাইপ করুন।")

আসল ওয়েক-ওয়ার্ড সনাক্তকরণের জন্য, পোর্কুপিনের স্ট্রিমিং ডিটেক্টর (কম CPU, প্রতি-কীওয়ার্ড সংবেদনশীলতা) একীভূত করুন। [2]

অডিও টিউনিং যা আসলে গুরুত্বপূর্ণ 🎚️

কিছু ছোট ছোট সমাধান আপনার সহকারীকে আরও ১০ গুণ বেশি স্মার্ট করে তুলবে:

মাইকের দূরত্ব: অনেক ইউএসবি মাইকের জন্য ৩০-৬০ সেমি একটি আদর্শ দূরত্ব।
লেভেল: ইনপুট ক্লিপিং এড়িয়ে চলুন এবং প্লেব্যাক সুস্থ রাখুন; কোড ঘোস্ট তাড়া করার আগে রাউটিং ঠিক করুন। রাস্পবেরি পাই অপারেটিং সিস্টেমে, আপনি সিস্টেম টুল বা raspi-config এর। [1]
ঘরের শব্দগত বৈশিষ্ট্য: শক্ত দেয়াল প্রতিধ্বনি সৃষ্টি করে; মাইকের নিচে নরম মাদুর সাহায্য করে।
ওয়েক ওয়ার্ড থ্রেশহোল্ড: খুব সংবেদনশীল → ভুতুড়ে ট্রিগার; খুব কঠোর → আপনি প্লাস্টিকের দিকে চিৎকার করবেন। Porcupine আপনাকে প্রতি কীওয়ার্ডের জন্য সংবেদনশীলতা পরিবর্তন করার সুযোগ দেয়। [2]
থার্মাল: পাই ৫-এ দীর্ঘ ট্রান্সক্রিপশনগুলি টেকসই কর্মক্ষমতার জন্য অফিসিয়াল সক্রিয় কুলার থেকে উপকৃত হয়। [1]

খেলনা থেকে যন্ত্রপাতিতে যাওয়া: পরিষেবা, অটোস্টার্ট, স্বাস্থ্য পরীক্ষা 🧯

মানুষ স্ক্রিপ্ট চালাতে ভুলে যায়। কম্পিউটার ভালো হতে ভুলে যায়। আপনার লুপকে একটি পরিচালিত পরিষেবায় পরিণত করুন:

একটি systemd ইউনিট তৈরি করুন:

[ইউনিট] বর্ণনা=DIY ভয়েস অ্যাসিস্ট্যান্ট After=network.target sound.target [পরিষেবা] ব্যবহারকারী=pi WorkingDirectory=/home/pi/assistant ExecStart=/usr/bin/python3 /home/pi/assistant/assistant.py পুনঃসূচনা=সর্বদা পুনঃসূচনাসেক=3 [ইনস্টল করুন] WantedBy=multi-user.target

এটি সক্ষম করুন:

sudo cp assistant.service /etc/systemd/system/ sudo systemctl ডেমন-রিলোড sudo systemctl সক্ষম করুন --এখন সহকারী.service

লগ লেজ:

journalctl -u সহকারী -f

এখন এটি বুট করার সময় শুরু হয়, ক্র্যাশ করার সময় পুনরায় চালু হয় এবং সাধারণত একটি যন্ত্রের মতো আচরণ করে। একটু বিরক্তিকর, অনেক ভালো।

দক্ষতা ব্যবস্থা: ঘরে বসেই এটিকে বাস্তবে কার্যকর করুন 🏠✨

একবার ভয়েস-ইন এবং ভয়েস-আউট ঠিক হয়ে গেলে, ক্রিয়াগুলি যোগ করুন:

ইন্টেন্ট রাউটার: সাধারণ কাজের জন্য সহজ কীওয়ার্ড রুট।
স্মার্ট হোম: MQTT-তে ইভেন্ট প্রকাশ করুন অথবা হোম অ্যাসিস্ট্যান্টের HTTP এন্ডপয়েন্টগুলো কল করুন।
প্লাগইন: দ্রুত পাইথন ফাংশন যেমন set_timer, what_is_the_time, play_radio, run_scene।

এমনকি ক্লাউড LLM লুপে থাকা সত্ত্বেও, গতি এবং নির্ভরযোগ্যতার জন্য প্রথমে সুস্পষ্ট স্থানীয় কমান্ডগুলিকে রুট করুন।

শুধুমাত্র লোকাল বনাম ক্লাউড অ্যাসিস্ট: বিনিময়ের কিছু দিক যা আপনি অনুভব করবেন 🌓

শুধুমাত্র স্থানীয়
সুবিধা: ব্যক্তিগত, অফলাইন, অনুমানযোগ্য খরচ।
অসুবিধা: ছোট বোর্ডে ভারী মডেলগুলি ধীর হতে পারে। আপনি যদি হুইস্পারকে ডিভাইসে বা কাছাকাছি সার্ভারে রাখেন তবে এর বহুভাষিক প্রশিক্ষণ দৃঢ়তা বাড়াতে সাহায্য করে। [3]

ক্লাউড সহায়তা
সুবিধা: শক্তিশালী যুক্তি, বৃহত্তর প্রসঙ্গ উইন্ডো।
অসুবিধা: ডেটা ডিভাইস, নেটওয়ার্ক নির্ভরতা, পরিবর্তনশীল খরচ।

একটি হাইব্রিড প্রায়শই জয়ী হয়: wake word + ASR local → যুক্তির জন্য একটি API কল করুন → TTS local। [2][3][5]

সমস্যা সমাধান: অদ্ভুত গ্রেমলিন এবং দ্রুত সমাধান 👾

ওয়েক ওয়ার্ডের মিথ্যা ট্রিগার: সংবেদনশীলতা কমিয়ে দিন অথবা অন্য একটি মাইক ব্যবহার করে দেখুন। [2]
ASR ল্যাগ : একটি ছোট Whisper মডেল ব্যবহার করুন অথবা রিলিজ ফ্ল্যাগ ( -j --config Release ) সহ whisper.cpp তৈরি করুন । [4]
চপি টিটিএস: সাধারণ বাক্যাংশগুলি আগে থেকে তৈরি করুন; আপনার অডিও ডিভাইস এবং নমুনা হার নিশ্চিত করুন।
কোন মাইক সনাক্ত করা যায়নি: arecord -l এবং মিক্সার পরীক্ষা করুন।
থার্মাল থ্রটলিং: টেকসই কর্মক্ষমতার জন্য Pi 5-এ অফিসিয়াল অ্যাক্টিভ কুলার ব্যবহার করুন। [1]

নিরাপত্তা ও গোপনীয়তা সংক্রান্ত নোট যা আপনার আসলে পড়া উচিত 🔒

APT ব্যবহার করে আপনার Pi আপডেট রাখুন।
যদি আপনি কোনও ক্লাউড এপিআই ব্যবহার করেন, তাহলে আপনি যা পাঠান তা লগ করুন এবং প্রথমে স্থানীয়ভাবে ব্যক্তিগত বিটগুলি সম্পাদনা করার কথা বিবেচনা করুন।
সর্বনিম্ন সুবিধা সহ পরিষেবাগুলি চালান; প্রয়োজন না হলে ExecStart-এ sudo এড়িয়ে চলুন।
অতিথিদের জন্য বা নীরব সময়ের জন্য একটি স্থানীয়-কেবল মোড প্রদান করুন।

বিল্ড ভেরিয়েন্ট: স্যান্ডউইচের মতো মিক্স অ্যান্ড ম্যাচ করুন 🥪

অতি-স্থানীয়: Porcupine + whisper.cpp + Piper + সহজ নিয়ম। ব্যক্তিগত এবং শক্তিশালী। [2][4][5]
স্পিডি ক্লাউড অ্যাসিস্ট: পোর্কুপাইন + (ছোট স্থানীয় হুইস্পার বা ক্লাউড ASR) + TTS স্থানীয় + ক্লাউড LLM।
হোম অটোমেশন সেন্ট্রাল: রুটিন, দৃশ্য এবং সেন্সরের জন্য নোড-রেড বা হোম অ্যাসিস্ট্যান্ট ফ্লো যোগ করুন।

দক্ষতার উদাহরণ: MQTT এর মাধ্যমে আলো জ্বালানো 💡

mqtt হিসাবে paho.mqtt.client আমদানি করুন MQTT_HOST = "192.168.1.10" TOPIC = "home/livingroom/light/set" def set_light(state: str): client = mqtt.Client() client.connect(MQTT_HOST, 1883, 60) payload = "ON" if state.lower().startswith("on") else "OFF" client.publish(TOPIC, payload, qos=1, retain=False) client.disconnect() # if "turn on the lights in text: set_light("on")

"বসার ঘরের বাতি জ্বালাও" এর মতো একটি ভয়েস লাইন যোগ করুন, এবং আপনি একজন জাদুকরের মতো অনুভব করবেন।

কেন এই স্ট্যাকটি বাস্তবে কাজ করে 🧪

ছোট বোর্ডে জাগ্রত শব্দ সনাক্তকরণে সজারু দক্ষ এবং নির্ভুল, যা সর্বদা শোনা সম্ভব করে তোলে। [2]
হুইস্পারের বিশাল, বহুভাষিক প্রশিক্ষণ এটিকে বিভিন্ন পরিবেশ এবং উচ্চারণে দক্ষ করে তোলে। [3]
whisper.cpp সেই শক্তিকে Pi এর মতো CPU-কেবল ডিভাইসে ব্যবহারযোগ্য রাখে। [4]
পাইপার ক্লাউড টিটিএস-এ অডিও প্রেরণ না করেই দ্রুত প্রতিক্রিয়া বজায় রাখে। [5]

অনেক লম্বা, পড়িনি।

Porcupine (ওয়েক ওয়ার্ডের জন্য), Whisper ( whisper.cpp এর মাধ্যমে) (ASR-এর জন্য), আপনার পছন্দের কোনো ব্রেইন (উত্তরের জন্য), এবং Piper (লোকাল TTS-এর জন্য) একত্রিত করে Raspberry Pi দিয়ে একটি মডুলার, ব্যক্তিগত DIY AI অ্যাসিস্ট্যান্ট তৈরি করুন । এটিকে একটি systemd সার্ভিস হিসেবে র‍্যাপ করুন, অডিও টিউন করুন, এবং MQTT বা HTTP অ্যাকশন যুক্ত করুন। এটি আপনার ধারণার চেয়েও সস্তা, এবং এর সাথে থাকাটা অদ্ভুতভাবে আনন্দদায়ক। [1][2][3][4][5]

তথ্যসূত্র

রাস্পবেরি পাই সফটওয়্যার ও কুলিং – রাস্পবেরি পাই ইমেজার (ডাউনলোড ও ব্যবহার করুন) এবং পাই ৫ অ্যাক্টিভ কুলার পণ্যের তথ্য
- রাস্পবেরি পাই ইমেজার: আরও পড়ুন
- অ্যাক্টিভ কুলার (পাই ৫): আরও পড়ুন
পোরকুপাইন ওয়েক ওয়ার্ড – এসডিকে ও কুইক স্টার্ট (কীওয়ার্ড, সেনসিটিভিটি, লোকাল ইনফারেন্স)
- আরও পড়ুন
হুইস্পার (ASR মডেল) – প্রায় ৬৮০ হাজার ঘন্টায় প্রশিক্ষিত একটি বহুভাষিক, শক্তিশালী ASR।
- র‍্যাডফোর্ড এবং অন্যান্যরা, বৃহৎ-স্কেল দুর্বল তত্ত্বাবধানের মাধ্যমে শক্তিশালী বক্তৃতা স্বীকৃতি (হুইস্পার): আরও পড়ুন
whisper.cpp – সিপিইউ-বান্ধব হুইস্পার ইনফারেন্স, সাথে CLI এবং বিল্ড করার ধাপসমূহ
- আরও পড়ুন
পাইপার টিটিএস – একাধিক কণ্ঠস্বর/ভাষা সহ দ্রুত, স্থানীয় নিউরাল টিটিএস
- আরও পড়ুন

অফিসিয়াল এআই অ্যাসিস্ট্যান্ট স্টোরে সর্বশেষ এআই খুঁজুন

আমাদের সম্পর্কে

ব্লগে ফিরে যান