রাস্পবেরি পাই দিয়ে কীভাবে একটি DIY AI সহকারী তৈরি করবেন

রাস্পবেরি পাই দিয়ে কীভাবে একটি DIY AI সহকারী তৈরি করবেন

এমন একটি ক্ষুদ্র ভয়েস অ্যাসিস্ট্যান্ট চান যা আসলে আপনার নির্দেশ অনুসরণ করে, আপনার নিজস্ব হার্ডওয়্যারে চলে, এবং ভুল করে বারোটি আনারস অর্ডার না করে কারণ এটি আপনাকে ভুল শুনেছে? রাস্পবেরি পাই সহ একটি DIY AI অ্যাসিস্ট্যান্ট আশ্চর্যজনকভাবে অর্জনযোগ্য, মজাদার এবং নমনীয়। আপনি একটি জাগ্রত শব্দ, বক্তৃতা স্বীকৃতি (ASR = স্বয়ংক্রিয় বক্তৃতা স্বীকৃতি), প্রাকৃতিক ভাষার জন্য একটি মস্তিষ্ক (নিয়ম বা একটি LLM), এবং টেক্সট-টু-স্পিচ (TTS) তৈরি করতে পারবেন। কয়েকটি স্ক্রিপ্ট, এক বা দুটি পরিষেবা এবং কিছু সতর্ক অডিও টুইক যোগ করুন, এবং আপনার পকেটে রাখা একটি স্মার্ট স্পিকার থাকবে যা আপনার নিয়ম মেনে চলে।

চলুন, আপনাকে শূন্য থেকে পাই-এর সাথে কথা বলার দিকে নিয়ে যাই, সাধারণ ঝামেলা ছাড়াই। আমরা যন্ত্রাংশ, সেটআপ, কোড, তুলনা, গোটা জিনিসপত্র... পুরো বুরিটো নিয়ে আলোচনা করব। 🌯

এর পরে আপনি যে প্রবন্ধগুলি পড়তে পছন্দ করতে পারেন:

🔗 কীভাবে কার্যকরভাবে AI অধ্যয়ন করবেন
একটি অধ্যয়ন রোডম্যাপ তৈরি করুন, প্রকল্প অনুশীলন করুন এবং অগ্রগতি ট্র্যাক করুন।

🔗 কিভাবে একটি এআই কোম্পানি শুরু করবেন
সমস্যা যাচাই করুন, MVP তৈরি করুন, দল তৈরি করুন, প্রাথমিক গ্রাহকদের সুরক্ষিত করুন।

🔗 আরও উৎপাদনশীল হতে AI কীভাবে ব্যবহার করবেন
রুটিন কাজগুলি স্বয়ংক্রিয় করুন, কর্মপ্রবাহকে সুবিন্যস্ত করুন এবং সৃজনশীল আউটপুট বৃদ্ধি করুন।

🔗 আপনার ব্যবসায় AI কীভাবে অন্তর্ভুক্ত করবেন
উচ্চ-প্রভাবশালী প্রক্রিয়াগুলি চিহ্নিত করুন, পাইলট বাস্তবায়ন করুন, ROI পরিমাপ করুন, স্কেল করুন।


রাস্পবেরি পাই দিয়ে কী করলে একটি ভালো DIY AI সহকারী তৈরি হয় ✅

  • ডিফল্টরূপে ব্যক্তিগত - যেখানে সম্ভব অডিও স্থানীয় রাখুন। ডিভাইসে কী থাকবে তা আপনি সিদ্ধান্ত নিন।

  • মডুলার - লেগোর মতো উপাদানগুলি অদলবদল করুন: ওয়েক ওয়ার্ড ইঞ্জিন, এএসআর, এলএলএম, টিটিএস।

  • সাশ্রয়ী মূল্যের - বেশিরভাগই ওপেন সোর্স, কমোডিটি মাইক, স্পিকার এবং একটি পাই।

  • হ্যাকযোগ্য - হোম অটোমেশন, ড্যাশবোর্ড, রুটিন, কাস্টম দক্ষতা চান? সহজ।

  • নির্ভরযোগ্য - পরিষেবা-পরিচালিত, বুট হয় এবং স্বয়ংক্রিয়ভাবে শোনা শুরু করে।

  • মজা - আপনি অডিও, প্রক্রিয়া এবং ইভেন্ট-চালিত ডিজাইন সম্পর্কে অনেক কিছু শিখবেন।

ছোট্ট টিপস: যদি আপনি রাস্পবেরি পাই ৫ ব্যবহার করেন এবং ভারী স্থানীয় মডেল চালানোর পরিকল্পনা করেন, তাহলে একটি ক্লিপ-অন কুলার দীর্ঘস্থায়ী লোডের মধ্যে সাহায্য করবে। (সন্দেহ থাকলে, পাই ৫ এর জন্য ডিজাইন করা অফিসিয়াল অ্যাক্টিভ কুলারটি বেছে নিন।) [1]


আপনার প্রয়োজনীয় যন্ত্রাংশ এবং সরঞ্জাম 🧰

  • রাস্পবেরি পাই : হেডরুমের জন্য পাই ৪ বা পাই ৫ সুপারিশ করা হয়।

  • মাইক্রোএসডি কার্ড : ৩২ জিবি+ সুপারিশকৃত।

  • ইউএসবি মাইক্রোফোন : একটি সাধারণ ইউএসবি কনফারেন্স মাইক দুর্দান্ত।

  • স্পিকার : USB অথবা 3.5 মিমি স্পিকার, অথবা একটি I2S amp HAT।

  • নেটওয়ার্ক : ইথারনেট অথবা ওয়াই-ফাই।

  • ঐচ্ছিক সুন্দর দিক: কেস, সক্রিয় কুলার , পুশ-টু-টকের জন্য পুশ বোতাম, LED রিং। [1]

অপারেটিং সিস্টেম এবং বেসলাইন সেটআপ

  1. রাস্পবেরি পাই ওএস ফ্ল্যাশ করুন । আপনার পছন্দের প্রিসেট দিয়ে বুটেবল মাইক্রোএসডি পাওয়ার এটি সহজ উপায়। [1]

  2. বুট করুন, নেটওয়ার্কে সংযোগ করুন, তারপর প্যাকেজ আপডেট করুন:

sudo apt আপডেট && sudo apt আপগ্রেড -y
  1. অডিও বেসিক raspi-config এর মাধ্যমে ডিফল্ট আউটপুট, লেভেল এবং ডিভাইস সেট করতে পারেন । USB এবং HDMI অডিও বিভিন্ন মডেলে সমর্থিত; ব্লুটুথ সহ মডেলগুলিতে ব্লুটুথ আউটপুট উপলব্ধ। [1]

  2. ডিভাইসগুলি যাচাই করুন:

আরেকর্ড -l aplay -l

তারপর ক্যাপচার এবং প্লেব্যাক পরীক্ষা করুন। যদি লেভেল অদ্ভুত মনে হয়, তাহলে মাইককে দোষারোপ করার আগে মিক্সার এবং ডিফল্ট পরীক্ষা করুন।

 

এআই রাস্পবেরি পাই

এক নজরে স্থাপত্য 🗺️

একটি বুদ্ধিমান DIY AI সহকারী দেখতে এরকম:

ওয়েক ওয়ার্ড → লাইভ অডিও ক্যাপচার → ASR ট্রান্সক্রিপশন → ইনটেন্ট হ্যান্ডলিং বা LLM → রেসপন্স টেক্সট → TTS → অডিও প্লেব্যাক → MQTT বা HTTP এর মাধ্যমে ঐচ্ছিক অ্যাকশন।

  • ওয়েক ওয়ার্ড : পোর্কুপাইন ছোট, নির্ভুল এবং প্রতি-কীওয়ার্ড সংবেদনশীলতা নিয়ন্ত্রণের মাধ্যমে স্থানীয়ভাবে চলে। [2]

  • ASR : Whisper হল একটি বহুভাষিক, সাধারণ-উদ্দেশ্যপূর্ণ ASR মডেল যা ~680k ঘন্টার উপর প্রশিক্ষিত; এটি উচ্চারণ/পটভূমির শব্দের জন্য শক্তিশালী। ডিভাইসে ব্যবহারের জন্য, whisper.cpp একটি সহজ C/C++ অনুমান পথ প্রদান করে। [3][4]

  • ব্রেন : আপনার পছন্দ - API এর মাধ্যমে একটি ক্লাউড LLM, একটি রুলস ইঞ্জিন, অথবা হর্সপাওয়ারের উপর নির্ভর করে স্থানীয় অনুমান।

  • TTS : পাইপার স্থানীয়ভাবে স্বাভাবিক বক্তৃতা তৈরি করে, যা সাধারণ হার্ডওয়্যারে দ্রুত প্রতিক্রিয়া জানাতে যথেষ্ট দ্রুত। [5]


দ্রুত তুলনা সারণী 🔎

টুল সেরা জন্য দামের মতো কেন এটি কাজ করে
সজারু জাগানো শব্দ সর্বদা শোনার ট্রিগার বিনামূল্যে স্তর + কম CPU, নির্ভুল, সহজ বাইন্ডিং [2]
হুইস্পার.সিপিপি পাই-তে স্থানীয় ASR ওপেন সোর্স ভালো নির্ভুলতা, CPU-বান্ধব [4]
দ্রুত-ফিসফিসিয়ে CPU/GPU তে দ্রুত ASR ওপেন সোর্স CTranslate2 অপ্টিমাইজেশন
পাইপার টিটিএস স্থানীয় বক্তৃতা আউটপুট ওপেন সোর্স দ্রুত কণ্ঠস্বর, অনেক ভাষা [5]
ক্লাউড এলএলএম এপিআই সমৃদ্ধ যুক্তি ব্যবহার ভিত্তিক ভারী কম্পিউট অফলোড করে
নোড-লাল সাজানো কর্মকাণ্ড ওপেন সোর্স ভিজ্যুয়াল ফ্লো, MQTT বান্ধব

ধাপে ধাপে তৈরি: আপনার প্রথম ভয়েস লুপ 🧩

আমরা ওয়েক ওয়ার্ডের জন্য পোর্কুপাইন, ট্রান্সক্রিপশনের জন্য হুইস্পার, রিপ্লাইয়ের জন্য একটি হালকা "ব্রেন" ফাংশন (আপনার পছন্দের LLM দিয়ে প্রতিস্থাপন করুন) এবং স্পিচের জন্য পাইপার ব্যবহার করব। এটি ন্যূনতম রাখুন, তারপর পুনরাবৃত্তি করুন।

১) নির্ভরতা ইনস্টল করুন

sudo apt install -y python3-pip portaudio19-dev sox ffmpeg pip3 install sounddevice numpy
  • পোর্কুপাইন: আপনার ভাষার জন্য SDK/বাইন্ডিংগুলি ধরুন এবং দ্রুত শুরু (অ্যাক্সেস কী + কীওয়ার্ড তালিকা + অডিও ফ্রেম → .প্রসেস ) অনুসরণ করুন। [2]

  • হুইস্পার (CPU-বান্ধব): বিল্ড whisper.cpp :

গিট ক্লোন https://github.com/ggml-org/whisper.cpp সিডি whisper.cpp && cmake -B বিল্ড && cmake --বিল্ড বিল্ড -j ./models/download-ggml-model.sh base.en ./build/bin/whisper-cli -m ./models/ggml-base.en.bin -f your.wav -otxt

উপরেরটি প্রকল্পের দ্রুত শুরুর প্রতিফলন। [4]

পাইথন পছন্দ করেন? faster-whisper (CTranslate2) প্রায়শই ছোট CPU গুলিতে ভ্যানিলা পাইথনের চেয়ে দ্রুত।

২) পাইপার টিটিএস সেট আপ করুন

git clone https://github.com/rhasspy/piper cd piper make # আপনার পছন্দের একটি ভয়েস মডেল ডাউনলোড করুন, যেমন, en_US-amy echo "হ্যালো সেখানে।" | ./piper --model voices/en/en_US-amy-medium.onnx --output_file hello.wav aplay hello.wav

পাইপার একাধিক ভয়েস/ভাষা বিকল্প সহ ডিভাইসে থাকা TTS-এর জন্য ডিজাইন করা হয়েছে। [5]

৩) পাইথনে একটি ন্যূনতম সহকারী লুপ

ইচ্ছাকৃতভাবে সংকুচিত: একটি ওয়েক ফ্রেজ (স্টাব) এর জন্য অপেক্ষা করে, রেকর্ড করে, whisper.cpp , একটি উত্তর (প্লেসহোল্ডার) তৈরি করে, তারপর পাইপারের মাধ্যমে কথা বলে। আপনার পছন্দের LLM বা রুল লজিক দিয়ে প্লেসহোল্ডারটি অদলবদল করুন।

import os, subprocess, wave import sounddevice as sd WAKE_WORD = "hey computer" # উৎপাদনে Porcupine এর জন্য অদলবদল [2] RECORD_SECONDS = 6 SAMPLE_RATE = 16000 CHANNELS = 1 WORKDIR = "/home/pi/assistant" ASR_BIN = "/home/pi/whisper.cpp/build/bin/whisper-cli" # [4] ASR_MODEL = "/home/pi/whisper.cpp/models/ggml-base.en.bin" PIPER_BIN = "/home/pi/piper/build/piper" # [5] PIPER_VOICE = "/home/pi/piper/voices/en/en_US-amy-medium.onnx" os.makedirs(WORKDIR, exist_ok=True) def record_wav(path, seconds=RECORD_SECONDS): অডিও = sd.rec(int(seconds * SAMPLE_RATE), samplerate=SAMPLE_RATE, channels=CHANNELS, dtype='int16') sd.wait() wave.open(path, 'wb') সহ w: w.setnchannels(CHANNELS); w.setsampwidth(2); w.setframerate(SAMPLE_RATE) w.writeframes(audio.tobytes()) def transcribe(path): cmd = [ASR_BIN, "-m", ASR_MODEL, "-f", path, "-otxt"] subprocess.run(cmd, check=True, cwd=WORKDIR) open(path.replace(".wav", ".txt"), "r", encoding="utf-8") f হিসেবে ব্যবহার করুন: f.read().strip() def generate_reply(prompt): if "weather" in prompt.lower(): return "আমি মেঘ দেখতে পাচ্ছি না, তবে ঠিক থাকতে পারে। যদি সম্ভব হয় তাহলে জ্যাকেট আনুন।" "আপনি বলেছেন: " + প্রম্পট def speak(text): proc = subprocess.Popen([PIPER_BIN, "--model", PIPER_VOICE, "--output_file", f"{WORKDIR}/reply.wav"], stdin=subprocess.PIPE) proc.stdin.write(text.encode("utf-8")); proc.stdin.close(); proc.wait() subprocess.run(["aplay", f"{WORKDIR}/reply.wav"], check=True) print("Assistant ready. test করার জন্য wake phrase টাইপ করুন।") while True: typed = input("> ").strip().lower() if typed == WAKE_WORD: wav_path = f"{WORKDIR}/input.wav" record_wav(wav_path) text = transcribe(wav_path) reply = generate_reply(text) print("User:", text); print("Assistant:", reply) speak(reply) else: print("loop পরীক্ষা করার জন্য wake phrase টাইপ করুন।")

আসল ওয়েক-ওয়ার্ড সনাক্তকরণের জন্য, পোর্কুপিনের স্ট্রিমিং ডিটেক্টর (কম CPU, প্রতি-কীওয়ার্ড সংবেদনশীলতা) একীভূত করুন। [2]


অডিও টিউনিং যা আসলে গুরুত্বপূর্ণ 🎚️

কিছু ছোট ছোট সমাধান আপনার সহকারীকে আরও ১০ গুণ বেশি স্মার্ট করে তুলবে:

  • মাইকের দূরত্ব : 30-60 সেমি অনেক USB মাইকের জন্য একটি ভালো দিক।

  • লেভেল : ইনপুট ক্লিপিং এড়িয়ে চলুন এবং প্লেব্যাক সুস্থ রাখুন; কোড ঘোস্ট তাড়া করার আগে রাউটিং ঠিক করুন। রাস্পবেরি পাই অপারেটিং সিস্টেমে, আপনি সিস্টেম টুল বা raspi-config এর । [1]

  • ঘরের শব্দগত বৈশিষ্ট্য : শক্ত দেয়াল প্রতিধ্বনি সৃষ্টি করে; মাইকের নিচে নরম মাদুর সাহায্য করে।

  • ওয়েক ওয়ার্ড থ্রেশহোল্ড : খুব সংবেদনশীল → ঘোস্ট ট্রিগার; খুব কঠোর → আপনি প্লাস্টিকের উপর চিৎকার করবেন। পোর্কুপাইন আপনাকে প্রতিটি কীওয়ার্ডের সংবেদনশীলতা পরিবর্তন করতে দেয়। [2]

  • থার্মাল : পাই ৫-এ দীর্ঘ ট্রান্সক্রিপশনগুলি টেকসই কর্মক্ষমতার জন্য অফিসিয়াল সক্রিয় কুলার থেকে উপকৃত হয়। [1]


খেলনা থেকে যন্ত্রপাতিতে যাওয়া: পরিষেবা, অটোস্টার্ট, স্বাস্থ্য পরীক্ষা 🧯

মানুষ স্ক্রিপ্ট চালাতে ভুলে যায়। কম্পিউটার ভালো হতে ভুলে যায়। আপনার লুপকে একটি পরিচালিত পরিষেবায় পরিণত করুন:

  1. একটি systemd ইউনিট তৈরি করুন:

[ইউনিট] বর্ণনা=DIY ভয়েস অ্যাসিস্ট্যান্ট After=network.target sound.target [পরিষেবা] ব্যবহারকারী=pi WorkingDirectory=/home/pi/assistant ExecStart=/usr/bin/python3 /home/pi/assistant/assistant.py পুনঃসূচনা=সর্বদা পুনঃসূচনাসেক=3 [ইনস্টল করুন] WantedBy=multi-user.target
  1. এটি সক্ষম করুন:

sudo cp assistant.service /etc/systemd/system/ sudo systemctl ডেমন-রিলোড sudo systemctl সক্ষম করুন --এখন সহকারী.service
  1. লগ লেজ:

journalctl -u সহকারী -f

এখন এটি বুট করার সময় শুরু হয়, ক্র্যাশ করার সময় পুনরায় চালু হয় এবং সাধারণত একটি যন্ত্রের মতো আচরণ করে। একটু বিরক্তিকর, অনেক ভালো।


দক্ষতা ব্যবস্থা: ঘরে বসেই এটিকে বাস্তবে কার্যকর করুন 🏠✨

একবার ভয়েস-ইন এবং ভয়েস-আউট ঠিক হয়ে গেলে, ক্রিয়াগুলি যোগ করুন:

  • ইন্টেন্ট রাউটার : সাধারণ কাজের জন্য সহজ কীওয়ার্ড রুট।

  • স্মার্ট হোম : MQTT-তে ইভেন্ট প্রকাশ করুন অথবা হোম অ্যাসিস্ট্যান্টের HTTP এন্ডপয়েন্টে কল করুন।

  • প্লাগইন : দ্রুত পাইথন ফাংশন যেমন set_timer , what_is_the_time , play_radio , run_scene

এমনকি ক্লাউড LLM লুপে থাকা সত্ত্বেও, গতি এবং নির্ভরযোগ্যতার জন্য প্রথমে সুস্পষ্ট স্থানীয় কমান্ডগুলিকে রুট করুন।


শুধুমাত্র লোকাল বনাম ক্লাউড অ্যাসিস্ট: বিনিময়ের কিছু দিক যা আপনি অনুভব করবেন 🌓

শুধুমাত্র স্থানীয়
সুবিধা: ব্যক্তিগত, অফলাইন, অনুমানযোগ্য খরচ।
অসুবিধা: ছোট বোর্ডে ভারী মডেলগুলি ধীর হতে পারে। হুইস্পারের বহুভাষিক প্রশিক্ষণ ডিভাইসে বা কাছাকাছি সার্ভারে রাখলে এটিকে শক্তিশালী করতে সাহায্য করে। [3]

ক্লাউড সহায়তা
সুবিধা: শক্তিশালী যুক্তি, বৃহত্তর প্রসঙ্গ উইন্ডো।
অসুবিধা: ডেটা ডিভাইস, নেটওয়ার্ক নির্ভরতা, পরিবর্তনশীল খরচ।

একটি হাইব্রিড প্রায়শই জয়ী হয়: wake word + ASR local → যুক্তির জন্য একটি API কল করুন → TTS local। [2][3][5]


সমস্যা সমাধান: অদ্ভুত গ্রেমলিন এবং দ্রুত সমাধান 👾

  • ওয়েক ওয়ার্ডের মিথ্যা ট্রিগার : সংবেদনশীলতা কমিয়ে দিন অথবা অন্য একটি মাইক ব্যবহার করে দেখুন। [2]

  • ASR ল্যাগ : একটি ছোট Whisper মডেল ব্যবহার করুন অথবা -j --config Release সহ whisper.cpp । [4]

  • চপি টিটিএস : সাধারণ বাক্যাংশগুলি আগে থেকে তৈরি করুন; আপনার অডিও ডিভাইস এবং নমুনা হার নিশ্চিত করুন।

  • কোন মাইক সনাক্ত করা যায়নি : arecord -l এবং মিক্সার পরীক্ষা করুন।

  • থার্মাল থ্রটলিং : টেকসই কর্মক্ষমতার জন্য Pi 5-এ অফিসিয়াল অ্যাক্টিভ কুলার ব্যবহার করুন। [1]


নিরাপত্তা ও গোপনীয়তা সংক্রান্ত নোট যা আপনার আসলে পড়া উচিত 🔒

  • APT ব্যবহার করে আপনার Pi আপডেট রাখুন।

  • যদি আপনি কোনও ক্লাউড এপিআই ব্যবহার করেন, তাহলে আপনি যা পাঠান তা লগ করুন এবং প্রথমে স্থানীয়ভাবে ব্যক্তিগত বিটগুলি সম্পাদনা করার কথা বিবেচনা করুন।

  • সর্বনিম্ন সুবিধা সহ পরিষেবাগুলি চালান; প্রয়োজন না হলে ExecStart-এ sudo

  • অতিথিদের জন্য বা নীরব সময়ের জন্য একটি স্থানীয়-কেবল মোড


বিল্ড ভেরিয়েন্ট: স্যান্ডউইচের মতো মিক্স অ্যান্ড ম্যাচ করুন 🥪

  • অতি-স্থানীয় : Porcupine + whisper.cpp + Piper + সহজ নিয়ম। ব্যক্তিগত এবং শক্তিশালী। [2][4][5]

  • স্পিডি ক্লাউড অ্যাসিস্ট : পোর্কুপাইন + (ছোট স্থানীয় হুইস্পার বা ক্লাউড ASR) + TTS স্থানীয় + ক্লাউড LLM।

  • হোম অটোমেশন সেন্ট্রাল : রুটিন, দৃশ্য এবং সেন্সরের জন্য নোড-রেড বা হোম অ্যাসিস্ট্যান্ট ফ্লো যোগ করুন।


দক্ষতার উদাহরণ: MQTT এর মাধ্যমে আলো জ্বালানো 💡

mqtt হিসাবে paho.mqtt.client আমদানি করুন MQTT_HOST = "192.168.1.10" TOPIC = "home/livingroom/light/set" def set_light(state: str): client = mqtt.Client() client.connect(MQTT_HOST, 1883, 60) payload = "ON" if state.lower().startswith("on") else "OFF" client.publish(TOPIC, payload, qos=1, retain=False) client.disconnect() # if "turn on the lights in text: set_light("on")

"বসার ঘরের বাতি জ্বালাও" এর মতো একটি ভয়েস লাইন যোগ করুন, এবং আপনি একজন জাদুকরের মতো অনুভব করবেন।


কেন এই স্ট্যাকটি বাস্তবে কাজ করে 🧪

  • ছোট বোর্ডে জাগ্রত শব্দ সনাক্তকরণে সজারু দক্ষ এবং নির্ভুল, যা সর্বদা শোনা সম্ভব করে তোলে। [2]

  • হুইস্পারের বিশাল, বহুভাষিক প্রশিক্ষণ এটিকে বিভিন্ন পরিবেশ এবং উচ্চারণে দক্ষ করে তোলে। [3]

  • whisper.cpp সেই শক্তিকে Pi এর মতো CPU-কেবল ডিভাইসে ব্যবহারযোগ্য রাখে। [4]

  • পাইপার ক্লাউড টিটিএস-এ অডিও প্রেরণ না করেই দ্রুত প্রতিক্রিয়া বজায় রাখে। [5]


অনেক লম্বা, পড়িনি।

ওয়েক ওয়ার্ডের জন্য পোর্কুপাইন, ASR এর জন্য হুইস্পার ( whisper.cpp একটি মডুলার, ব্যক্তিগত DIY AI সহকারী । এটি একটি systemd পরিষেবা হিসাবে মুড়িয়ে দিন, অডিও টিউন করুন এবং MQTT বা HTTP অ্যাকশনে তার ব্যবহার করুন। এটি আপনার ধারণার চেয়ে সস্তা এবং এর সাথে বসবাস করা অদ্ভুতভাবে আনন্দদায়ক। [1][2][3][4][5]


তথ্যসূত্র

  1. রাস্পবেরি পাই সফটওয়্যার এবং কুলিং - রাস্পবেরি পাই ইমেজার (ডাউনলোড এবং ব্যবহার) এবং পাই ৫ অ্যাক্টিভ কুলার পণ্যের তথ্য

  2. পোর্কুপাইন ওয়েক ওয়ার্ড - SDK এবং দ্রুত শুরু (কীওয়ার্ড, সংবেদনশীলতা, স্থানীয় অনুমান)

  3. হুইস্পার (এএসআর মডেল) – বহুভাষিক, শক্তিশালী এএসআর প্রশিক্ষণপ্রাপ্ত ~৬৮০,০০০ ঘন্টা

    • র‍্যাডফোর্ড এবং অন্যান্যরা, বৃহৎ-স্কেল দুর্বল তত্ত্বাবধানের মাধ্যমে শক্তিশালী বক্তৃতা স্বীকৃতি (হুইস্পার): আরও পড়ুন

  4. whisper.cpp – CPU-বান্ধব CLI এবং বিল্ড ধাপগুলির সাথে হুইস্পার ইনফারেন্স

  5. পাইপার টিটিএস - একাধিক কণ্ঠস্বর/ভাষা সহ দ্রুত, স্থানীয় নিউরাল টিটিএস

অফিসিয়াল এআই অ্যাসিস্ট্যান্ট স্টোরে সর্বশেষ এআই খুঁজুন

আমাদের সম্পর্কে


ব্লগে ফিরে যান