اطلاعیه

Collapse
No announcement yet.

دو اسلاید برای آشنایی با پردازش های صدا و پیاده سازی الگوریتم های هوش مصنوعی با میکروکنترلرهای کم توان

Collapse
X
 
  • فیلتر
  • زمان
  • Show
Clear All
new posts

    دو اسلاید برای آشنایی با پردازش های صدا و پیاده سازی الگوریتم های هوش مصنوعی با میکروکنترلرهای کم توان

    دو مجموعه اسلاید مربوط به "پیاده سازی الگوریتم های تشخیص واژگان محدود
    روی سخت افزارهای کم توان" (پایان نامه بنده)
    اسلاید نخست : اهداف، شکل کلی سامانه، ساختار سخت افزار
    اسلاید دوم : استخراج ویژگی، بهینه سازی الگوریتمها

    بصورت خلاصه، با یه کنترلر کم توان (یکی از ارزونترین میکروکنترلرهای STM32 ، یعنی STM32F030K6)، میکروفن و بدون حافظه اضافی، واژگان گفته شده (با حداکثر طول یک ثانیه) رو از بین حداکثر 100 واژه "یاد گرفته" تشخیص بده.

    تشخیص بصورت ریل تایم هست. یعنی قرار نیست بعد از تموم شدن ضبط واژه، تازه پردازش شروع بشه. همزمان با شنیدن واژه، الگوریتم شروع به تشخیص میکنه (الگوریتم viterbi رو HMM). سخت افزار انتخاب شده، انقدر منابع کمی داره که حتا نمیتونه صدای ضبط شده رو کامل تو رمش نگه داره. به همین دلیل این پژوهش میتونه با ارزش باشه بخاطر منابع بسیار محدود.

    استخراج ویژگی به روش MFCC انجام میشه که برای صدای انسان تا حدود زیادی دقیقه. این روش شامل تبدیل فوریه واقعی گسسته (RFFT) ، فیلتر بالاگذر، پنجره، تبدیل کسینوس گسسته و عملیات دیگه هست که هر کدوم از اینها یه چلنج و یه کار با ارزش هستن. مخصوصا زمانی که رو پردازنده گفته شده اجرا بشن و زمان کم براشون صرف بشه.

    به عنوان نمونه، تبدیل فوریه گسسته واقعی رو 256 نمونه 8 بیتی، فقط 1.2 میلی ثانیه زمان برده. با پردازنده 45MIPS بدون واحد ضرب سخت افزاری (هر ضرب 32 کلاک، بدترین حالت ممکن برای یه پردازنده 32 بیت) و واحد محاسبات اعشار.

    اسلاید نخست، مقدمه :
    https://my.pcloud.com/publink/show?code=XZwa57XZ6PsbbPFOTGYWpe45r8AL0J4cMpOX
    اسلاید دوم، استخراج ویژگی و MFCC :
    https://my.pcloud.com/publink/show?code=XZGa57XZ0SYNMvHvpCf9UtyvMpfwFpQzi6h7
    Si vis pacem, para bellum

لطفا صبر کنید...
X