هدف اصلی این ارائه آشنایی دانشجویانی که به این بحث علاقه بسیاری دارند ولی دانش پایه ندارند و یا نمی دانند از کجا شروع کنند می باشد.
گرچه در این ارائه هیچ نو آوری دیده نمیشود ولی فکر میکنم برای باز شدن ذهن دانشجویان در زمینه پردازش زبان طبیعی انشالله موثر خواهد بود.
این ارائه شامل مطالبی جهت شناخت اصطلاحات و اطلاعات پیش نیاز اصوات و روش های دریافت صوت و همچنین پردازش و تشخیص آن می باشد.
همچنین پیاده سازی پروژه نیز در بستر دات نت بدون استفاده از هیچ گونه ابزار جانبی انجام شده است.
تا جای ممکن سعی شده تا مطالب با بیانی ساده آماده شوند و از همه مهمتر از عنوان مطالب ریاضی و آمار اجتناب شده است.
به احتمال زیاد دوستان و اساتید اشکالات و کاستی های بسیار زیادی در این پایان نامه خواهند یافت که پیشاپیش از این بابت عذر خواهی نموده و از آنان درخواست یاری دارم.
مستندات آموزشی :
http://www.4shared.com/document/bYLvWGsa/VR_Thesis.html
کد های سورس به زبان C# :
http://www.4shared.com/file/fKAHtCf5/VoiceRecognition_-_Sources.html
فایلهای اجرایی :
http://www.4shared.com/file/5qJhLcVD/Executables.html
لطفا قبل به اجرا در آوردن فایلهای اجرایی نگاهی به مستندات بیندازید.
از انجایی که دریافت نمونه های صوتی از طریق Direct Sound صورت گرفته،
ممکن است که نگارش آن با نگارش موچود در رایانه شما مقایرت داشته باشد و در اجرا به مشکل مواجه شوید.
بخش آموزش شامل مباحث :
- انواع نمودار های ترسیم صدا (دامنه زمان، دامنه فرکانس یا اسپکتروم و اسپکتروگرام)
- صداهای هنچار و ناهنجار
- انواع موج ها
- دستگاه شنواییی و تکلم انسان
- نمونه گیری صوتی
- تبدیل سریع فوریه (FFT)
- طول پنجره در تبدیل فوریه
- توابع پنجره (Window Function)
- باند پهن و باند باریک (Wide Band و Narrow Band)
- فرکانس پایه و سازنده (Fundamental Frequency و Formants)
- fft bin
- تشخیص صدا، تشخیص حروف، حروف صدا دار و بی صدا
- تشخیص زیری و بمی صدا
- جداسازی (Segmentation)
- تشخیص صحبت و سکوت
- نرخ عبور از صفر (ZCR)
دوستان در صورت داشتن هرگونه ابهام، اصلاحات، پیشنهادات و یا در صورت مقدور به اشتراک گذاری دانش و دست آورد های جدید لطفا با پست الکترونیکی بنده به نشانی زیر ارتباط برقرار نمایید:
ghominejad@gmail.com
گرچه در این ارائه هیچ نو آوری دیده نمیشود ولی فکر میکنم برای باز شدن ذهن دانشجویان در زمینه پردازش زبان طبیعی انشالله موثر خواهد بود.
این ارائه شامل مطالبی جهت شناخت اصطلاحات و اطلاعات پیش نیاز اصوات و روش های دریافت صوت و همچنین پردازش و تشخیص آن می باشد.
همچنین پیاده سازی پروژه نیز در بستر دات نت بدون استفاده از هیچ گونه ابزار جانبی انجام شده است.
تا جای ممکن سعی شده تا مطالب با بیانی ساده آماده شوند و از همه مهمتر از عنوان مطالب ریاضی و آمار اجتناب شده است.
به احتمال زیاد دوستان و اساتید اشکالات و کاستی های بسیار زیادی در این پایان نامه خواهند یافت که پیشاپیش از این بابت عذر خواهی نموده و از آنان درخواست یاری دارم.
مستندات آموزشی :
http://www.4shared.com/document/bYLvWGsa/VR_Thesis.html
کد های سورس به زبان C# :
http://www.4shared.com/file/fKAHtCf5/VoiceRecognition_-_Sources.html
فایلهای اجرایی :
http://www.4shared.com/file/5qJhLcVD/Executables.html
لطفا قبل به اجرا در آوردن فایلهای اجرایی نگاهی به مستندات بیندازید.
از انجایی که دریافت نمونه های صوتی از طریق Direct Sound صورت گرفته،
ممکن است که نگارش آن با نگارش موچود در رایانه شما مقایرت داشته باشد و در اجرا به مشکل مواجه شوید.
بخش آموزش شامل مباحث :
- انواع نمودار های ترسیم صدا (دامنه زمان، دامنه فرکانس یا اسپکتروم و اسپکتروگرام)
- صداهای هنچار و ناهنجار
- انواع موج ها
- دستگاه شنواییی و تکلم انسان
- نمونه گیری صوتی
- تبدیل سریع فوریه (FFT)
- طول پنجره در تبدیل فوریه
- توابع پنجره (Window Function)
- باند پهن و باند باریک (Wide Band و Narrow Band)
- فرکانس پایه و سازنده (Fundamental Frequency و Formants)
- fft bin
- تشخیص صدا، تشخیص حروف، حروف صدا دار و بی صدا
- تشخیص زیری و بمی صدا
- جداسازی (Segmentation)
- تشخیص صحبت و سکوت
- نرخ عبور از صفر (ZCR)
دوستان در صورت داشتن هرگونه ابهام، اصلاحات، پیشنهادات و یا در صورت مقدور به اشتراک گذاری دانش و دست آورد های جدید لطفا با پست الکترونیکی بنده به نشانی زیر ارتباط برقرار نمایید:
ghominejad@gmail.com
دیدگاه