اطلاعیه

Collapse
No announcement yet.

ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

Collapse
X
 
  • فیلتر
  • زمان
  • Show
Clear All
new posts

    ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

    با سلام خدمت دوستان محترم
    فرض بفرمایید برای یکه مساله کلاسه بندی سیگنال گفتار برای استخراج ویژگی و پیش پردازش هر سیگنال داده رو به صد فریم تبدیل کردیم و از هر فریم سه ویژگی گرفتیم به عبارت دیگه به ازای هر فریم سه عدد به عنوان ویژگی اختصاص دادیم. حالا در دیتابیسمون برای هر کلاس سه گوینده که ۱۵ جمله مختلف رو ادا کرده اند وجود داره. یعنی برای مثلا کلاس یک ۱۵*۳ سیگنال وجود داره. هر سیگنال صد فریم و به هر فریم سه عدد نسبت میدهیم. الان دقیقا ورودیهای شبکه عصبی برای تشخیص چی هست و تعدادشون چقدره؟ oo:

    #2
    پاسخ : ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

    سلام.
    متوجه نشدم کلاس ها چی هستن ولی فکر می کنم اگه از شبکه عصبی معمولی استفاده می کنی 3*100 گره ورودی داری. چون سیگنال زمانی داری میتونی از TDNN هم استفاده کنی که در این شبکه گره ها، دارای ترتیب هستند و گره های دور از هم در لایه میانی با هم ارتباطی ندارند و برای کارهای صوت و دستنوشته و کلاً سیگنالهای زمانی/مکانی استفاده میشه. فقط نمیدونم میشه بیشتر از یک ویژگی داشت یا نه. در صورتی که فقط یک ویژگی بتونی بهش بدی میتونی از سه TDNN موازی استفاده کنی که هر کدوم برای یکی از ویژگی ها هستن و خروجی اون ها رو (کلاسها) رو به یک کلاسیفایر دیگه بدی.
    لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
    لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
    با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
    اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
    يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

    دیدگاه


      #3
      پاسخ : ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

      هفت کلاس احساس وجود داره. احساس در گفتار.
      البته من تصور میکردم باید فریم بندی صورت بگیره اما ظاهرا ویژگی از کل سیگنال گرفته شده یعنی هر سیگنال ۳ ویژگی ازش گرفته شده.
      اما در عین حال در صورتی که فریمآ‌بندی وجود داشت با وجود ۴۵۰ سیگنال ماتریس ورودی شبکه بنا به صحبت شما ۳۰۰*۴۵۰ میشد. یعنی ۳۰۰ گره ورودی.
      این عد خیلی بزرگ نیست؟ oo:

      دیدگاه


        #4
        پاسخ : ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

        تعداد گره های ورودی و خروجی شبکه عصبی به مسأله شما بستگی داره و مثل تعداد لایه های مخفی یا تعداد گره های لایه مخفی نیست که خودتون تعیین کنید.
        تعداد ورودی مساوی با طول بردار ویژگی است اگه فریم بندی نداشته باشی میشه فقط 3 گره و اگه فریم بندی داشته باشی میشه تعداد فریم ها ضرب در 3.
        در صورتی که تعداد ورودی ها زیاد شد باید راهی پیدا کنی که تعدادش رو کم کنی مثلاً فریم ها رو بزرگ تر کنی یا از هر فریم تعداد کمتری ویژگی استخراج کنی یا ... .
        معمولاً در تعیین پارامترهای شبکه عصبی استفاده از سعی و خطا راحت ترین راهه.
        لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
        لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
        با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
        اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
        يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

        دیدگاه

        لطفا صبر کنید...
        X