اطلاعیه

Collapse
No announcement yet.

شناسایی واج های مصوت با مدل Hmm

Collapse
X
 
  • فیلتر
  • زمان
  • Show
Clear All
new posts

    شناسایی واج های مصوت با مدل Hmm

    سلام.در مورد این مدل اطلاعاتی میخواستم و اینکه چگونه این کار انجام میشه؟
    هرگز توان خودت را در تغيير دادن خويش،دست كم نگير!
    هرگز توان خودت را در تغيير دادن ديگران،دست بالا نگير!

    http://www.eca.ir/forum2/index.php?topic=112772.0

    #2
    پاسخ : شناسایی واج های مصوت با مدل Hmm

    سلام.
    این معتبرترین مرجع درباره HMM و کاربردش توی صوته.
    لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
    لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
    با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
    اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
    يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

    دیدگاه


      #3
      پاسخ : شناسایی واج های مصوت با مدل Hmm

      بردار های ویژگی در مدل HMM چیا هستند؟
      TIMIT دیتابیس تشخیص گفتار هست؟
      هرگز توان خودت را در تغيير دادن خويش،دست كم نگير!
      هرگز توان خودت را در تغيير دادن ديگران،دست بالا نگير!

      http://www.eca.ir/forum2/index.php?topic=112772.0

      دیدگاه


        #4
        پاسخ : شناسایی واج های مصوت با مدل Hmm

        شما باید بردار ویژگی رو با توجه به مسأله و جنس داده تعیین کنید، بردار ویژگی استخراج شده برای مدل HMM با بردار ویژگی که در سایر روش های مثل شبکه عصبی یا SVM و ... استفاده میشه فرقی نداره (تنها تفاوت در اینه که طول بردار ویژگی برای HMM میتونه متغیر باشه)، این بردار ویژگی به عنوان مشاهده به ورودی HMM داده میشه.
        TIMIT یک دیتابیس گفتار هست که میتونه برای شناسایی هم استفاده بشه.
        لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
        لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
        با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
        اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
        يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

        دیدگاه


          #5
          پاسخ : شناسایی واج های مصوت با مدل Hmm

          سلام
          1)یعنی من اول باید برای6 واج مصوت موجود بردارهای ویإ¾گیشون رو از طریق mfcc .LPCیا کپستروم و...استخراج کنم و بعد با مدلی که HMM در اختیار قرار میده تشخیص واج صورت بگیره؟درست فهمیدم؟
          2)در صورتیکه از دیتابیس ها استفاده کنیم که دیگه بردارهای ویإ¾إ¾إ¾إ¾إ¾إ¾إ¾ژگی استخراج شده هستند و فقط باید تشخیص بامدل
          اماری صورت بگیره؟
          یعنی منظورم اینه اگر از دیتابیسها استفاده کنیم چه فرقی میکنه(بجز اعتبارشون)؟دیگه اونها که بردار ویإ¾گی لازم نداره استخراج کنیم نه؟
          3)مثل پردازش تصویر کتاب یا منبعی وجود داره که دستورات متلب که در پردازش گفتار بکار میروند،عنوان شده باشه؟
          هرگز توان خودت را در تغيير دادن خويش،دست كم نگير!
          هرگز توان خودت را در تغيير دادن ديگران،دست بالا نگير!

          http://www.eca.ir/forum2/index.php?topic=112772.0

          دیدگاه


            #6
            پاسخ : شناسایی واج های مصوت با مدل Hmm

            نوشته اصلی توسط hasting_m
            3)مثل پردازش تصویر کتاب یا منبعی وجود داره که دستورات متلب که در پردازش گفتار بکار میروند،عنوان شده باشه؟
            بفرما:
            http://www.ee.ic.ac.uk/hp/staff/dmb/.../voicebox.html
            1: اللهم صل علي محمد و آل محمد و عجل فرجهم و ...
            2: دانش بهتره يا ثروت؟ بدون شعور هيچکدوم!
            3: دلا معاش چنان کن که گر بلغزد پاي *** فرشته‌ات به دو دست دعا نگه دارد (حافظ)

            دیدگاه


              #7
              پاسخ : شناسایی واج های مصوت با مدل Hmm

              نوشته اصلی توسط hasting_m
              سلام
              1)یعنی من اول باید برای6 واج مصوت موجود بردارهای ویإ¾گیشون رو از طریق mfcc .LPCیا کپستروم و...استخراج کنم و بعد با مدلی که HMM در اختیار قرار میده تشخیص واج صورت بگیره؟درست فهمیدم؟
              2)در صورتیکه از دیتابیس ها استفاده کنیم که دیگه بردارهای ویإ¾إ¾إ¾إ¾إ¾إ¾إ¾ژگی استخراج شده هستند و فقط باید تشخیص بامدل
              اماری صورت بگیره؟
              یعنی منظورم اینه اگر از دیتابیسها استفاده کنیم چه فرقی میکنه(بجز اعتبارشون)؟دیگه اونها که بردار ویإ¾گی لازم نداره استخراج کنیم نه؟
              1) بله باید اول استخراج ویژگی انجام بدین تا بتونید HMM رو آموزش بدین.
              2) من دیتابیسی که بردارهای ویژگی استخراج شده باشن ندیدم ولی اگه بردارهای ویژگی موجود باشن میتونید این کارو بکنید و یک مرحله از کارتون کم میشه.
              لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
              لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
              با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
              اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
              يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

              دیدگاه


                #8
                پاسخ : شناسایی واج های مصوت با مدل Hmm

                نوشته اصلی توسط هـادی
                2) من دیتابیسی که بردارهای ویژگی استخراج شده باشن ندیدم ولی اگه بردارهای ویژگی موجود باشن میتونید این کارو بکنید و یک مرحله از کارتون کم میشه.
                پس دیتابیسها چیو نشون میدند؟ویژگی هاشون رو بصورت بردار نشون نمیدند؟؟
                فیشر ایریس مگه خود بردار های ویژگی رو نشون نمیده؟؟اون بردار150*4مگه اون 4تا ویژگی برگها نبودند؟
                هرگز توان خودت را در تغيير دادن خويش،دست كم نگير!
                هرگز توان خودت را در تغيير دادن ديگران،دست بالا نگير!

                http://www.eca.ir/forum2/index.php?topic=112772.0

                دیدگاه


                  #9
                  پاسخ : شناسایی واج های مصوت با مدل Hmm

                  سلام.ممنون
                  من مشکلم پیدا کردن فایل نیست.ازین فایلهاکه متاسفانه انگلیسی هم هستند زیاد دارم،اگر ممکنه سوال زیر رو برام جواب بدید:
                  3.همین لینکی که برای دستورات متلب برام فرستادید از کجا اومده؟از کجا پیدا کردین؟اون سایت چیه؟میشه تو این یک مورد!بجای ماهی خود ماهی گیری رو بهم یاد بدید؟
                  2.این دیتابیس TIMIT و یاFarsdat خود واجها رو دارند یا بردارهای ویژگی شوو رو؟
                  من برای پروژم باید حتما از دینابیس استفاده کنم؟
                  4.فایلایی که خوندم،در HMM از گسسته و پیوسته بودن،میگفت.تفاوت پیوسته و گسسته در چیه؟برای تشخیص جمله از مدل پیوسته استفاده میشه و تشخیص واج یا کلمه منفصل از گسسته؟؟؟
                  5.مهم ترین سوالم:از ویکی پدیادر مورد مدل HMMخوندم .و چیز خاصی هم دستگیریم نشد.
                  الان مدل آماری رو برای تشخیص واج من باید چجورررررررررری بدست بیارم.همش فرمولای ریاضی گفته آخه چجوری؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟
                  از یک فرمول چجوری من باید مدل یک واج رو بدست بیارم؟
                  چه ربطی به اونهمه فرمول داره آخه؟
                  هرگز توان خودت را در تغيير دادن خويش،دست كم نگير!
                  هرگز توان خودت را در تغيير دادن ديگران،دست بالا نگير!

                  http://www.eca.ir/forum2/index.php?topic=112772.0

                  دیدگاه


                    #10
                    پاسخ : شناسایی واج های مصوت با مدل Hmm

                    نوشته اصلی توسط hasting_m
                    3.همین لینکی که برای دستورات متلب برام فرستادید از کجا اومده؟از کجا پیدا کردین؟اون سایت چیه؟میشه تو این یک مورد!بجای ماهی خود ماهی گیری رو بهم یاد بدید؟
                    برای اینکه چنین چیزایی پیدا کنیم باید چند مورد رو رعایت کنیم:

                    - دونستن زبان تخصصی
                    که خب معمولا دانشجویان ارشد یا زبانشون خوبه
                    یا مجبور میشن که خوب بشه!

                    - دونستن کلمات کلیدی
                    در اینجا چیه؟
                    speech, processing, matlab, command

                    - استفاده از موتور جستجو
                    مثه google و yahoo و bing

                    - در برخی موارد استفاده از:
                    "ف.ی.ل....ش.ک.ن"

                    - و نکته ی مهم:
                    داشتن صبر و حوصله در جستجو!
                    شاید برخی مواقع نیاز باشه تا 20 - 30 صفحه از جستجوها رو نگاه بکنی!

                    اما معمولا: جوینده یانده بود

                    در این مورد عبارت زیر رو در google جستجو کردم:
                    speech processing matlab command
                    1: اللهم صل علي محمد و آل محمد و عجل فرجهم و ...
                    2: دانش بهتره يا ثروت؟ بدون شعور هيچکدوم!
                    3: دلا معاش چنان کن که گر بلغزد پاي *** فرشته‌ات به دو دست دعا نگه دارد (حافظ)

                    دیدگاه


                      #11
                      پاسخ : شناسایی واج های مصوت با مدل Hmm

                      سلام. امیدوارم توضیحات این تاپیک و فایلهایی که گذاشتم بتونه کمکت کنه.
                      لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
                      لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
                      با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
                      اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
                      يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

                      دیدگاه


                        #12
                        پاسخ : شناسایی واج های مصوت با مدل Hmm

                        باز سوال دیگه ولی متفاوت
                        1)برای استخراج بردارها ویژگی در واج ها.مثلا من یه فایل دارم که افراد مختلف پشت سر هم حرف a رو تلفظ کردند.حالا ما که بردارهارو استخراج میکنیم،میاییم فریم بندی میکنیم.
                        تو هر فریم(مثلا512نقطه)لزوماصدای تلفظ کردن،یک نفر(داخل یک فریم) نیست درسته؟یعنی هر فریم مال یک نفر نیست؟ممکنه مال چند نفر باشه یا بالعکس چند تا فریم مال تلفظ واجِ یک نفر باشه.آری؟
                        بعبارت دیگه سوالم اینه که برای فریم بندیش باید ببینیم چند نفر تلفظ کرده!؟که به همون تعداد فریم تقسیم کنیم؟
                        2)یک نفر دیگه ای هم سوال پرسیده بود که کسی جواب نداده.همین بردارویژگی مفهومش چیه؟این اعداد چیو از صوت نشون میده؟
                        اگر ممکنه هر دو تا رو مجزا جواب بدین.یک دنیا سپاس
                        هرگز توان خودت را در تغيير دادن خويش،دست كم نگير!
                        هرگز توان خودت را در تغيير دادن ديگران،دست بالا نگير!

                        http://www.eca.ir/forum2/index.php?topic=112772.0

                        دیدگاه


                          #13
                          پاسخ : شناسایی واج های مصوت با مدل Hmm

                          اینو برای استخراج ویژگی ها توسط mfccنوشتم.کجاش اشتباهه؟ :sad:

                          clear all
                          clc
                          N=512;
                          r=0.25*N;
                          Num_frame=10;
                          [data,fs,n]=wavread('e1.wav'
                          data=data'
                          %Select first 10 frame from file
                          for i=1:Num_frame
                          x(i,=data((i-1)*(N-r)+1:i*N-(i-1)*r);
                          y(i,1)=x(i,1);
                          %Pre_emphasis
                          for j=2:N
                          y(i,j)=x(i,j)-0.97*x(i,j-1);
                          end
                          %multiple by hamming window
                          y(i,=hamming(N)'.*y(i,
                          mfsc(?)=log(abs(1125*log(1+(fft(y(i,)/700))));
                          c=dct(mfsc,13)

                          end
                          size(mfsc)
                          size(c)
                          هرگز توان خودت را در تغيير دادن خويش،دست كم نگير!
                          هرگز توان خودت را در تغيير دادن ديگران،دست بالا نگير!

                          http://www.eca.ir/forum2/index.php?topic=112772.0

                          دیدگاه


                            #14
                            پاسخ : شناسایی واج های مصوت با مدل Hmm

                            1) شما میخوای چه کاری انجام بدی؟
                            اگه تشخیص واج هست مثلاً این که واجی که داریم چی هست، در این صورت باید هر واج رو جدا کنید و ازش ویژگی استخراج کنید. مثلاً از واج a هر گوینده جدا بشه، بعد احتمالاً حذف سکوت لازم باشه و بعد فریم بندی (مثلاً هر 50 میلی ثانیه یک فریم با همپوشانی 50%) که از هر فریم یک بردار ویژگی استخراج میشه. تعداد عناصر بردارهای ویژگی باید مساوی باشه تا بعداً بشه اونها رو گروه بندی کرد(همون نمادسازی برای مدل مخفی مارکوف) ولی لازم نیست که تعداد فریم ها برای گوینده های مختلف یا واج های مختلف مساوی باشن.
                            2) در مورد ویژگی قبلاً یه جای دیگه توضیح دادم اگه پیدا کردم لینکشو میذارم.
                            3)الان MFCC یادم نیست ولی یه فایل که MFCC هم داخلشه توی انجمن گذاشتم که اونم باید بگردم لینکشو پیدا کنم. شاید این سوال رو دوستانی که بیشتر با صوت کار کردن بتونن جواب بدن.
                            لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
                            لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
                            با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
                            اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
                            يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

                            دیدگاه


                              #15
                              پاسخ : شناسایی واج های مصوت با مدل Hmm

                              2- http://www.eca.ir/forum2/index.php?topic=74977.msg450390;topicseen#msg45039 0
                              3- http://www.eca.ir/forum2/index.php?topic=73917.msg440820#msg440820
                              لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.
                              لطفاً سؤالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
                              با تمام وجود گناه کرديم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنيم چه مي کند؟"دکتر شريعتي"
                              اگر جايي که ايستاده ايد را نمي پسنديد، عوضش کنيد شما درخت نيستيد!! "پاسكال"
                              يا به اندازه ي آرزوهايت تلاش کن يا به اندازه تلاشت آرزو کن. "شکسپير"

                              دیدگاه

                              لطفا صبر کنید...
                              X