Int ern at i onal  Journ al of Ele ctrical  an d  Co mput er  En gin eeri ng   (IJ E C E)   Vo l.   10 ,  No.   2 A pr il   2020 , p p. 18 59 ~ 1867   IS S N: 20 88 - 8708 DOI: 10 .11 591/ ijece . v10 i 2 . pp1859 - 18 67          1859       Journ al h om e page http: // ij ece.i aesc or e.c om/i nd ex .ph p/IJ ECE   High  l evel speak er specif ic featu res m odeli ng  in au tomatic   speak er   recogniti on   s yste m       Sa t yan an d  Si ng h 1 ,  Pr agya  Singh 2   1 School  of El ec t ric a and   E lectr o nic s E ng ine er ing ,   Fij Nat ional  U nive rsit y ,   Fij Isl and     2 School  of   Publi Hea lt h   and   Pri m ar y   C are ,   Fij i N at ional  U niver sist y ,   Fiji   Island           Art ic le  In f o     ABSTR A CT    Art ic le  history:   Re cei ved   A p r   1 9 , 201 9   Re vised  Oct   2 9 ,   20 19   Accepte Nov 6 , 2 0 19       Spoken  words   c onve y   sev eral  l eve ls   of   informati on .   At   the  pr imar y   l evel,    the  spee ch  conv e y s   words   or   sp oken   m essage s,   but  at  th se con dar y   le v el ,     the   spe ec h   a lso  r eve a ls  informat i on  about  th spe ake rs.   Thi s   work  is  b ase o n   the   h igh - l eve l   spea ker - spec ific   fe at ure s   on  st at isti cal  spe ake r   m odel ing   te chn ique that  expr ess  the   cha r ac t eri sti sound  of  the   hum an  v oi ce.  Us ing  Hidden  Markov  m odel   (HM M),  Gauss ia m ixt ur m odel   (GM M),  and   Li n ear   Discriminant   An aly s is  (LDA)  m odel buil Aut om at ic   Speak er  Rec ognition   (AS R)  sy st em  t hat   are   comput at ion al   ine xpens ive   ca r ec ogn i ze   spe ake rs  reg ard l ess  of   wh at  is   said.  The  p erf orm anc e   of   th AS s y stem   is   ev al u at ed   for  cl e ar   spee ch   to   a   wide   r ang of   sp ee ch   qu alit y   using   a   stan dar TIMIT   spee ch   cor pus.   T he  AS eff i ci en c y   of   HM M,  GM M,  and   LDA  bas ed  m odeling  te chn ique   are   98 . 8%,   99 . 1%,   and   98. 6%  and  Equ al   Er ror  Ra te   ( E ER)  is   4 . 5% ,   4. 4%  and   4. 55 respe c ti v ely .   The   EE improvem ent   of   GM m odel ing   te chn ique   b ase d   AS sy st emcom par ed  with   H MM   and  LDA  is  4. 25%  and   8. 51%  r espe ctiv ely .   Ke yw or d s :   Au t om atic  sp e aker r ec ogniti on   (A SR )   Extrem le arn ing m achine  (EL M)   G aus sia m ixer  m od el   (G MM )   Hidden   m ark ov m od el   ( HM M)   Linear  discrim i nan t a naly sis  ( LD A )   S upport   v ect or  m achines  (S VM )   U ni ver sal   b ac kgr ound  m od el   (U BM )     Copyright   ©   202 0   Instit ut o f Ad vanc ed   Engi n ee r ing  and  S cienc e   Al l   rights re serv ed .   Corres pond in Aut h or :   Saty anand S i ngh,    School  of Elec tric al  an d El ect ronics E nginee rin g,   Fiji N at io nal  U niv e rsity , F iji  I sla nd.   Em a il : sat ya na nd.sin gh@ fnu.a c.f j       1.   INTROD U CTION   Most  of  AS R   app li cat ion   m od el ing   te ch niques  m ake  var i ou m at hem at ic al  assumpti ons  ab ou t   sp ea ker - sp eci fic  f eat ures .   I f   voic da ta   does   not  sat isfy  th ese  at trib utes,  incom plete ness  will   occ ur  at   ASR   m od el ing   sta ge T her e f or e,   th m at he m atical  m od el   fits  t he  featur e a nd  is   forced   to   der i ve   rec ogniti on  s cor e s   base on  the se  m od el an te s sp eec data.   Convertin au dio  segm ents  i nto  the   f unct io nal  par am et er,  after  t hat  m od el ing   proc ess  sta rted  in A SR. I AS R m od el ing   is  process f lo to   cat egories  al sp ea ker s b ase on   t hei r   char act e risti cs.  T he  m od el   shou l al s pro vi de  it s   m eaning   for  c om par iso with   unfam ilia s pea ker  ut te ra nces .   AS m od el in is  cal le as   r ob us wh e it s pe aker  s pecific  f eat ur e   cha racte rizat ion  proc es is  not  sig nific antly   aff ect ed   by  unwan te m al adie s,  al th ough  t he se  feat ur es   a re   i deal   i s uc fe at ur es   can   be  de sign e in  su c way  that  interspea ke dis crim inatio is  m axi m um then  no  in t rasp ea ker   var i at ion   exists  a nd  sim ple  m od el ing  m et ho ds  can   be   suffici ent.   I short   f or m th no n - ideal   pr op e rtie of  the   sp ea ke s pecif ic   featu re  e xtr act ion   ph a se  require   diff e re nt  c ompen sat ion  te ch niques  duri ng  the   A SR  m od el ing  ph a se  so   t hat  the   e f fect  of   the  dist urbanc va riat ion   pr esent  in   the  s peech  sig nal  c an  be  reduce duri ng  the  te sti ng   of  the  s peak e r   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 2 A pr i l 202 :   1859   -   1867   1860   recog niti on   process.   Most  of  the  AS m od el in te c hn i qu e do  dif fere n m at he m a tical   hypotheses   ab ou t   the  s peak e r - spe c ific   featu res.  If  ass um ed  pr op e rtie are   not  m e fr om   the   sp eec data,   then   we   are   ba sic al ly  pr ese ntin g flaws e ve n durin g t he ASR m od e li ng   ph a se.   The   no rm aliza ti on  of   sp ea ke r - s pecific   feat ures   can   reduce   these   pro blem to   s om exte nt,   but  not  com plete ly A a   res ult,  m at hem atical   m od el s   are   c om pel le to   a dopt   the   c har a ct erist ic an sp ea ker  recog niti on  sc ores  a re   obta ine base on   thes m od el a nd  te st  sp ee ch   data.   Th us ,   in   this   process,   t he  pro pe rtie of  detect in a rtifact are  i ntr oduce a nd  a   fa m ily  of   s c ore  s ta nd a rd iz at io te chn iq ues   has   been  pr opos e wh ic is  pro po se t com ple te   this  final  sta ge  m is m at ch  [ 1 ].   I esse nce,   the   dec li ne  i ac ou sti si gn al   a ff ect s   the  s peak e r - s pe ci fic  featu res,  patte rn s a nd  s cor es T heref ore,  it   is  im po rtant  to   im pr ov e   the   rob us tness   of  A SR   syst e m s in  al l th ree  dom ai ns . I t has  b ee m entione d rece ntly  that sp ea ker  m od el ing  tech niques  have im pro ved  and sc or nor m al iz ation  tech n iq ues  a re  no m uch  eff ect ive  [ 2 ].   Pr oba bili sti m od el in te ch ni qu e s uc as  GMM   an HMM   are   widely   u se f or  the   s peaker,   la ngua ge,  e m otion a nd  s peech  rec ognit ion .   I t he  pro bab il ist ic   m od el each  sp ea ke r /l angua ge/em ot ion   is  m odel ed  as   pro ba bili ty   s ource  with  a unknow bu fixed  pro ba bili ty  de ns it functi on.  T he  trai ning  ph ase   is  para m et e r   that  est i m a te the   pro ba bili ty   de ns it f unct ion   from   su f fici ent  num ber  of   trai ni ng  sam ples.  For  AS recog niti on t he   po s sibil it of   te st  utteranc es   on   t he  m od el   is  cal culat e d.   GMM  is  li near   com bin a ti on   of  m ul ti var ia te   G aussian  distri buti ons  that  sim ulate   ( ) .   GMM  c an  be   co nverte to  post  cl assifi er  usi ng  Ba ye sia r ules   [ 3] .   T her e   are   oth er   a dvanta ges,  s uc a be ing  a ble  t t r ai t he  m od el   for   la rg e   am ount   of  sp eec data  a nd  a da pt  it   to  t he  ne data  f or m at .   Wh e us in a   m od el   f or  A SR  a pp l ic at ion   s uch  a s   GMM,   the  s pea ker - in dep e ndent   U ni ver sal   B ack groun M odel   ( UBM)   first   use voic e   data   f or  trai ning.   UBM   represe nts  the  distrib ution  of  featur e   vect or s   ind e pe nd e nt  of  spe ake rs.   W hen   ne s pe aker   is  re gister ed  i n   the   AS R   syst em the  pa ram eter of  t he   bac kg r ound   m od el   are  a da pted   to   the  featu re  dist rib ution  of  the   ne w   sp ea ker .  T he  a dap ti ve  m od el   is t hen u se a a n   AS s pea ke r s m od el .   Stat ist ic al   L ang ua ge   M odel ing  ( LM)  is   the  sci e nce  of  buil ding  a   m od el   to  e stim a te   the  pri or   pro bab il it of   word   strin gs S ucc ess fu use   of  la ngua ge  m od el   to  m od el   the   r hythm   of   sp eake a nd   la ngua ge .   The   f undam ental   fr e quency   F o   and  e nergy profi le are  la beled   as d isc rete   cl a sses  a nd  the n m od el ed  usi ng two  bigram or   trig ram [ 4 ] Hidd en  E ven ts  LM  con ta in s pecial   word s   that  a ppear  i the   m od el ’s  N - gram In ste ad they   corres pond  to  t he  sta te   of  the  HMM  an ca be   use t sim ulate   la ng ua ge  e ve nts  s uch  as  bounda r ie of  un m ark e se nt ences.   Alte r nat ively these   ev ents  m ay   be  as so ci at ed  with   unnatu ral  poss ibil it ie fo r   ad justi ng   LM  (eg r hyth m fo oth e s ources  of   knowl edg e s pecial   ty pe  of   hidden   even LM  ca si m ulate   no nsm oo th   sp eec h by le tt i ng h i dd e e ve nt s m od ify  the  word h ist or [ 5 ].   Decisi on  tre es   are   al so  s uc cessf ul ly   us e i pros odic   m od el ing  f or  AS R   ap plica ti on   [ 6]   Th d eci sio t ree  m od el   “progress”   by  sys tem - gen er at ed  qu e sti on   t th sp ea ker   at   once.  T he  featu res  of     the  quest io ns  in  eac quest io a nd   the t he   thres holds   in  the  quest io ns  ( eg  no rm al iz ed   pitch   great er  tha thres ho l value pr e fer a bly  disti ng uis t he  cl a ss  of   no des  i t he  tree I the   t est   phase,   the   de ci sion   t ree  est i m at es  the  poste rio prob a bili ty   of  ea ch  cl ass   C   of  eac sam ple  X re sul ti ng   in   ( )   [ 7 ].   O ne  of  t he  m ai dr a w back s   of  decisi on  tre es  is  t he   greed buil proce s s:  at   eac ste p,  the   c om bin at i on  sel ect s   si ng le   be st  var ia ble  a nd   the  best  br ea kp oin t,  but  co ns id erin m ulti - step   pr e fet chin of  va riable  c ombinati ons  t ha n   good  resu lt Anothe r   disad va ntage   is  the   fa ct   that   con ti nu ous  vari ables  a re  im plici tly  discreti z ed  by  t he   pa rtit ion in p ro ce s a nd  inf or m at ion   is  lost  al ong  the   way.  T he  a dva ntage   of  decisi on  trees   f or  ot her  m achine  le arn i ng  m et ho ds  is  that   they   are  not  bl ack - box  m od el s,  but  can  easi ly   be  represe nted  as  r ules.  I m any  app li cat ion s these  m odel are  m or e i m po rtan t t han   disa d va nt ages,  s t hese  m o dels are  wi de ly  u sed  in  ASR  appli cat ion .   Discrim inant  m od el su c a A rtific ia N e ur al   N et w orks   (ANN)  [ 8 ]   an S up port  V ect or  M achi nes   (S VM are  al s us ed  f or   pros odic   m od el ing   [ 9 ] Dee Ne ura Network   ( DNN)   [ 10 ] E xtre m Learn in M achi ne  (EL M) an D NN - ELM   hav e   proved  us e fu for  pro sodic - ba sed   s peak e r ecognit ion   [ 11] .   The  S VM  m od el   is   an  alg or it hm ic  i m ple m entat io n o t he  idea  fr om  the stat ist ic al  learni ng t he or y  [1 2] a nd  focuses   on the   prob le m   of   c onstr ucting  consi ste nt  e stim at or   fr o m   the  sp eec data.  Mo del  perf orm ance  and   tra ining   set   est i m at ion  m et ho f or  unkn own   data   set   wh e only   m od el   ch aracte risti cs  a re  giv e Per f or m ance ?   Re gardin g   the  al gorithm the  s upport  ve ct or   m achine  e sta blishes  a optim al   separ at ion  bo unda ry  be tween  data  se ts  by   so lvi ng   t he  c onstrai ne quad ra ti op ti m iz ation   pro blem   [ 13 ].   By   us in diff e re nt  ke rn e functi ons,  dif fer e nt   degrees  of   nonl inearit y and  f l exibili ty  can  be  includ e in t he  m od el . S up port v ect or  m a chines  a re g ai ne f ro m   adv a nce sta ti sti cal   ideas  an d   can   cal culat the  ra ng of   gen e rali zat ion  error   for  the m so   we  ha ve   gaine consi der a ble  re search  i nterest  ov e the  past  f ew  ye ars.   T he  perform ance  of  oth e m achine  le arn in al go rithm s   equ al   to   or  be tt er  tha t hose   of   ot her  m ac hin e   le ar ning  al gorithm are   re ported   i t he   m edical   li te ratur e.     disa dv a ntag of   the   s uppor vect or  m achine  is   that   the   cl assifi cat ion  res ult  is  purely   di cho t om ou a nd   the re   is n o po ssi bili ty  o f  g i ving cla ss m e m ber sh ip   [ 14 ] .         Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       High leve l s pe aker speci fi c features  mo delin in  auto m atic spe aker   ( Saty anand Si ngh )   1861   2.   MO DELIN BASED  O P R OS ODY   IN   AU TO M ATI C   SPE AKE R RECO G N ITI ON   SYST EM   Pr oso dy  u se s   t he  a pprop riat m e tho t obta in  the  g l ob al   sta ti sti cs  of   the  s peak e r f undam ental   fr e qu e ncy    val ue  a nd  the   A S syst e m   recogn iz in the  ta sk .   The   dyna m ic of   t he     con t our  ref le ct ing    the  pe rson ta lkin g st yl has  be en s how n t be  able  to  help  the  sp ea ker   rec ogniti on   t he t ask.   T he    m otion   of   the  sp ea ker  is   m od el ed  by  fitt ing  piece wise  li nea m od e to  the     or bit  to  ob ta in   a   st yl iz ed    pro file .   Using   m edian  F   0,  the   sl ope  a nd  durati on   re present   eac li near    se gm ent.  T hese   f eat ur es   are   m od el e d   by  log - norm al  distrib ution,  norm al   distribu t ion a nd  s hift  expo nen ti al   di stribu ti on,  res pe ct ively In   order   t inv est igate   the   po s sibil it of  s peak e r   rec ogni ti on   us i ng  r hythm   and  idiom NI S i ntrod uc ed  e xten de da ta   ta sk   te le ph one  ta lk  base on  exc ha ng c orp us U nlike  tra diti on a sp eake rec ogniti on   ta s ks th exten ded   dat ta sk  pro vid es m ulti ple co m plete  session p la nes ( 4/8 /1 6 si des f or sp ea ke trai ning a nd test in the  ASR  syst e m   In  [ 15]   the   focus   is  on  i nv e sti gating  va rio us  pro sodic   fe at ur es.   F unda m ental   fr e que ncy  base on   segm ent  per i od  an pa us per i od.  Pe rio dic  c ha racteri sti cs,  or  w ord  c ha racter ist ic s,  te le phone  pe rio ds   a nd  pe rio seq uen ces   ha ve   bee us e to  m od el   the  pe riod.  I [ 16 ] dur at ion pit ch,  an e nergy  c har a ct erist ic are  ca lc ulate for  eac est im at ed  syl la ble  r egio n.   Syl la bl bounda ry  ob ta ined  f r om   th AS syst em Thes feat ures  are   qu a ntize d an d use to  for m  N - gram s call ed  N - gr am  b ase d sy ll able n on - unif or m  ex tract ion re gion  featu res.   In  [ 17 ] ,   co ntin uous  pro sodic   featur e wer e   m od el ed  us i ng  Jo i nt  Fact or  An al ysi (JFA f or  s pea ker  recog niti on .   T he   pro sodic   featur e   use is  the   pitch  a nd  e nerg pro file   over   unit of  sim il ar  syl la bles,  re pr es ente us in bases  of  Le gendr e   po ly no m ials.  Stand a r GMM  i us e f or  m od el ing.  I a dd it ion the  ef fe ct   of   the  s pea ker  an se ssio c ha nge  is   m od el ed   in   the   sam way  as   co nve ntion al   JF A.  Lege ndre  poly no m ia l   coeffic ie nts o f  p it ch  a nd  en er gy,  to gethe wi th  the  le ng t of  the  se gm ent,  con sti tute  a   13 - dim ension al   p r os ody   featur e  set f or  GMM an d fact or analy sis m od el ing [ 17] .     2.1 . Ei genvoic e   consi dera tio n in h id den m arkov m od el s   In  t he  sta nd a r ei ge n vo ic e   appr oach,  vo ic data   is  c ollec te f ro m   the   num ber   of  s pe ak ers   with     the   div e rse  sce nar i o Wh e ea ch  HMM  sta te   is   m od el ed  as  a   m ixtur of  Ga us sia distrib ut ion s set   of   spe aker - dep e ndent   HM Ms  are   f or m ed  from   each  s peak e r.  T he  s peak e r' voi ce   is  r ep rese nted   by  t he  super   vec to r   com po sed  of   the  co ncatenat ion   of   the  m ean  vect or of  al Gau ssia n   HMM  distr ibu ti ons.   T he r e fore,     the  i - th   s pea ke s uper vecto i com po se of  com po ne nts,   one  Ga us sia per  distri bu ti on,   an is   e xpre ssed   as     = [ 1 , , 2 , , . .  , ] , 2 . T he   sim i la rity  bet wee n a ny  t wo  s pea ker  s uper vecto rs     an   is  m easur e by  their  do pro duct  as foll ows.     , =  ,  = 1   (1)     Pr inci pal  com pone nt  ana ly sis  (P CA is  th en  pe rfor m ed  on   t he  trai ni ng  sp ea ke sup erv ect or   a nd     the r es ulti ng   ei gen vecto is   re ferred  t as  ei ge nvoice .   In   ord er to  ad a pt to  t he  ne s peak e r,  h is/ her  s uper vecto r   process  deals  with  li nea c om bin at ion   of  the  to p     ei gen voic es   = (  ) = [ { 1 , 2 , . } ] = 1 .   Usu al ly on ly   a   le ss  than  te e igen vo ic es  a re  ta ken   i nto   c on s iderati on  s th at   few   sec ond  of   a da ptati on   s peec will   be   require d.  T he   m at he m at ic ally  com pu te ei ghte en   ei ge nvoices   ar as:   0.1 8069 6,  0.168 936,  0.0 82378,   0.065 117,   0.0 58677,  0.0 27971,  0.0 2012 4,   0.017 375,   0.0 16086,  0.0 08081,  0.0 0706 3,   0.004 332,   0.0 0347 4,   0.003 072,   0.0 02031,  0.0 01976,  0.0 0112,   a nd   0.0 01062.  The  a dap ta ti on   data  , = 1 , . ,   to  est im at e   un i qu ei genv oice  weig hts  by  m axi m iz ing   the  li kelih ood  of   I m at hem atical l on ca fin   by  m axi m iz ing  th   f unct ion as  f ollows:     ( ) = 1 ( )  ( ) + ( , )  (  ) + ( )  ( ( , ) ) = 1 = 1 1 = 1 , = 1 = 1   (2)     Stat r   init ia pr oba bili ty   and   po ste rio pr obabili ty   of   obse rv at io n   is  repr esented   by  π r   an ( )   resp ect ively   at   tim t Stat p   poste rio pro bab il it of  ob serv at io seq ue nce  is  re pr es ented  by  ξ t ( p , r )   at   tim t   an at   sta te   r   at   ti m + 1   is  the   r th   G aussia pro ba bili ty   den sit f un ct i on .   Fu rt her  ( ) = γ t ( r ) log ( b r ( o t , w ) ) T t = 1 R r = 1   is relat ed  to  the  ne s peak e s uper ve ct or     as  fo ll ows :     Q b ( w ) = 0 . 5 γ t ( r ) [ d 1 lo g ( ) + log | C r | + o t s r ( w ) 2 C r ] T t = 1 R r = 1   ( 3 )     C ov a riance  m at rix  of  th Ga ussi an   in  e qn.  ( 3)   at   sta te     is  r epr ese nted   as  Her e   the  est i m at ion   of  ei genvo ic es   is  gen e rali zed   by   pe rfor m ing   ke rn el   PCA   in   it place   of  li ne ar   PCA S ubse quent ly le ( . , . )   be     a k e rn el   with  a  corres pondin g m app ing   . Th i s m aps  the  patte rn     of t he  s peci fic sp ea ke s up erv ect or sp ac   to  the  ( )   in  the  sp ea ker   s pec ific   featur s pa ce   .   Give a   set   of   pat te rn s pea ker   su pe r vecto r s   ( 1 , 2 , 1 , )   denote  the  m ean  of   t he    - m app ed  fea ture  vectors  by  ̅ = 1 ( ) = 1   an   the  centere m ap  with  ̃ = ( ) ̅   Nex ste E igen   deco m posit ion   is  pe rfor m ed  on   ̃   wh e re   Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 2 A pr i l 202 :   1859   -   1867   1862   = [ ( , ) ] ,   is  the     ort ho gonal  ei ghnvec tor  of     dim ension  c ov a riance   m at rix  in   the  f eat ur e   sp ace  is  re pres ented  as  = = 1 ̅ ( )   by  c on si der i ng   =   w he re  = [ 1 , 1 , ]   with   = [ 1 , . . ( 1 ) ,  ] and  =  ( 1 , 1 , ) A   com pu te r   ge ne rated   8 8   ort hogo nal   ei ghnv ect or     is  represe nted  in   T able   1.  T wo - dim ension   re presentat ion   of   ut te ran ces  f ro m   TIMIT  databas e   evaluati on  us in g KPCA+li nea s olu t io a nd  non - li near   SVM  shown i Fi gure  1.       Table   1 .   c om pu te ge ner at ed   8X8   o rth ogonal   ei ghnv ect or  v m     C1   C2   C3   C4   C5   C6   C7   C8   R1   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 2 9   0 .00 0 0   R2   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 29   0 .00 0 0   R3   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 2 9   0 .00 0 0   R4   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 2 9   0 .00 0 0   R5   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 2 9   0 .00 0 0   R6   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 2 9   0 .00 0 0   R7   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 2 9   0 .00 0 0   R8   - 1 .00 0 0   - 0 .85 7 1   - 0 .71 4 3   - 0 .57 1 4   - 0 .42 8 6   - 0 .28 5 7   - 0 .14 2 9   0 .00 0 0           Figure  1 .   Tw o - dim ensio  repre sentat ion o f utt eran ces  fro m  TI MIT  databa se  evaluati on  us in g KPCA+ li nea so luti on a nd  non - li near S VM       2.2.    G au ssi an  mi xture m odel   (G MM)   b ase d h ig h la bel f eature m od el ing   GMM  has  bec om the  le ading   ge ne rati on   st at is ti cal   m od el  in  the   sta te   of  the  art  A SR  syst e m .   GMM  is  an  at tract ive   sta ti sti cal  m od el   becau se  it   can  re pr ese nt  va r iou pro bab il it den sit funct ion wh e est i m at ing   suffici ent  nu m ber   of   pa ram et ers.   T he  GM M ,   in  ge ner al ,   con ta in set   of     m ulti var ia te   Ga us sia de ns it functi ons  re pre sented  by   the  i nd e . T he res ulti ng   pro bab il it den sit fun ct ion   f or  p art ic ular s peak e m od el    is  convex   com bin at ion   of  al den sit f un ct io ns.  GM is  bu il us ing   sta nd a r d   m ulti var ia te   Ga us sia densi ty , bu t   intr oduces   c om po nen t   in dex  a la te nt  var ia ble  with  discre te   pro ba bili ty   ( ) Th weig ht s   are  re pr es ente as  = ( ) Com plies  with  the  GMM  densi ty   fu ncti on  an t he  co ndit ion that  c har a ct erize   the  past  c on t ribu ti ons   of  t he   co rr es pondin com ponen t   as   = 1 = 1 E ach   Gau s sia de ns it re presents   co ndit ion al   densi ty   functi on  ( ( | , ) ) Acc ordin t Ba ye s   theo rem the  joint  pro ba bili t de ns it functi on  ( ( | , ) ) is  give by  t he   m ultip li cat ion  of  t he   tw o.  T he  s um   ov e r   al de ns it ie re su lt i th m ulti - m od al  p r ob a bili ty  d ensity  o f   GMMs as  fo ll ows:     ( | ) = ( | ) = 1 ( | , ) = { ( | , Σ ) } = 1   ( 4 )     Wh e re  μ k   is  the  m ean  vect or   a nd  Σ k   is  the  co var ie nc m at rix.   Each   com po ne nt  de ns it is  com ple te ly   deter m ined  by   μ k   a nd  Σ k The   pa ram et er   set   = { 1 , 2 , . . , , 1 , 2 , . . , Σ 1 , Σ 2 , . . Σ   }   wh e re   ei ghti ng  fact or   includi ng s pecific  sp ea ke r   m od el     of m ean vect or  a nd c ov a riance m at rix.   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       High leve l s pe aker speci fi c features  mo delin in  auto m atic spe aker   ( Saty anand Si ngh )   1863   Fig ure   il lustr at es  the  li kelih ood  f unct io of  the  GMM,  in cl ud in se ve Gau s sia distribu ti ons  with   cov a riance   m atr ic es  of  t wo   dim ension al   m ea an feat ur e   ve ct or s   are   c hos en   1   an 2   de no te   the   el em ents  of   the  featu re  ve ct or .   C om pu te ge ner at e log - li kelih ood   c om plete trai nin s pe a ker   m od el   is  rep re sente d   as  - 6.0 6737 9 - 4.2 8833 3 - 4.253 459 ,   - 4.2 4104 3 ,   - 4.2 30592 - 4.218 451 - 4.2 03952 - 4.1 88224 ,   - 4.17356 6 ,     - 4.1 6195 5 - 4. 153866 - 4.14861 2 ,   - 4.1 45268 ,   - 4.1 43124 - 4.1 4171 2 - 4. 140738 c om pu te gen e rat ed  8 8   trai ning  feature   vecto rs   of  a   sp ea ker  by   G aussian   Mi xtur Mo dels   is  r e pr ese nted   in   T able   a nd  T a ble   represe nt  te sti ng   featu re  vecto rs  of  sam sp eaker  with  di ff e ren te xt.  Fi gur sho ws  li ke li ho od  functi on  f or  a G MM   with s even Ga us sia n densi ti es.           Figure  2 .   A  li ke li ho o d f un ct io n for a  GM with se ve n Ga us sia n de ns it ie s       Table  2 c om pu te ge ner at ed   8X8   trai ning  fea ture vect ors of   a sp ea ker  by  G aussian   m ixtur e m od el s     C1   C2   C3   C4   C5   C6   C7   C8   R1   4 .06 4 6   2 .79 6 0   3 .36 9 6   2 .56 6 5   1 .41 1 5   1 .45 8 2   1 .33 9 3   0 .76 3 7   R2   4 .83 1 7   3 .57 5 6   3. 3678   2 .86 0 8   0 .93 0 4   0 .80 7 5   0 .92 9 5   1 .18 4 8   R3   3 .75 6 2   3 .42 7 3   3 .83 8 0   2 .75 2 2   1 .34 7 1   0 .99 3 4   1 .47 3 1   1 .65 7 6   R4   5 .00 2 1   3 .39 6 9   3 .40 3 2   2 .23 5 4   0 .49 1 4   0 .89 3 1   2 .05 6 3   1 .42 4 4   R5   4 .15 2 8   3 .34 6 2   3 .81 4 8   3 .40 0 6   1 .82 6 8   1 .04 5 0   1 .54 3 6   1 .15 1 2   R6   3 .83 5 2   3 .16 0 5   4 .36 1 6   2 .86 5 2   1 .75 10   1 .04 6 4   1 .63 3 6   1 .30 0 7   R7   4 .16 1 0   3 .34 3 0   4 .41 1 4   1 .78 5 7   1 .10 0 3   1 .53 8 8   1 .38 8 5   1 .65 4 9   R8   3 .59 2 1   3 .72 6 5   4 .16 3 4   2 .51 1 8   1 .86 2 3   1 .52 3 1   1 .55 6 9   1 .41 4 8       Table  3 8X8   te sti ng  featur e  v e ct ors  of   a s peak e r by  Ga us sia m ixtur e  m od el s     C1   C2   C3   C4   C5   C6   C7   C8   R1   3 .2 927   2 .00 8 6   4 .76 3 0   3 .17 6 0   1 .46 7 5   0 .93 3 1   1 .73 1 8   1 .31 9 4   R2   3 .64 1 8   2 .61 7 2   5 .19 2 5   2 .51 2 4   0 .54 1 7   1 .29 2 9   1 .99 1 6   0 .97 5 6   R3   2 .98 9 7   1 .63 8 2   5 .25 6 5   4 .00 0 6   1 .36 4 7   1 .88 2 4   1 .95 7 6   1 .02 4 5   R4   3 .42 0 3   2 .37 6 0   4 .45 9 6   2 .54 3 4   1 .08 0 3   1 .41 0 7   1 .84 4 0   1 .32 0 8   R5   3 .48 6 4   2 .96 0 4   3 .94 1 0   3 .21 2 0   1 .51 3 8   1 .50 9 8   2 .21 6 0   1 .20 5 1   R6   4 .00 0 4   2 .29 8 0   4 .27 8 1   3 .05 0 4   1 .83 6 4   1 .01 2 1   1 .26 0 0   1 .14 9 1   R7   3 .08 0 6   2 .04 1 7   4 .03 3 1   3 .63 9 5   1 .97 4 3   1 .81 9 5   1 .37 7 4   1 .08 0 0   R8   2 .91 0 9   2 .31 1 6   4 .60 1 9   3 .51 6 7   2 .32 7 0   1 .18 5 8   2 .66 7 4   1 .39 9 4       2.3.    Li near   di scri mi na n t an aly sis  ( LD A)   ba sed  hig h la bel fe at ure  m od el ing   LDA  is  a   c omm on ly   e m plo ye te c hn i qu e   i sta ti sti cal   pat te rn   rec ogniti on  t hat  ai m at   find in li near   com bin at ion of  feat ur c oe ff ic ie nts  t fa ci li ta te   discrim inati on   of   m ul ti ple  cl asses.   It   fin ds  or thogonal   or ie ntati o i pl ace  of  m os ef fecti ve  functi ons  i cl ass  disc rim inati on By   introd ucin the   ori gin al   featu r es  in   these  guideli ne s,  t he  acc ur a cy   of  cl assifi cat io im pr oves.   Le us  in dicat th set   of  al de ve lop m ent  utter ances   by  D utterance   featur e i nd ic a te by  w s , i t hese   featur e obta in ed  from   the  it h   utterance   of  the  s pea ker  s   the  total   nu m be of  uttera nces   belo ng i ng  to   s   is  ind ic at e by  n s   and  the   total   num ber   of  sp e ake rs  in   D   is  in dicat ed   by  S . Class co va riance m at rices betwee S b   an d wit hin   S w   are  giv e n by     0 10 20 30 40 50 0 10 20 30 40 50 - 2 0 - 1 0 0 10 20 x1 x2 Li k e l i ho od Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 2 A pr i l 202 :   1859   -   1867   1864   = 1 ( ̅ ̅ ) ( ̅ ̅ ) = 1   (5)     = 1 1 ( , ̅ ) ( , ̅ ) = 1 = 1   (6)     Wh e re  t he  s pe aker  de pe nd a nt   m ean  vector  is  giv e by  w ̅ s = 1 n s w s , i n s i = 1   a nd  s peak e r   i ndepende nt  m ean  vecto is  giv e by  w ̅ = 1 S 1 n s w s , i n s i = 1 S s = 1   res pecti vely .   The   L D op ti m iz a ti on   is  the refo re   to  m axi m ize   betwee cl ass  var ia nce,  w herea re du ci ng  w it hin   the  cl as var ia nce.  T he   exact  est im a ti on   ca be  ob ta i f r om  this o ptim iz at i on b y s ol ving  gen e rali zed ei ge nv al ue pr oble m :      =   (7)     The   dia gonal   m at rix  co ntaini ng  of  ei gn vect or  is   in dicat ed   by  If  the   m at rix  S w   in   e qn.   ( 6 )   i in ver ti ble  the n   the s olu ti on ca n be easil y f ound b S w 1 S b A L DA   m a trix  of d im ension   R × k   is as f ollo ws :      = [ 1 . . ]   (8)     ei ge nvect ors  v 1 . . v k   obta ined   by  s olv in e qn.  ( 7 ) T hu s the   L D c hange  of  th uttera nce  fea ture  w   is  ob ta ine i t his w ay :      ( ) =    (9)     c om pu te r ge ner at e 8X8   Φ L DA ( w )   m at ri x of dim ension   RXk   by L DA Mo de ls i s r e pr ese nte in   T a ble   4.       Table  4 .   c om pu te ge ner at ed   8X8    ( )   m at rix  of dim ension        C1   C2   C3   C4   C5   C6   C7   C8   R1   - 0 .53 0 2   - 0 .63 2 8   - 0 .64 0 2   - 0 .58 6 1   - 0 .53 0 6   - 0 .51 3 7   - 0 .54 0 3   - 0 .56 7 8   R2   - 0 .66 0 1   - 0 .79 3 2   - 0 .81 8 9   - 0 .77 7 4   - 0 .73 4 7   - 0. 7332   - 0 .77 7 3   - 0 .81 3 8   R3   - 0 .69 4 9   - 0 .84 2 0   0 .88 4 6   - 0 .86 2 2   - 0 .83 8 9   - 0 .85 6 5   - 0 .92 1 9   - 0 .97 8 3   R4   - 0 .65 9 4   - 0 .80 3 1   - 0 .84 8 4   - 0 .83 0 8   - 0 .81 2 4   - 0 .83 9 9   - 0 .92 8 9   - 1 .02 7 1   R5   - 0 .63 1 4   - 0 .76 5 3   - 0 .79 6 8   - 0 .75 8 4   - 0 .71 6 9   - 0 .73 2 5   - 0 .83 7 4   - 0 .98 8 5   R6   - 0 .66 9 8   - 0 .80 2 9   - 0 .81 7 0   - 0 .7 446   - 0 .66 1 5   - 0 .64 5 0   - 0 .74 6 2   - 0 .93 3 2   R7   - 0 .75 4 8   - 0 .89 8 5   - 0 .90 7 2   - 0 .81 5 7   - 0 .70 4 4   - 0 .65 8 8   - 0 .74 2 3   - 0 .93 3 3   R8   - 0 .78 7 6   - 0 .93 2 8   - 0 .94 6 7   - 0 .86 8 8   - 0 .77 2 2   - 0 .73 1 4   - 0 .80 6 5   - 0 .98 0 6       LDA  ass um es  norm al   distribu ti on  data   f or  a ll   cl asses,  sta ti sti cal ly   ind epe nd e nt f eat ures and  the   sam e   cov a riance   m a trix.  H ow e ver,   this  only   a ppli es  to  LD A   a cl assifi er If   t hese  ass um ptions  are   vi olate d,    the  dim ensional ly   red uc ed   L DA   ca wor reasona bly.  E ve for  cl assi ficat ion   ta s ks ,   L DA  seem powerfu l   enou gh   t be  use f or   data  d i stribu ti on  in  A SR  app li cat io ns.   The  s pea ker  featur m od el ing   histo gr am s   with  norm al  f it   ei gen vect or obtai ne d from  the LD A   is i ll us trat e in  Fig ure  3.           Figure  3 .   The  s peak e r feat ure  m od el ing  h ist ogram s w it h nor m al  f it  eigen ve ct or   with L D A   - 0 . 5 - 0 . 4 - 0 . 3 - 0 . 2 - 0 . 1 0 0 . 1 0 . 2 0 . 3 0 . 4 0 . 5 0 2 4 6 8 10 Le ng t of   Fe a t ure   V e c t ors C ou nt s     Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       High leve l s pe aker speci fi c features  mo delin in  auto m atic spe aker   ( Saty anand Si ngh )   1865   3.   ACOU STIC   DA T A   FE AT UR E E X TR A CTIO N   T he  s peak e s pecific  feat ur e s   ref e to  par a m et ers  extracte f ro m   ph ra s segm ents/perio ds   withi   20 - 25  m f ra m e.  The   m os com m on   short - te rm   acou sti f eat ur es   are   Me Fr e quency  C e ps tr um   Coeff i ci ents  (MFCC a nd  L inear   Pr e dicti ve   Co ding   (L P C)  base featu res   [18 , 19, 20 ] I orde t ob ta in  these   c oeffici ents    from   the  s peec rec ordin g,  th s peech  sam ples  are   first   di vid ed   i nto  sho rt  ov e rlap ping   se gm ents.  T he  si gn al s   ob ta ine d at   the se  segm ents  fr am es  are  then  m ul ti plied  by  window  functi o (e. g.   Ham m ing   a nd  Ha nning)  t ob ta in   F our ie powe s pe ct ru m In   th e   ne xt  ste p,   t he   log a rithm   of   the  s pectr um   is  cal culat e a nd    m el - sp ace  f il te ba nk  a na ly sis  of  no n - l inear   inter vals   is  perform ed.   L og a rithm ic  operati on s   e xp a nd    the  ra nge  of  c oe ff ic ie nts  a nd  br ea up  t he m ulti plica ti ve c om po nen ts  i nto  add it io nal  c ompone nts   [21] I filt er  bank   analy sis,   sp ect ral  e nerg (also   cal le filt er  ba nk  e ne rg c oe ff ic ie nt is  ge ner at e for  eac cha nnel   to   represe nt d if fere nt freq ue ncy  bands .   Fil te rb an ks ,   li ke   th hum an  au ditor syst e m are  desig ne to   be   m or se ns it ive  to   f reque nc cha ng e s   at   the  bo tt om   of  the   sp e ct ru m Finall y,  the   MFC is  obta ine by  pe rfo rm in discr et cos ine  tra ns f or m   ( DCT )   on  the  filt er  ba nk  ene r gy  pa ra m et ers  and  reta ining  m any  pr e a m ble  co ef fici ents   [ 22,  23 ] D CT  h as   tw im portant  pro per ti es.  (i)  t c om pr ess  the   ene rg of  the   sign al   i n to  m ulti ple  coeffic ie nt s,  an (ii)   to   be   highly   co r relat ed   with  the  c oe ff ic ie nts.   For   these  reas ons,  us in D CT  to  rem ov s pecific  dim ension i m pr ov es    the  e ff ic ie ncy   of   the   m od el   a nd  r ed uces   so m har m fu c om po ne nts  [ 24 ] .   F ur t her m or e t he   unc orrelat ed   pro per ti es  of   t he  DCT  help  t ass um that  the  m od el of  featur e   coe ff ic ie nts  are  not  r el evan t.  I s um m ary,     the  f ollo wing  s equ e nce  of  op e rati on s - power  sp ect r um lo ga rithm DCT - pr oduces   sig na with  well - know cepstral  repres entat ion   [ 25 ]       4.   E X PERI MEN TAL SET UP   The  ex pe rim en us es  the  TIM IT  set   of   datab ase.  The  pro posed  al gorithm   i m ple m ented  in  MAT L A B   and  res ults  were  c om par ed   wit t hose   of   the   Eigen voic c onside r at ion  i HMM,  GMM   and  L D A.  A   t ot al   1000  utterances  of  the  TIM IT  database  of   sec,  sec  a nd   se vo ic wer put  to   trai a nd  te st  the  AS s yst e m .   Fo r   the   ab ove   cases,   A SR  r ecognit ion  ef fi ci ency  has   bee cal c ulate Eff ic ie ncy”   Nu m ber   of  utterance   corre ct ly identifie d/To ta N um ber   of   uttera nce  un der   te st.  Table  5 s hows  that  the  eff ic ie ncy  of   t he AS syst e m   for  HMM,  G MM   and   LD A   res pecti vely It  can  be  obse rv e from   this  ta ble  that  us e   of  GMM  has   highest  eff ic ie ncy  c ompare t oth e m od el ing   te ch niques.     Fi gure   s how  t he  e qual   er r or  rate  ( EER)  of  HMM,  GMM ,   and   L D ba se m od el ing   te c hn i qu e T he  A SR  eff ic ie ncy  of   HMM,  GMM,  an LD base m od el ing   te c hn i qu e   are  98.8 % 99. 1%,  an 98. 6 an E ER  ar 4.5% 4.4%  and  4.5 5%   res pecti vely .   T he  EER  im pr ov e m ent  of   GMM   m od el ing  te ch nique  base AS s yst e m   co m pared  with  HM an L DA  is  4.2 5%  a nd   8.5 1 resp ect ively .           Figure  4.  Eq ua l Error  Rat e of  AS R sy ste m  o f  H MM , GM and   LDA ba sed  m od el ing t ech nique  for 2 sec  of  vo ic data           0 . 1       0 . 2     0 . 5         1           2           5           1 0         2 0         4 0         0 . 1       0 . 2     0 . 5         1           2           5           1 0         2 0         4 0     Fa l s e   A l a r m   proba bi l i t y   ( i % ) M i s s   proba bi l i t y   ( i % )     H M M G M M LD A Evaluation Warning : The document was created with Spire.PDF for Python.
                          IS S N :   2088 - 8708   In t J  Elec  &  C om En g,   V ol.  10 , No 2 A pr i l 202 :   1859   -   1867   1 866   Table  5 .   E ff ic i ency o t he AS R sy stem  f or  H MM GMM a nd L DA   res pect ively     HMM   GMM   LDA     Ef f icien cy  in %   EE R in  %   Ef f icien cy  in %   EE R in  %   Ef f icien cy  in %   EE R in  %   6  sec   9 9 .6   4 .9   9 9 .9   4. 7   9 9 .1   5. 1   4  sec   9 8 .8   4 .9   9 9 .5   4. 7   9 8 .2   5. 1   2  sec   9 8 .8   4 .9   9 9 .1   4. 7   9 8 .6   5. 1       5.   CONCL US I O N   This  pa pe pres ented  t he  resea rch,  de velo pm e nt  an e valuati on   of  A SR  syst e m   based   on   H MM GM M   and   LD m od el ing  te ch niques.  GMM  m od el pro vid si m ple  bu eff ect ive  repre sentat ion   t hat  offer s   inex pensi ve  a nd  high  recog niti on   acc ur acy   for  wide   ra nge  of  sp ea ke recog niti on   ta s ks .   A e xperi m ental   evaluati on  of   t he  pe r form ance  of   t he  s peake rec ogniti on  s yst e m   has  bee do ne  on   publ ic ly   avail able  TIMIT  database F or   t he  10 00,  voic e   sa m ples  of   the   TIMIT  databa se  sp a ker   recogn it io accu ra cy   99 . 1%,   98. 8%   and  98.6   f or   GMM,  HMM  an L DA   was   obta ined  f or   sec  of   voic le ng t h.   T he  EER  i m pr ov em ent  of   GM M   m od el ing  tech nique  base A SR syst em   com par ed  with  HM M and L DA   is 4.2 5%  a nd 8.51 res pecti ve ly .   As  e xp e rim ent al   resu lt s how ed  that,   sp e ake rec ogniti on  pe rfor m ance  is  at   pr act ic al ly   usa ble  le v el s   for  sp eci fic   a ppli cat ion s   s uch  as   acce ss   c ontrol  a uth e ntica ti on .   T he  m ai li m iting   fact or  in   le ss   c on t ro ll ed  sit uations   is   th la ck  of   r obust ness  to   tra ns m issi on   im pairm ents  s uch  as  noise   an m ic   var ia bili ty Much  m or to  a ddress   the se  lim it ation s,   su c as  e xplori ng  areas   s uc as   unde rstand i ng  a nd  m od el ing  the   im pact  of   i m pair m ents  on  s pectral  c ha r act erist ic s,  ap pl yi ng   m or s ophisti cat ed  c ha nn el   com pen sa ti on   te c hn i qu e s,  a nd  exp l or i ng f eat ures that a re less  sen sit ive t c ha nn el   de gr a dation ef forts a re  un de r way.       REFERE NCE S     [1]   S.   Singh,  Forensic  and  Autom at i Speake r   Re cogni ti on  S y ste m ”  Inte rnationa Journal  of  Ap pli ed  Engi ne eri ng  Re search ,   Vol.   8 ,   No.   5,   2018,   pp .   2804 - 2811 ,   20 18.   [2]   S.   Singh   and   Aje et  Singh  Acc ur acy   Com par ison  using  Diffe r ent  Modeli ng  Tech n ique und er  Li m it ed   Spee ch  D ata   of  Speak er  R ecogniti on   S y st ems , ”  Globa Journal  of   Sc ie n ce  Fronti er  Re sear ch:   F   Math emat ic and   Dec isio Sci en ce s,   vol  16 ( 2),   pp . 1 - 17 ,   201 6 .   [3]   S.   Singh.  Ba yesia dist ance  m et ric   le arn ing   and  i ts  applic at ion  in  aut om a ti spe a ker   re c ognit ion  s y stem s”   Inte rnational   Jo urnal  of El e ct ri c al  and  Comput er  Engi n ee ring ,   V ol,   9 ,   No .   4 ,   201 9.   [4]   S.   Singh.   The  Role   of   Spe ec h   Te chno log y   in  Biom et ric s,   For ensic and  Man - Mac hine  Int erf ac e ”  In te rnat ion al  Journal  of   Elec t rical   and   Computer  Eng ine ering ,   Vol.   9 ,   No.   1,   pp . 281 - 288,   2019.   [5]   S.   Singh.  High   Le v el   Spe ake r   Speci fi Fea tures   as  an  Eff icien c y   Enh anc ing   Para m et ers  in  Sp ea ker   Rec ogn it i on  S y stem , ”  Int ernati onal Journal of  E le c tric al   and   Computer  Eng i nee ring ,   Vol,   9,   No.  4,   2019.   [6]   S.  Singh,  Abha y   Kum ar,   David  Raj Kollur i,  Eff icient  Modelling  Techni qu b ase Speak er  R ec ogni ti on  und e r   Li m it ed   Speec h   Data , ”  In te rnati onal  Journal   of  Image,   Gr aphics   and  Signal  Pr oce ss ing( IJI GSP) ,   Vol. 8,   No.11 ,   pp. 41 - 48,   2016.   [7]   Shri ber g,   E.,  Stolc ke ,   Dire c m odel ing   of  p rosod y :   An  over v iew   of  applic at ion in  au tomatic  sp ee ch   proc essing ,”   In  Speec h   Pros od y ,   Nar a, Ja pan   2004 .   [8]   Mar y ,   L.,  Y egna nar a y an a,  B,   Pros odic   f e at ure s   for  spe a ker   v eri fi cation,”  In   Proc ee d in gs  of  In te rs peech,   Pitt sburgh,  Penn s y lva n ia,  pp .   91 7 -   92 0,   2006.   [9]   Ferre r,  L . ,   Shrib erg ,   E.,  K aj ar ek ar,  S.,  &   Sonm ez ,   K ,   “Param ete rization  of   pros odic   fe ature   distri buti ons  for  S VM  modeli ng  in  spe ake rec ogni ti on ,   In  Proc ee din gs  of  Inte rna ti o nal   Confer ence  on  Acoustic s,  S pee ch  and  Sign al  Proce ss ing ,   Vol .   4,   pp.   233 - 236,   2007 .   [10]   Han,   K. ,   Dong ,   Y.,   T ashe v,   I ,   Spee ch  emotion  rec ognition  using  dee neur al  net wor and  ex treme   le arnin g   machine , ”  In   Proce ed ings o In te r spee ch pp.   223 - 227,   2014 .   [11]   W ang,   Z.  Q. ,   &   Ta shev,   I ,   Learning  ut te ranc e - l ev e repr ese ntati ons  for  s pe ec h   e motion  and   age / gende re cogni t i on   using  dee p   n eu ral  net works ,”   I IEEE   Inte rn ational  Confer ence  on   Acousti cs,   Spee ch  and  Si gnal   Proc essing  (ICAS S P) ,   2017.   [12]   Vapnik  V.  An  Ove rvie o Sta t isti cal  Learning  Theory ,   IEE E   Tra nsac ti on  on  Neura Ne tworks ,   V ol.   10,   No.  5,     pp.   988 - 999 , 199 9 .   [13]   S.Singh,   Support  Vec tor  Ma chine  Based  Appro ac hes  For  Real  Ti m Autom at ic  Speake Re cog nit ion  S y s te m , ”  Inte rnational   Jo urnal  of Appl i ed Engi ne ering  R ese arch ,   Vol .   13,   No.   10,   pp.   8561 - 8567,   2018 .   [14]   Scholkopf B, S m ola   A, “ Lear n i ng  with kern el s:  support  vec tor   m ac hin es,   reg u la r i za t ion,   op ti m iz a t ion,   and   be y ond ,   Cambridge, MA:  MIT  Press ;   200 2   [15]   Peskin,   B. ,   Na vra ti l ,   J. ,   Abra m son,  J.,   Jones,  D.,   Klusa ce k ,   D.,   Re y no lds,   D.,   e al.,  Us ing  pros odic   and   conv ersationa f eat ures  for   hig h - performance   sp eak er  r ec ogni ti o n,   Report  from   JH W S’02,  In  Proce edi ngs  o f   ICAS S P ,   Hong  Kong,  China,  V ol.   4 ,   pp .   792 - 79 5,   2003 .   [16]   S.Singh,   Mansour  H.  As saf,   Sunil  R. Das,   Emil  M.  Petri u,   and  Voicu  Groza ,   Short  Durat ion  V oic Da ta   Spe ak er   Rec ognition  S y s te m   Us ing  Novel   Fuzz y   V ec tor   Q uant i za t ion  Algo rit hm s ,   2016   IE EE   In te rn at ion al   Instrum ent at ion   and  Mea sur ement  T ec hnolog y   C onfe ren c e ,   Ma y   23 - 26,   T ai p ei ,   T ai wan ,   2016 .   Evaluation Warning : The document was created with Spire.PDF for Python.
In t J  Elec  &  C om En g     IS S N: 20 88 - 8708       High leve l s pe aker speci fi c features  mo delin in  auto m atic spe aker   ( Saty anand Si ngh )   1867   [17]   Naji m ,   D.,  Dum ouche l,   P. ,   &   Kenn y ,   P,  Modeli ng  prosodi feature with   joi nt  f ac to an aly s is   for  spea k e r   ver ifica t ion,”  I E EE   Tr ansacti ons   on  Aud io, Speec h,   and   Language   Proce ss ing ,   Vol .   15   7,   2095 - 210 3,   2007 .   [18]   S.Singh,   Speak er  Re cogni t ion  b y   Gauss ia n   Filt er   Based  Fea ture   E xtra c ti on  and  Propos ed  Fuzz y   Ve c tor  Quantiza ti on  Modeli ng   Techn ique , ”  Inte rn at io nal  Journal   of   A ppli ed   Eng ineeri ng  R ese arch ,   Vo l.  13,   No.   16 ,   pp .   12798 - 12804 2018.   [19]   S.Singh,   High  Le ve Speak er  Speci f ic   Fe at ure Modeli ng  in  Aut om at ic   Speak er  Rec ognition  S y s te m ,”   In te rnatio na l   Journal  of   Elec t rica and   Computer  Eng ine ering ,   Vol.   10 ,   No.   2 ,   2 018,   pp .   2804 - 2 811,   2020 .   [20]   S.Singh,   Speak er  Re cogni t ion  S y stem  for  L imite Spee ch  Da ta  Us ing  High - Level   Spe ake Spe ci fi Fea ture an d   Support  Vec tor   Mac hin es ”  Int ernati onal   Jou r nal  of   App li ed   Engi n ee ring   R ese arch ,   Vol.   1 2 ,   No.   9 ,   2018   pp.   8026 - 8033   2 017.   [21]   S.Singh,   MH   As saf  and   Abha y   Kum ar,   Novel   Algo rit hm   of   Spars R epr ese n ta t io ns  for   Speec Com pre ss ion/ Enha nce m ent  and   Its   Appli ca t io in   Spe a ker   Rec ognition   S y stem ,”   Inte rnat i onal  Journal   o Computati onal  a nd  Applied Math emati cs ,   Vol.   11,   No.  1 pp .   89 - 10 4 ,   2016 .   [22]   S.Singh,   Evalu at ion   of  Sparsifi ca t ion  a lgori thm   and  I ts  Appli ca t ion  in   Speake r   R ec ogni ti on  S y ste m ”  Inte rnationa l   Journal  of   Appli ed   Eng ine ering   Re search ,   Vol.   1 3,   No.   17,   pp.   13 015 - 13021,   201 8.   [23]   S.Singh  and   Man sour  H.  As saf  A   Perfe ct  Balanc of  Sparsit y   and   Acoustic  hole  in   Speec h   Signal  an Its  Appl icati o n   in  Speak er  R ec o gnit ion  S y stem”   Middl e - East  Jou rnal  of  S ci en ti f ic R ese arch Vol .   24,   No.11 ,   pp .   3 527 - 3541,   2016 .   [24]   S.Singh  and  Dr .   E . G.  Ra ja n ,   MF CC  VQ   bas ed  Speak er  Re c ognit ion  and  It Acc ura c y   Aff ec t ing  Fact o rs ,   Inte rnational   Jo urnal  of  Engi n eer ing  Re search &   Technol ogy ,   Int ernati onal  Journal  of  Co mputer  Appl ic a ti ons ,   Vo l .   21,   No.   6 ,   pp.   1 - 6,   2011 .   [25]   S.Singh  a nd  Dr.   E. G.  R ajan,   Applic a ti on  o Diffe ren t   Filt ers  In  Mel  Freque nc y   Cepstral  Co eff icient Fe at ur e   Ext ra ct ion  And  Fuzz y   Vec tor   Quantiza t ion  Approac In  Spe ake R ec ogni ti on , ”  Int e rnational   Journa of  Eng ine erin g   Re search  &   Technol ogy ,   Vol.   I ss ue  6,   pp - 3171 - 3182,   2013 .     Evaluation Warning : The document was created with Spire.PDF for Python.