I n t ern a t i o n a l  J o u rn a l  o f  E l ect ri ca l  a n d  C o m p u t er E n g i n eeri n g  ( I J E C E )   V o l.   8 ,  No .   5 O c t obe r   20 1 8,  p p.  28 04~ 2 811   I S S N :  2088 - 8708 D O I :  10. 11 591/ i j ece . v8 i 5 . pp 280 4 - 2811       2804       Jou r n al  h om e p age ht t p: / / i ae s j our nal . c om / onl i ne / i nde x . ph p / I J E C E   F o rens ic a nd   Aut o m a t ic Spea k er R eco g nit io Sy s t e m       Sa t y a na nd Si ng h   S c hoo l   o f  E l ect r i cal  an d  E l ect r o n i cs   E ng i ne e r i ng ,   F iji  N a tio n a l U n i v e r s it y ,  F iji I s la n d       A rt i cl e I n f o     AB S T RAC T   A r tic le  h is to r y :   R e c e i v e d N ov  3,  2017   R e v i s e d J a n  19,  20 18   A c c e pt e d S e p 29,  20 18       C u r r en t  A u t o m at i c S p eak er  R ec o g n i t i o n  ( A S R )  S y s t e m  h as  e m e r g ed  as  an   i m por t a nt  m e di um  of  c onf i r m a t i on  of  i de nt i t y  i m a n y  bus i ne s s e s ,  e - co m m er ce ap p l i cat i o n s ,  f o r en s i c s  an d   l aw  en f o r ce m en t  as  w el l .  S p eci al i s t s   tr a in e d  in  c r im in o lo g ic a l r e c o g n itio n  c a n  p la y  o u t th is  u n d e r ta k in g   f a r   s upe r i or  by  l ook i ng  a t  a n a r r a nge m e nt  of   a c ous t i c ,  pr os o di c ,  a nd  s e m a nt i c   a t t r i but e s  w hi c h ha s  be e n r e f e r r e d t o a s  s t r uc t ur e d l i s t e ni ng .  A a l g or i t hm - ba s e d s y s t e m  ha s  be e n de v e l ope d i n t he  r e c og ni t i on  of  f or e ns i c  s pe a k e r s  b y   phy s i c s   s c i e nt i s t s  a nd f or e ns i c  l i ng ui s t s  t o r e duc e  t he  pr o ba bi l i t y  of   a   c ont e x t ua l  bi a s  or  pr e - cen t r i c u n d er s t an d i n g  o f  a r e f er en ce  m o d e l  w i t h  t h v a l i di t y  of   a n unk now n a udi o s a m pl e   a nd a ny  s us pi c i ous  i nd i v i d ua l .  M a ny   r es ear ch er s   ar e co n t i n u i n g  t o  d ev el o p  au t o m at i c al g o r i t h m s  i n  s i g n al   p r o ces s i n g  an d  m ach i n e l ear n i n g  s o  t h at  i m p r o v i n g   p er f o r m an ce can   ef f ect i v el y  i n t r o d u ce t h e s p eak er s  i d en t i t y ,  w h er e t h e au t o m at i c s y s t e m   pe r f or m s  e q u a ll y   w ith  th e   hum a n a udi e nc e .  I n t hi s  pa pe r ,  I   ex a m i n e t h e   l i t e r a t ur e  a bout  t he  i de nt i f i c a t i on of  s pe a k e r s  b y   m a c hi ne s  a nd hum a ns ,   e m p h as i zi n g  t h e k e y  t ech n i cal  s p eak er  p at t er n  em er g i n g   f o r  t h e au t o m at i c   t ech n o l o g y  i n  t h e l as t  d ecad e.  I   f oc us  o n m a n y   as p ect s  o f  au t o m at i c s p eak er   r e c og ni t i on ( A S R )  s y s t e m s ,  i nc l udi ng  s pe a k e r - s p eci f i f eat u r e s ,  s p eak er   m o d el s ,  s t an d ar d  as s es s m en t  d at a s et s ,  an d  p er f o r m an ce  m et r i c s .     Ke y wo rd :   A u t o m a t i c S p eak er  R eco g n i t i o n     G a us s i a M i x i n g  M o d el   N o r m a liz a tio n     U ni ve r s a l   B a c kg r oun d M ode l   W ith in - C l as s  C o v ar i an ce   C opy r i g ht   ©  2018   I ns t i t ut e  o f  A d v anc e d E ngi ne e r i ng  an Sc i e nc e   A l l  ri g h t s re se rv e d .   Co rre sp o n d i n g  Au t h o r :   S a t y a n a n d S i ngh   S c h ool   o f  E l ect r i cal  an d  E l ect r o n i cs   E n gi ne e r i n g ,   C E S T ,   F ij i N a tio n a l U n i v e r s i t y ,   F ij i I s la n d .   E m a il:  s a t y a na nd . s i n g h@ f n u. a c . f j       1.   I NT RO D UCT I O N     S p eak er  r eco g n i t i o n  an d   v er i f i cat i o n   h av e  ach i ev ed   v i s i b i l i t y  a n d  s i g n i f i can ce  i n  s o ci et y   as  s p eech   t e c h n ol o gy ,  a u di o c ont e n t ,  a nd e - co m m er ce co n t i n u e s  t o  e x p an d .  T h er e i s  an  i n cr eas i n g  n eed   t o  s ear ch  a u d i o   co n t en t  a n d  s t ar t  r e s ear ch  b as ed  o n  t h e s p ea k er  i d en t i t y  i s  i n cr eas i n g   i n t er e s t  t o  a  y o u n g   s ci en t i s t .  I m ag i n i n g   th e   f u tu r e  i s   n o t d if f ic u lt  w h e n  a  s y s te m   w ill e x p o s e  o u r  id e n ti t y   n o t o n l y  th e  s e n s e  o f  t h e  i n te lli g e n t,   s ym p a t he t i c  a nd   f ul l f u n ct i o n al  p er s o n al  a s s i s t an t s ,   w h i c h   w w i l l  s a y ,  b u t  b y  o u r   v o i ce,  w e r eco g n i ze  m o r t r ack - ab l e o r  o t h er  r eco g n i zab l e s y m p t o m s .   T h i s  i s  t h e ad d i t i o n al  b as i c i n f o r m at i o n  t h at   w e ca n  n o t  r eco g n i ze t h e v o i ce o f  a p er s o n  o n ce h ear d   a n d  a t th e   s a m e   ti m e ,  it i s  d i f f i c ul t  t o  i d e n t i f y t he   vo i c e  o f  a   kno w n  p e r s o n o n t he  t e l e p ho n e .  I n vi e w  o f  t he s e   t ho u g ht s ,  a  na t i ve  p e r s o m a y  p o nd e r  w ha t  p r e c i s e l m a ke s   s p e a ke r  r e c o gni t i o n s uc h a  d i f f i c ul t  t a s k a nd   w h i s  i t  a  poi n t  o f  s u c h  t h or oug h r e s e a r c h .  F r o m  t h e  a bov e  di s c u s s i o n,   w e  c a s a y t ha t   t he  i d e n t i t y o f  t he  s p e a ke r   can  b e co m p l et ed  i n  t h r ee s t e p s .  A n y  i n d i v i d u al  ca n  eas i l y   r eco g n i ze t h e f a m i l i ar   s o u n d s   o f  a p er s o n   w i t h o u t   an y  co n s ci o u s  t r ai n i n g .  T h es e   m et h o d s  o f  r eco g n i t i o n  can  b e cal l ed  as   N at i v e S p eak er   R eco g n i t i o n” .  I n t he   f o r en s i c  i d en t i f i cat i o n ,  a  v o i ce s a m p l e o f  a p er s o n   f r o m  t el ep h o n e cal l s  d at ab as e  i s  o f t en  co m p ar ed   w i t h   p o t en t i al  s u s p ect s .  I n  t h e s e ca s es ,  t h er e ar e t r ai n ed  l i s t e n er s   i n  o r d er  t o  p r o v i d e a d eci s i o n .  W w i l l  cat e g o r i ze  t h i s   m et h o d   as   f o r en s i c s p e a ke r  r e c o gni t i o n.   I t h i s   c o m p ut e r - b as ed  w o r l d ,  w e h av a n   au t o m at i c s p eak er   r eco g n i t i o n  s y s t e m ,   w h er e an  el ect r o n i m ach i n e i s  u s ed  t o  co m p l et e a s p eec h  an al y s i s  a n d  au t o m a t ed   d e c is io n - m a k i n g .  F o r en s i c a n d  A S R  r e s ear ch  co m m u n i t i e s   h av e  d ev el o p ed  s e v er al   m et h o d s  f o r  at   l eas t   s ev e n   Evaluation Warning : The document was created with Spire.PDF for Python.
IJ E C E     I S S N :  2088 - 8708       F or e ns i c  and A ut om at i c  Spe a k e r  R e c ogni t i on  Sy s t e m   ( Sat y anand Si ng h )   2805   d ecad es  i n d ep en d en t l y .  I n  co n t r as t ,  n at i v e r eco g n i t i o n  i s  t h e  n at u r al  ab i l i t y  o f   h u m a n  b ei n g s   w h i c h  i s  al w a y s   v er y   ef f ect i v a n d   acc u r at e.   R ecen t   r es ear ch   o n   b r ai n   i m a g i n g   h a s   s h o w n   m a n y   d et ai l s   t h at   h o w   h u m a n   be i n g doe s  c ogn i t i ve - b as ed  s p eak er s  r eco g n i t i o n ,   w h i c h  ca n   m o t i v at e  n e w  d i r ect i o n s   f o r  b o t h  a u t o m at ed  an d   f o r e ns i c  s ys t e m   [ 1 ,  2 ] .  I n  t h i s  r ev i e w  p ap er ,  I  p r es en t  a as  o n  d at e l i t er at u r e   r e v i e w o f  AS R s y st e m s es p eci al l y  i n  t h e l as t   s ev e n  d ecad es ,  p r o v i d i n g  t h e r ead er   w i t h   a n a t t i t ud e  o f  ho w  t he  f o r e ns i c  b y   t he   hu m a n   s p eak er ,  es p eci al l y  t h e e x p er t ,  an d  t h n at i v e au d i e n ce r ec o g n i ze.  I t s   m ai n  p u r p o s e i s   t o  d i s cu s s   t h r ee s a i d   s e c tio n s  o f  s p e a k e r  r e c o g n itio n ,   w h ic h  a r e  i m p o r ta n t  s i m i la r itie s   a n d  d i f f er e n ces  b et w ee n  t h e m .  I   i ns i s t  o h o w  a u t o m at i c s p ea k er  r eco g n i t i o n   s y s t e m   h as  b een  d e v el o p ed  o n  m o r e cu r r en t  ap p r o ach es  o v er  t i m e.  I n   n o i s m as k i n g ,   m a n y  s p eec h   p r o ces s i n g  t ech n i q u es ,   s u c h  a s  Mel   s cal f i l t er  b an k   f o r  f ea t u r e ex t r act i o n  a n d   co n cep t s ,  i n s p i r ed  b y  t h e  h u m an   h ear i n g   s y s t e m .   A l s o ,  t h er e  ar e p ar al l el s  b et w ee n   f o r en s i c v o i ce e x p er t s  a n d   m et h o d s  u s ed  b y  au t o m a t ed  s y s t e m s ,   h o w e v er ,  i n   m a n y  ca s es ,  r es ear ch  co m m u n i t i es  ar e d i f f er e n t .   I   b el i ev t ha t   i t r e q u ir e d   to   i nc l ud e   i n  t h i s  r e v i e w ,  t h e p er s p ect i v o f  t h e co n cep t  o f   s p eec b y hu m a ns ,  i nc l ud i ng   h i gh l i gh t s  of  bot h   s t r e ng t h s  a nd  w e a kn e s s e s   i n s pe a k e r  r e c ogn i t i on s y s t e m  c o m pa r e d t m a c h i n e s ,  i t   w i l l   h e l p   r ead er s  t o  s ee an d  p er h ap s  i n s p i r e n e w  r es ear c h  i n  t h f i el d  o f  t h m an - m ac h i n e i n t er f ace.   I n  th e  f ir s t p la c e ,  to  c o n s id e r  t h e g en er al  r es ear ch  d o m ai n ,  i t  i s  v al u ab l e t o  el u ci d at w h at  i s   en v el o p ed  b y   t h e  t er m  s p eak er  r eco g n i t i o n ,   w h i ch  co m p r i s es  o f  t w o  t a s k   u n d er t ak i n g s :   ve r i f i c a t i o n a nd   r e c o g n itio n .  I n s p e ak er  r eco g n i t i o n ,  t he  u nd e r t a ki n g i s  t o  d i s t i ng ui s h a n o b s c ur e  s p e a ke r   f r o m  a n a r r a nge m e nt   o f  k n o w n   s p eak er s .   A s  i t   w er e,  t h e o b j ect i v e i s  t o   f i n d  t h s p eak er   w h o  s o u n d s  n ear e s t  t o  t h s p eech  co m i n g   f r o m  a n  o b s cu r s p eak er  i n s i d e a s p eech  d at ab as e.   A t  t h e  p o i n t   w h e n  al l  s p eak er s  i n s i d e a g i v e n   s et  ar e   k n o w n  as  a cl o s ed  s et  s i t ua t i o n.   O t he  o t he r  ha nd ,  i f  t he  p o t e nt i a l  i n f o r m a t i o f r o m  o ut s i d e  t he  p r e d e f i ne d   kno w n   s p e a ke r  ga t he r i ng ,  t hi s  t u r n s  i nt o a n  ope n - se t  s i t ua t i on ,  a n d,   h e n c e ,  a   w or l d m ode l  or  un i v e r s a l   ba c k g r oun m ode l  ( U B M )  [ 3]  i s  r e qu i r e d.   T h i s  s i t u a t i o n  i s  c a l l e d ope n - s et  s p ea k er  r eco g n i t i o n .       2.   TH E M A I N  C H A LL EN G ES  IN  A U TO M A TI C  S P EA K ER  R EC O G N I TI O N   S Y S T EM  I N   P RE S E NT  S CE NARI O   F o r  e x a m p le ,  lik e  o th e r  b io m e tr ic  s y s te m s ,   i r i s ,  f i n g er ,  f ace,  an d  h an d  [ 4 ] ,  t he  hu m a n vo i c e  i s  a l s o  a   d e m o n s tr a tio n  o f  t h e  b io m e tr i c  s y s te m .  T h e  i d en t i t y  o f   t h e  n ar r at o r  i s   n at u r al l y  e m b ed d ed  an d  s p eci f i cal l y   ho w   a   d i a l e c t   i s   s p o ke f o r  a   p e r s o n,   no t  ne c e s s a r i l w ha t   i s  b e i n g s a i d .   T hi s  i nc r e a s e s  t he   p o s s i b i l i t o f   s p eech  s i g n al s   w i t h  t h e d eg r ee  o f  v ar i ab i l i t y .   I f  a  pe r s on  doe s   n ot  s a y   t he  s a m e   w or d   ex act l y  t h e s a m w a y  t h e n  i t  i s  cal l ed  i n t er - s p eak e r   v a r ia b ilit y  [ 4 ,  5 ] .  I n a d d i t i o n,   va r i o us  e l e c t r o ni c  d e vi c e s  u s e d  i n r e c o r d i ng a nd  t r a ns m i s s i o m e t ho d s  u s ua l l i n cr eas e t h e s y s t e m  co m p l e x i t y .  A  p er s o n   m a y   f i n d  i t  h ar d  t o  i d en t i f y  a p er s o n s  v o i ce t h r o u gh  a   m obi l e ,  or   w he n  a  pe r s on  s uf f e r s   f r o m  c ol d a n d h e / s h e  i s   n ot  h e a l t hy   or  h e / s h e  i s  pe r f or m i ng  a n ot he r   w or k  i n  a  s t r e s s e s i t u a t i o n .  T h e s o u r ce o f   v ar i ab i l i t y  o f  s p eak er s  ca n  b e b r o ad l y  cl as s i f i ed  i n t o  t h r ee cat eg o r i es :  ( i )  T ech n o l o g y - b as ed ,  ( i i )  S p eak er - ba s e d,  a n d ( i i i )  C on v er s at i o n s  b as ed .     2. 1.   C ha l l e ng e  a nd  O ppo r t uni t y   i S p ea k er R eco g n i t i o n   T e c h n o lo g y  is   m o r e  to  f o c u s  t h e  in i tia l e f f o r ts  i n  s p e a k e r  r e c o g n itio n ,   w h ic h  in c lu d e s   t el eco m m u n i cat i o n s  s ec t o r ,   w h er e t h e co m m u n i cat i o n s  ch a n n el  an d  t el ep h o n ha nd s e t  va r i a t i o n w a s   t he  m a i n   co n cer n .  S m ar t p h o n e d o m i n a t e t h e t el eco m   i n d u s t r y ,  t h e  v ar i et y  o f  t el ep h o n y  l a n d s c ap e h as  ex p a n d ed   s ig n i f ic a n tl y .   S p e a k e r   o p tio n  a v a ila b le  w i th   a ll s m ar t p h o n e   m a k es   t h e  u s er   i n t er act   at  a   d i s t an ce   f r o m   t h e   m i c r o p ho ne ,  a nd  t hi s  in i tia te d  a  b r o a d  r a n g e  o f  v a r ia b ili t y  in   th e  c h a n n e l.   T h e p er f o r m an ce o f  s p ea k er   r e c o gni t i o n s ys t e m  d e p e nd s  o n i nt e r s e s s i o n  va r i a b i l i t y a s   w e l l  a s  t he  i n he r e nt  c ha nge s  p r e s e nt   w i t hi n  h u m a n   u t t er an ce s  r eco r d ed  at  t h e d i f f er en t  s e s s i o n .  H o w e v er ,  t h e s p eak er  r eco g n i t i o n  ef f i ci en c y  s ee m s  t o  b e   i n d ep en d en t  o f  t i m e o f  v o i ce s a m p l es  co l l ect ed  f o r   t r a i ni n g a nd  t e s t i ng p ur p o s e  [ 6 ,  7 ].   M o s t  o f  t h f o r en s i s p eak er   r eco g n i t i o n  u s es  i n  d i f f er e n t  l eg al  s ce n ar i o s  ar n o t  v er y  co m p l i cat ed .   W h en  ad eq u at e v o i ce s a m p l es  a r e av ai l ab l e f r o m  t h e cr i m i n al ,  t h en   m et h o d i cal  s t u d y  ca n  b e d o n e t o  ex t r act   t h e s p eak er  s p eci f i c p r o p er t i es ,   w h i c h  ar e al s o  cal l ed  s p eak er  s p eci f i c f eat u r e p ar am et er  f r o m   v o i ce d at a,  an d   can  b e co m p ar ed  b et w ee n   t h e s a m p l es .  I n  a u t o m a t i s p eak er  r eco g n i t i o n s y s t e m  s pe a ke r - s p eci f i c f eat u r es   w er e ex t r act ed  f r o m  t h e s p eec h  s i g n a l  an d   m a t h e m at i cal l y   m o d el ed  t o   p er f o r m  a  m ean i n g f u l  co m p ar i s o n .     2. 2.   I ndi v i d ua l   C h a ra ct eri za t i o n  B a s ed   o S p ea k er  S p eci f i c F ea t u res   E v er y   i n d i v i d u al  i n  t h e   w o r l d  h a s  cer t ai n  c h ar act er  t r ai t s  i n  hi s / he r  s p e e c h t ha t  i s  u ni q ue .  S p e a ki n g   ch ar act er i s t i c s  o f  an  i n d i v i d u al  can n o t  b e s o  d i f f er en t   f r o m   t h e o t h er ,  b u t   m a i n l y  t h e s p eak er  v o cal  t r act  i s   uni q ue  d ue  t o  t he  p h ys i o l o g y   a nd  d ue  t o  t he  l e a r ni ng  ha b i t s   o f  e xp r e s s i o n.  E ve n a  t w i ha s  d i f f e r e nc e s  i n h i s   o r  h er  v o i ce,  t h o u g h  acco r d i n g   t o  t h e r es ear c h   h e o r  s h h as  t h e s a m v o cal  t r act  s i ze  [ 8 ]  an d  aco u s t i cal   pr ope r t i e s  [ 9 ] ,  an d  i t  i s  d i f f i cu l t  t o  s ep ar at e t h e m   f r o m   co n cep t u al / f o r en s i c p er s p ec tiv e   [ 10,   11 ].   T hus ,   w h et h er  t h e s p ea k er  i s   i d en t i f i ed   b y   hum a ns  or   m a c h i n e s ,  un a m bi gu ou s  a s pe c t s  of   s om e   m e a s u r a bl e  a nd   Evaluation Warning : The document was created with Spire.PDF for Python.
            I SSN :   2088 - 8708     In t  J  E l e c  &  C o m p  E n g ,   V o l.   8 , N o 5 O c t obe r  20 18   :   280 4   -   2811   2806   p r ed ef i n ed  s p eak er - s p eci f i f e at u r es   s h o u l d  b e co n s i d er ed  f o r  m ea n i n g f u l  co m p ar i s o n  i n   s p eech .  I n   g e n er al ,   w e p r ef er   t h es e ch ar act er i zi n g   as p ect s  as   f eat u r e p ar a m et er s  i n  h u m an   s p eech   s i g na l .   N o on e  c a n e x pe c t  t h a t  a  un i qu e  s pe e c h s i g n a l  of  a  pe r s on s h o u l d be  un i qu e  f e a t u r e s ,  b u t  i t  i s   n ot   al w a y s  t r u e.  L e t  u s  co n s i d er  t w o  d i f f er en t  s p eak er s   w i t h  eq u al  s p eak i n g  r at w i t h  s  a s u i t ab l e f eat u r w i t h   d if f e r   p itc h .   I is   c o m p lic a te d   b y   t h e   i n tr a - v a r ia b ilit y   a n d   d e g r a d a tio n s   d is c u s s e d   e a r lie r ,   th is   i s   w h y   m a n y   f eat u r e p ar am et er s  ar e i m p o r t an t .  N o l an  h a s  r ep o r t ed  i n  h i s  ar t i cl e i d eal  s p eak er  s p eci f i c f eat u r e p ar a m et er   m u s h a v e   th e s e   p r o p e r tie s   [1 2 ] :   eas y  t o   ex t r act   an d   p r o ces s ,   r o b u s t ,   h i g h   f r e q ue nc o f   o c c ur r e nc e ,   hi g hl r e s is ti v e  to  a tte m p te d  d is g u is e  o r  m i m ic r y .  S p e a k e r - s p eci f i c f eat u r e p ar a m et er s  ca n  b e c l as s i f i ed  i n t o  s h o r t - t e r m  v e r s us  l ong - t er m ,  l i n g u i s t i c v er s u s  n o n l i n g u i s t i c,  an d  au d i t o r y   v er s u s  aco u s t i f eat u r es .  T h er e ar s t r e n gt h s   a nd   w eak n es s es   o f   au d i t o r y   an d   aco u s t i f eat u r e s .   T w o   s a m p l e s   o f   t h s p eec h   s i g n al   m a y   s o u n d   v er y  s i m i l ar ,  b u t  aco u s t i c p ar a m et er s  d i f f er   g r eat l y  [ 1 3 ].       3.   F O RE NS I C S P E AK E R R E C O G N I TI O N   I d en t i f i cat i o n  o f   f o r en s i c  s p ea k er s   n eed s  t o  r eco g n i ze  t h e  p r o b l em  o ccu r s   w h e n yo u   l e a ve  y o ur  vo i c e   as  cr i m i n al  ev i d en ce,   a t el ep h o n r eco r d i n g   o r   an   au d i b l e s p eech   b y   ear   w i t n e s s .   T h r o u g h  t h e r eco g n i t i o n   t ech n o l o g y ,  f o r en s i s p eak er s   w er e d i s c u s s ed   w i t h   s pe e c w a v e s  t h a t  1926 [ 14 ] .  L at er ,  s p ect r o g r ap h i w a s   d ev el o p ed  r ep r es en t i n g   s pe e c h  a t   A T  &  T  B e l l  L a bor a t or i e s  du r i ng  W or l d W a r  I I .  M u c h  l a t e r  i n  1970,   w h e it c a m e   t o  b e  kno w n a s  a   vo i c e  p r i nt  [ 1 5 ] .  A s  t h n a m s h o w s ,  v o i ce p r i n t   h a s  al s o  b een  p r es en t ed   w i t h   f i nge r p r i nt s  a nd  ve r y h i g h e xp e c t a t i o ns .     L a te r ,  th e  r e lia b ilit y  o f   v o i c e  p r in tin g  f o r  s p e e c h  r e c o g n iti o n  to  its  o p e r a tin g  s y s te m ,  t h e  f o r m a l   p r o c e ss,   e x a m i n e d a n d f u l l y   s u ppor t e d [ 16 ,  17 ]  w hi c i s   a n i d e a t h at   h as   g o n w r o n g , ” s ai d  [ 1 7 ] .  T oda y ,   m o s t  r es ear c h er s  b el i e v e t h at  i t  i s  b et t er  co n t r o v er s i al .  V o i ce p r i n t  a ch r o n ol og i c a l   hi s t o r y  i s  f o und  i n [ 1 8 ]  a nd   a n o ve r vi e w  o f  t he  d i s c u s s i o n  a r e  f o und  i f o r en s i s p eak e r  r eco g n i t i o n  [ 1 9 ]  h er e I   p r es en t   a n o ve r vi e w  o f   c u rre n t  t re n d s  [4 ] T o d ay ,   f o r en s i c r eco g n i t i o n  i s  p er f o r m e d  b y  t h e ex p er t  g e n er al l y  p h o n et i ci a n s   w h i c h  ar e   t y p i cal l y   i n t he  l i ng ui s t i c  a nd   s ta tis t ic a l b a c k g r o u n d .     3. 1.   D i f f eren t   A ppr o a c he s   to   F o r en s i c S p ea k er  I d e n t if ic a t io n   T h e d es cr i b ed   m et h o d s  ar d o n e b y   h u m a n  ex p er t s  i n   w h o l e o r  i n  p ar t .  W h i l t h e y  ar e a l s o   c on s i de r e d f or  t h e   f o r en s i s p eak er  r eco g n i t i o n   b y  t h co m p l et e a u t o m at ed  ap p r o ac h ,   w e d i s cu s s  t h au t o m at i c i d en t i f i cat i o n  o f   s p e ak er s  i n   l at er  s ect i o n s .  T h e au d i t o r y  p h o n et i c i an s  ap p r o ach   i s  b as ed  o n  h u m a n   au d i t o r y  s y s t e m  an d  b as ed  o n   t h ei r  e x p er i en ce t h e y  p r o d u ce a d et ai l ed  t r an s cr i p t  o f  t h e  t es t  s a m pl e s .  F or e ns i c   ex p er t s   t r y  t o   h ear  s p eci m e n   s a m p l i n g   an d  d et ect   an y   p r es en ce  o f   u n u s u al   s o un ds ,   s pe c i f i c  or   n ot e w or t hy  [2 0 ] .  E x p er t  ex p er i en ce i s  e v i d en t l y  t h m ai n  as p ect  i n  s car ce o r  t y p i cal  d eci s i o n - m ak i n g .  T h e ab o v d is c u s s e d  a u d ito r y   f u n c tio n s  a r e  u s ed  i n  t h i s  ap p r o ach .   A s  lo n g  a s  it i s  c o m b i n e d   w ith  o t h e r   m e th o d s  o f   h e a r in g  a p p r o a c h ,  it is  c o m p le te l y   s u b j e c tiv e .   A l t h o u g h t h L i k el i h o o d  R at i o  ( L R )  ca n  b e u s ed  t o  ex p r es s   r es u l t s ,  f o r en s i c ex p er t   g en er a l l y  d o  n o t  u s e t h au d i t o r y  ap p r o ach .  I n s t ead ,  o n   t h e  b a s i s  o f  th e ir  c o m p a r is o n  o f  a u d ito r y  a c tio n s ,  th e y  p r e s e n t a  s ta te m e n t o f   ev i d en ce  i n  t h e  co u r t .  T h e a u d i t o r y  s p ect r o g r a m  ap p r o ach  i s  d er i v ed  f r o m  t h v o i ce  k n o w n  i n  t h s a m w o r d   o r  p h r as e an d  t h ei r  s p ect r o g r a m s  ar v i s u al l y  a n al y zed .   A f t er  t h e d eb at e o v er   v o i cep r i n t ,  t h s p ect r o g r ap h i t ech n i q u e d ev el o p ed .  I f  t h i s  ex p l ai n s ,  t h e n  f o r en s i c e x p er t s  d i d  n o t  h av e t h e s p ect r o g r ap h s  s ep ar at i n g   v ar i ab i l i t y  b y  i n t r as p ea k er  an d  i n t er s p eak er  b y  a n o r m al  v i e w  as s es s m e n t .  S o  t h e y  h a v d ev el o p ed  d i f f er en t   pr ot oc ol s  t o  an al y ze t h e as p ect s  o f  p r e - d et er m i n ed  s p ect r o g r ap h s  t h a t  r eq u i r e t h f o r en s i c e x a m i n er .     3. 2.   Spe a k e r  R e c o g ni t i o n by  H um a n   T h e  s k ill to  d is tin g u is h  p e o p l e  b y  lis te n i n g  v o ic e  is  a  G o d s  g if te d  c h a r a c te r is tic s .   I m e n tio n e d  i n   t h e “ M a h ab h ar at a”   w h i c h s o m e   hi s t o r i a ns   s a w a s   w r i t t e n i n 4 0 0  B C  t ha t   w he n A b h i m a n yu w a s   i n hi s   m o t he r ' s  w o m b , S r i  K r i s hna   u s e d t w a l k  a r oun d S hu bh a dr a .   T o  hu m o ur  he r ,  K r i s h na   us e d  t o  r e l a t e   m a n y o f   hi s  a d ve nt ur e s  t o  t he  p r e gna nt   S ub ha d r a .  O t hi s  e xc ur s i o n,  K r i s hna  d e s c r i b e d  hi s  e x p e r i e nc e   w i t h t he   C ha kr a - V y u  t ec h n i q u e a n d  h o w  i t  co u l d  b e i n s er t ed  s t ep  b y   s t ep  i n  v ar i o u s  ci r cl e s  c o u l d  b e p en et r at ed .   H o w e v e r ,  it s e e m s  th a t S u b h a d r a  d id  n o t f in d  th i s  in te r e s tin g  to p ic  a n d  f e ll a s le e p  e a r l y .  H o w e v e r ,  s o m e o n e   e ls e  w a s  in te r e s te d   in  th e d e s c r ip tio n   o f  S h r i K r is h n a   s o f a r  A bh i m a ny u  w a s  n ot   bor n .   W e u s e s p ect r al   f eat u r es ,  i n c l u d i n g  l an g u ag e,  p r o s o d y ,  an d  l y r i cal  s t y l e,  t o  i d en t i f y  a  n u m b er  o f  d i f f e r en t  as p ect s  o f  t h e   h um a n  v oi c e ,  t o i de n t i f y  a  pe r s on .  E v e n   w i t h o u t  a  c on s c i ous  e f f or t ,  do n ot  f o r g et  t o  r em e m b er  t h es f eat u r e s .   T h er e ar e v ar i o u s  as p ect s  i n   w h i c h  t h e i n e x p er i en ced  l i s t e n er  i s  cu r r en t l y   k n o w n  ab o u t   h o w  t o   m ak s p eci f i c   s p eak er  r eco g n i t i o n  b as ed   o n  t h es e  as p ect s  ( i )  V o i ce  s e g m e n t  i d en t i f i ca t i o n  ( i i )  R eco g n i t i o n  a n d   d is c r i m i n a tio n  ( ii i)   L a n g u a g e  f a m ilia r it y  ( iv )   A b s t r act  r ep r es en t at i o n  o f  s p eech .       Evaluation Warning : The document was created with Spire.PDF for Python.
IJ E C E     I S S N :  2088 - 8708       F or e ns i c  and A ut om at i c  Spe a k e r  R e c ogni t i on  Sy s t e m   ( Sat y anand Si ng h )   2807   3. 3.   S ta te - of - t he - A rt  A u t o m a t i S p ea k er R eco g n i t i o n  S y s t e m   A S R  i s  a  m at h e m at i cal  al g o r i t h m  b as ed  co m p ut e r  s ys t e m  d e s i gne d  t o  r e c o gni s e   t he  vo i c e  o f  a   s p e a ke r  o p e r a t e d  i nd e p e nd e nt l y   w i t m i ni m u m   hu m a n i n t e r ve nt i o n.  T he  A S R   s ys t e m  a d m i n c a n a d j us t   al g o r i t h m  p ar a m et er s ,  b u t  t o  co m p ar e b et w een   s p eech  s e g m en t s ,  al l   u s er s   h a v e t o  p r o v i d e s p eech  s i g n al  t o  t he   A S R  s ys t e m .  I n t hi s  p a p e r ,  I   co n ce n tr a te   a tte n tio n  o n  th e  te x t - i n d ep en d en t  A S R  s y s t e m  a n d  t h e s p eak er   v e r if ic a tio n .   A s   m e n t i o n e d e a r l i e r ,  h um a n s  a r e   g ood i n di f f e r e n t i a t i n v oi c e d a n n on - vo i c e d  s i gna l  t ha t  i s   th e  i m p o r ta n t p a r t in  a u d ito r y   f o r e n s ic   s p e a k e r  r e c o g n itio n .   O b v io u s l y ,  i n   A S R  it   i s  d es i r ab l e t h at  t h s p eak er - s p eci f i c f ea t u r e can  o n l y  b e e x t r act ed  f r o m  t h e v o i ced  s p ee ch  s i g n al  b y  v o ic e  a c ti v it y  d e te c tio n  ( V A D )  [ 2 1 ,   22] .  D et ect i o n  an d  f eat u r e ex t r act i o n  f r o m  s p eech   s eg m e n t  i s  i m p o r t an t   w h e n  co n s i d er i n g  t h e  c on di t i on  of   ex ces s i v n o i se / d eg r ad ed  s p eech  s i g n al .  R ece n t l y   u s ed  V A D  a l g or i t hm  i s  e x pl a i n e d i n [ 21 ]  a l t ho ug m o r e   accu r at e u n s u p er v i s ed  s o l u t i o n  S p eech   A ct i v i t y  D et ect ed  ( S A D )  h as  e m er g ed  as   s u cce s s f u l  i n   v ar i o u s   A S R   a p p lic a tio n s  i n  di v e r s e  a u di o c on di t i on  [ 23 ].   S ho r t - t er m  s p eak er  s p eci f i f eat u r e i n   A S R  ap p l i cat i o n  s h o w s  t h e p ar a m et er s  e x t r act ed  f r o m  t h e   s ho r t   s e g m e nt   o f   s p e e c s i gn a l   w i t hi 2 0 - 25  m s .   I n   A S R   a ppl i c a t i on   t h e   m o s t   popu l a r   s h or t - t er m  aco u s t i c   f eat u r es  r ep o r t ed  ar e t h e Me l - f r eq u en c y  cep s t r al  co e f f i ci e n t s  ( M F C C s ) [2 4 ]  a n d  lin e a r  p r e d ic tiv e   c odi n ( L P C )  b as ed  f eat u r es  [ 2 5 ] .  S t ep s  i n v o l v ed  i n  t o  o b t ai n  M F C C  f eat u r e f r o m   s p eech  s i g n al  ar e ( i )  D i v i d s pe e c h  s i gn a l  i n t o s h or t  ov e r l a ppi n g   f or m  ( 25  m s ) .  ( i i )  M u l t i pl i c a t i on  of  t h e s e  s e gm e nt s   w i t h  H a m m i ng  a n d   H a n ni n w i nd o w  f u n c t io n  to   g e F o u r ie r  p o w e r   s p e c tr u m  ( iii)   A p p l y  lo g a r ith m  o f   th e  s p e c tr u m  ( iv )   A p p l y   n o n l i n ear  M el - s p ace f i l t er - b an k  t o  o b t ai n  s p ect r al  en er g y  i n   each  ch a n n el  ( 2 4  ch an n el   f i l t e r  b an k )  ( v )  A p p l y   di s c r e t e  c os i n e  t r a ns f or m  ( D C T )  t o obt a i n  M F C C .   A s  pr e vi ou s l y   i n d i cat ed ,  t h s p eci f i s p eak er  f eat u r e i s  t h e   d es i r ab l e q u al i t i es  o f  t h e aco u s t i c f eat u r e ar e r o b u s t n es s  t o  d eg r ad at i o n .  T h e f eat u r es  n o r m al i zat i o n  i s  o n e o f   t h e d es i r ab l e ch ar act er i s t i c s  o f  an  i d eal  f eat u r e p ar am e t er  [ 2 6 ].       4.   M O D ELI N G   O F  S TA T E - OF - TH E - ART   A SR  SY ST E M   C o n v e r tin g  a u d io  s e g m e n ts  i n to  th e  f u n c tio n a l p a r a m e te r ,  a f te r  th a m o d e lin g  p r o c e s s  s ta r te d  in   A S R .  I n   A S R   m o d el i n g  i s  a p r o ces s  f l o w   t o  cat eg o r i es  al l  s p eak er s  b as ed  o n  t h ei r  ch ar act er i s t i cs .  T h m o d el   s h oul d a l s o pr ov i de  i ts  m e a n i n g   f o r  c o m p a r is o n   w ith   u n f a m ilia r  s p e a k e r   u tte r a n c e s .  A S R   m o d e lin g  is   cal l ed   a r o b u s t   w h en  i t s  s p eak er  s p eci f i c f eat u r e ch ar act er i zat i o n   p r o ces s  i s  n o t  s i g n i f i can t l y  a f f ect ed  b y  u n w an t ed   m a la d ie s ,  al t h o u g h  t h es f eat u r es  ar e i d eal   i f  s uc f e a t ur e s   can  b e d es i g n ed  i n  s u c h  a  w a y  t h at  i n t er s p ea k er   d is c r i m i n a tio n   is  m a x i m u m ,  th e n  n o   in t r as p eak er   v ar i at i o n  e x i s t s  a n d   s i m pl e   m ode l i ng   m e t h ods  c a n be   s u f f ic ie n t.  I n  s h o r f o r m ,   th e  n o n - i d eal  p r o p er t i es  o f  t h e   s p eak er  s p eci f i c  f eat u r e e x t r a ct i o n  p h a s e r eq u i r di f f e r e n t  c o m pe ns a t i on t e c hni qu e s  d u r i ng  t h e   A S R   m ode l i n g ph a s e   s o t h a t  t h e  e f f e c t   of  t h e  di s t u r ba n c e   v ar i at i o n  p r es en t  i n  t h e s p eec h  s i g n al  ca n  b e r ed u ced   d u r i n g  t h e t es t i n g  o f  t h e s p eak er  r eco g n i t i o n  p r o ces s .   M os t  of  t h e   A S R   m ode l i ng   t e c h ni qu e s  do di f f er e n t   m a t h e m at i cal   h y p o t h es e s  ab o u t  t h e s p eak er - s p e c if ic   f eat u r es .  I f  as s u m ed  p r o p er t i es  ar e n o t   m et   f r o m  t h e s p eech   d at a,  t h en   w e ar e b as i cal l y  p r e s en t i n g   f l a w s  ev e n   du r i ng  t h e   A S R   m ode l i ng  ph a s e .   T h n o r m al i za t i o n   o f   s p eak er - s p eci f i f eat u r es   can   r ed u ce  th e s e   p r o b le m s   to   s o m e   e x te n t,   b u n o t   co m p l et e l y .   A s  a r es u l t ,   m a t h e m at i cal   m o d el s  ar e co m p el l ed  t o  ad o p t  t h e ch ar act er i s t i cs  a n d  s p eak er   r eco g n i t i o n  s co r es  ar e o b t ai n ed  b as ed  o n  t h es m o d el s  an d  t es t  s p eech  d at a.  T h u s ,  i n  t h i s  p r o ces s ,  t h e   pr ope r t i e s  of   d et ect i n g  ar t i f ac t s  ar e i n t r o d u ced  an d  a f a m i l y  o f  s co r e s t a n d ar d i zat i o n  t ech n i q u es   h as  b ee n   pr op os e w h i c h i s  pr opos e d t o c om pl e te   th is  f i n a l s ta g e  m is m a tc h   [ 2 7 ].   I n  e s s e n ce,  t h d ecl i n e i n  aco u s t i s i g n al   a f f ec t s   t h e s p eak er - s p e ci f i f eat u r e s ,  p at t er n s ,   an d  s co r es .   T h er ef o r e,  i t  i s  i m p o r t an t  t o  i m p r o v e t h e   r o b u s t n es s  o f   A S R  s y s t e m s  i n  al l  t h r ee d o m ai n s .  I t  h as  b een   m en t i o n ed  r ecen t l y  t h at  s p eak er  m o d el i n g   t ech n i q u es   h a v e i m p r o v ed  an d  s co r e n o r m a l i zat i o n  t ec h n i q u es  ar e n o t   m u ch  e f f ect i v e [ 2 8 ,   2 9 ].     4. 1.   AS Sy s t e m  B a s e d o G a us s i a n M i x t ur e   M o de l  ( G M M )   W he n t he r e  i s   no  p r i o r  kno w l e d ge  o f  s p e e c h c o nt e nt  i n t e xt - i n d ep en d en t   s p eak er  r eco g n i t i o n  t as k s ,   i t   h as  b een   f o u n d  t h at  G M M   ap p l i cat i o n s  ar m o r e ef f ect i v e f o r  aco u s t i m o d el i n g  t o  s h ap e s h o r t - t e r f u n c tio n a lit y.  T he  a ve r a ge  b e ha vi o r  o f  t hi s  i s  e xp e c t e d   s ho r t - t er m  s p ect r al   f eat u r es  ar m o r e  d ep en d en t  o n   s p eak er s  t h an  b ei n g  i n f l u e n ce d  b y  t h e t e m p o r ar y   f eat u r es .   T h er ef o r e,  ev en   w h en  t h e t e s t  d at a o f  A S R   h a s  a  d i f f er e n t  aco u s t i s i t u at i o n ,  t h en  d u e t o  G M M  b ei n g  a p o te n tia m o d e l it  m a y  b e  r e la te d  to   b e tte r  d a ta  th a n   th e   m o r e  r e s tr ic tiv e   V e c to r  Q u a n tiz a tio n ( V Q )   m o d e l.   A  G M M  is  a   m ix t u r e  o f  G a u s s ia n   pr oba bi l i t y  de n s i t y   f u nc t i o ns  ( P DF s ) ,  p ar a m et er i zed  b y  a n u m b er  o f   m ea n   v ect o r s ,  co v ar i an ce  m a t r i ces ,   an d   w e i g h t s  o f  t h i nd i vi d ua l   m i xt ur e  c o m p o ne n t s .   T h e  te m p la t e  i s  a   w e i gh t e d s um  of  i n di v i du a l   P D F s.   T he  d e ns i t y  o f  t he   G au s s i a n   m i x t u r e i s  t h w ei g h t ed  s u m  o f  M  co m p o n e n t  d en s i t i es  an d  i t   r ep r es en t ed  m at h e m at i cal l y :       p ( x | λ ) = p i b i ( x ) M i = 1                 (1 )     Evaluation Warning : The document was created with Spire.PDF for Python.
            I SSN :   2088 - 8708     In t  J  E l e c  &  C o m p  E n g ,   V o l.   8 , N o 5 O c t obe r  20 18   :   280 4   -   2811   2808   W h er x   r ep r es en t s  D - di m e ns i on  r a n do m  v e c t or s ,  c o m pone n t  de n s i t i e s   b i ( x ) , i = 1 , . . , M   ,  a nd  m i xt ur e   w ei g h t  r ep r es en t ed  b y   p i .  E ach  co m p o n en t  d en s i t y  i s  a D   v ect o r   G a us s i a n f u nc t i o n o f  t he  f o r m       b i ( x ) = 1 ( 2 π ) D 2   | i | 1 2 ex p 1 2 ( x μ i ) , ( x μ i ) 1 i           (2 )     μ i   r ep r es en t s  m ean  v ect o r ,   i   r ep r es en t s  co v ar i a n ce  m a t r i x .  T h e  co m p l et e d en s i t y  o f  t h e G a u s s i an   m i x t u r e i s   p ar am et er i zed  b y  t h m ea n  v ect o r ,  co v ar i an ce  m at r i x   an d   m i x t u r e co m p o n en t s  o f  al l  d en s i t y .  T h es e   p ar am et er s  ar r ep r es en t ed  co l l ect i v el y  b y  s i g n al i n g     λ = { p i , μ i , i }   i = 1 , . . , M                 (3 )     F o r  A S R  s y s t e m ,  each  s p eak e r  i s  r ep r es en t ed  b y  o n e b y  t h G MM  an d   i s  r ef er r ed  t o  b y  h i s / h er   m ode l   λ .  T he   s i ze o f  G M M   m a y   v ar y  d ep en d i n g  o n  t h e ch o i ce o f  co v ar i an ce  m at r i x .  T h e G M M m o d el  can  b e ev al u at ed   u s i ng  t h e  pr oba bi l i t y  of  a  v e c t or  a t t r i bu t e  i n  e qn .  ( 1) .     4. 2.   Suppo r t  V e c t o r  M a c hi ne s  ( S V M s )   A n  S V M  i s  a b i n ar y  cl a s s i f i er  t h at   m a k es  i t s  d eci s i o n s  b y  c o n s t r u ct i n g  a l i n ear  d eci s i o n  b o u n d ar y  o r   h y p er p l an e t h at  o p t i m al l y  s ep ar at es  t h e t w o  cl as s e s .  D ep en d i n g  o n  i t s  p o s i t i o n  i n  r el at i o n  t o  H y p er p l an e,  t h e   m o d el  can  b e u s ed  t o  p r ed i ct  t h e cl as s  o f  u n k n o w n  o b s er v at i o n .  L et  u s  co n s i d er  t r ai n i n g  v ect o r  an d  l a b el s  as   ( x n ,   y n )   x n d y n   { 1 , + 1 } n { 1 ,   T }   t h e  opt i m a l  hy pe r pl a n e  i s  c h os e n  a c c or di n g  t o  t he   m ax i m u m   m ar g i n  cr i t er i o n  t h en  t ar g et  o f  S V M ca n  b e l ear n  t h e f u n ct i o n   f : d   s o  t h at  t h e cl as s  l ab el s  o f   an y   u n k n o w n   v ect o r  x  can  b ex p ect ed  as   I ( x ) = s ig n f ( x ) .   F o r  lin e a r l y  s ep ar ab l e d at a  l a b el ed  [ 5 ,  3 0 ] ,  hy p e r p l a i H   c a n  be  obt a i n e d f r om   x T x + b = 0 ,  wh i c h   s ep ar at es  t h e t w o  cl as s  o f  d a t a,  s o  t h at   y n ( w t x n + b ) 1 ,   n . T .   A n  o p ti m a l lin e a r  d iv id e r   H   pr ov i de s   ma x i mu m a r g i n s  b et w ee n  cl as s es ,  i . e.  t h e d i s t a n ce b et w e en   H   a n d  th e  tr a in in g  o f  t w o  d if f e r e n t s e c tio n s  i s   hi g he s t  i n t he  d a t a  e s t i m a t e s .   T he   m a xi m u m   m a r gi n i s  f o un d  i n t he  f o r m  o f   2 w   a n d da t a  poi n t s   x n   f or  w hi c y n ( w t x n + b ) 1   t ha t  t he   m a r g i n i s   kno w n  a s  s up e r  ve c t o r s .  W he A S R   t r a i ni ng d a t a  i s  no t  l i ne a r l s ep ar ab l e,  t h en   s p eak er  s p eci f i f eat u r es  ca n  b m ap p ed  t o  a h i g h er  d i m en s i o n a l  s p ac e,  i n   w h i c h   k er n el   f u n ct i o n s  ar e l i n ear l y  d i v i d ed .     4. 3.   F a ct o r A n a l y s i s  ( F A )  o f  t h G M M  S u p erv ect o rs   T h e  pu r pos e  of  t h e   F A  i s  t de s c r i be   v a r i a bi l i t y  i n   h i g h di m e ns i on a l  obs e r v a bl e  da t a  v e c t or  u s i ng  l e s s  num be r  of  u n obs e r v a bl e / h i dde n  v a r i a bl e s .  F or  A S R  a ppl i c a t io n ,  th e  id e a  o f   e xp l a i ni n p eak er ’s   an d   ch an n el - d ep en d en t  v ar i ab i l i t y   i n  t h e G M M  s u p er v ect o r  s pa c e ,  F A  h a s  be e n us e d i n [ 31 ] .  M an y   fo r m s  o f F A   m e t ho d s  ha ve  b e e n  e m p l o ye d  s i nc e ,   w h i c ul t i m a t e l y b r o u g ht  t he  c ur r e nt   s t a t e  o f  t he   a r t i - v ect o r  ap p r o ach .   I a l i n ear  d i s t o r t i o n   m o d el ,  a s p eak er - d ep en d en t  G M M s u p er v i s o r   m s   i s  g e n er al l y  co n s i d er ed  as  f o u r   c o m p o ne nt   w h i c h a r e  l i ne a r  i n  na t ur e .     m s , h = m 0 + m sp k + m ch + m r e s               (4 )     W h er m 0   i s  s p eak er  ch an n el   e n vi r onm e nt - i n de pe n de nt  c om p on e n t m sp k   i s  s p eak er  d ep en d an t   co m p o n e n t ,   m ch   i s  c ha nne l  e nvi r o n m e nt  d e p e nd a nt  c o m p o ne nt  a nd   m r e s   is  r e s id u a l.   T h e   j o in t F A  ( J F A )  m o d e l is   pr e pa r e d i n  c on j u n c t i on   w it h   e ig e n v o ic e  a n d  e ig e n c h a n n e l,   w h ic h  is  a c h ie v e d   w it h  a  M A P  o p tim iz a tio n  f o r  a   m o d e l .  T he  s ub - s p aces  ar e al i g n ed  b y  V  a n d  U   m at r i x ,  as   t h e f i r s t   m o d el  r eco m m e n d s   f o r  an  i n f o r m a l  ch o i ce   o f  s p eak er s   s   a n d  se ss i o n s   h ,   m e an  s u p er v ect o r  o f  G M M can  b e r ep r es en t ed  b y     m s , h = m 0 + U Xh + V ys + D Z s , h               (5 )     S o n o w  t h i s  i s  t h e  on l y   m ode l ,   w h i c h   w e  a r e  c ons i de r i ng  a l l  t h e   f ou r  c o m po n e n t s  of  l i n e a r  di s t or t i on   m ode l   w e d i s c u s s ed  ear l i er .  I n  f act ,  J F A  h as  b ee n  s h o w n  t o  o v er co m e o t h er  cu r r e n t   m e t h o d .     4. 4.   i - V ect o r A p p ro a ch   I a n  e f f o r t to  u n i f y  th e  s tr e n g th  o f  t h e s e  t w o   m e th o d s ,   m o d e r n  A S R   s y s te m s  a t te m p te d  to  u tiliz e   J F A  a s  a  s p eak er  s p eci f i f eat u r e ex t r a ct o r  b y  D e h a k  et  al .  [ 32 ]  fo r   S V M .  I n  t h e  i n itia l e f f o r t   s p eak er  f act o r s   es t i m at i o n   J F A   w er u s ed  as  s p eak er   s p eci f i c f ea t u r e f o r   t he   S V M   c la s s if ie r s .  K e e p in g   in   m i n d   th a t e v e n   ch an n el  f act o r s  h a v e  i n f o r m at i o n  o f  s p ea k er s  a n d  t h e c h an n el  h a s  b een  ad d ed  t o  a s i n g l s p ace,  cal l e d  to ta l   Evaluation Warning : The document was created with Spire.PDF for Python.
IJ E C E     I S S N :  2088 - 8708       F or e ns i c  and A ut om at i c  Spe a k e r  R e c ogni t i on  Sy s t e m   ( Sat y anand Si ng h )   2809   v a r ia b ilit y  s p ace [ 33 ] .  T h e F A   m o d el   t h at  d ep en d s  o n ,   s p eak er  an d   s es s i o n   i s  r ep r es en t ed  b y  a  G MM  s up e r vi s o r  a s     m s , h = m 0 + T Ws , h                 (6 )     T Ws , h   i s  cal l ed  t o t al   f act o r .  L i k e al l   t h e F A   m e t h o d s  d es cr i b ed  ab o v e,  h i d d en  v ar i ab l es  ar n o t  o v er l o o k ed ,  b u t   t h ei r  p o s t er i o r  ex p ect at i o n  ca n  b e es t i m at ed .  T h e t o t al  f act o r  es t i m at e,   w h i ch  ca n  b e u s e d  as  f eat u r e s  i n t he   n ex t   s t a g e o f  t h e cl a s s i f i er   n a m ed  as  i - v ect o r s .     4. 5.   L i n e ar  D i s c r i m i n an t  A n al ys i s  ( L D A )  ap p r oac h   L D A  is  a  c o m m o n l y  e m p lo y e d  te c h n iq u e  i n   s ta ti s tic a l p a tte r n  r e c o g n itio n   th a t  a i m s  a t  f in d in g   lin e a r   c o m b i n a tio n s  o f   f e a t u r e  c o e f f ic ie n ts  to  f a c ilita te  d is c r i m i n a tio n  o f   m u ltip le  c la s s e s .   I t  f i nd s  o r t ho go na l   o r ie n ta tio n  i n  p la c e  o f   m o s t e f f e c ti v e  f u n c tio n s   i n c l a s s  d i s c r i m i na t i o n.  B y  i nt r o d uc i ng t he   o r i gi na l   f e a t ur e s  i n   t h es g u i d el i n e s ,  t h e acc u r ac y  o f  cl as s i f i cat i o n  i m p r o v es .   L e t  u s  i n d i cat e s et  o f  al l  d ev el o p m en t  u t t er an ces  b y   D ,  u t t er an ce  f eat u r es  i n d i cat ed   b y   w s , i ,  th e s e  f e a tu r e s  o b ta in e d  f r o m  th e   ith   u t t er a n ce o f   s p eak er   s ,  th e  to ta l   n um be r  of  ut t e r a n c e s  be l on g i n g  t s   is  in d ic a te d  b y   n s   a n d t ot a l  n um be r  of  s pe a k e r s  i n   D   is  i n d ic a te d  b y   S C l as s  co v ar i an ce  m at r i ces  b et w ee n   S b   a nd  w i t hi n   S w   a r e  gi ve n b y     S b = 1 S ( w s w ) ( w s w ) T S s = 1               (7 )     S w = 1 S 1 n s w s , i w s w s , i w s T n s i = 1 S s = 1           (8 )     W h er e t h s p eak er  d ep en d a n t   m ea n   v ect o r  i s   g i v e n  b y   w s = 1 n s w s , i n s i = 1   an d  s p eak er   i n d ep en d en t  m ea n   ve c t o r  i s  gi ve n b y   w = 1 S 1 n s w s , i n s i = 1 S s = 1   r es p ect i v el y .  T h e L D A  o p t i m i zat i o n  i s  t h er ef o r e t o  m ax i m i ze  b et w ee n  cl as s   v ar i a n ce,   w h er e as  r ed u ci n g   w i t h i n  t h e cl a s s   v ar i an ce.  T h e ex act  es t i m at i o n   can  b e o b t ai n  f r o m   th is  o p ti m iz a tio n  b y  s o lv in g   g en er al i zed  ei g e n v al u e p r o b l e m :     S bV = S w v                   (9 )     T h e  d ia g o n a m a tr ix  c o n ta in i n g  o f  e ig n v e c to r  is  in d ic a te d  b y   .  I f  t he   m a t r i S w   i n e q n.  ( 8 )  is  in v e r tib le  th e n   t h e  s ol u t i on  c a n  be  e a s i l y   f ound by   S w 1 S b .   A L D A   m a t r i x  of  di m e ns i on   R × k   is   a s  f o llo w s     A L D A = [ v 1 . . v k ]                   ( 10)     k  ei g en v ect o r s   v 1 . . v k   o b t a i ne d  b y s o l vi n g e q n.  ( 9 ) .  T h u s ,  t h L D A  ch a n g e o f  t h e  u t t er an ce  f eat u r w   is   o b ta in e d  in  th i s   w a y     Φ L D A ( w ) = A L D A T w                 ( 11)     4. 6.   N u i s a n c e  A ttr i b u te  P r o je c ti o n  (N A P )   T h e  a p p lic a tio n  o f  N A P   a l g or i t hm  i A S R  r e por t e d i n [ 34 ] .  I n   N A P  t ech n i q u e t h s p eak e r  s p eci f i c   f eat u r s p ace  i s   r ep l aced   b y   co m p l e m e n t ar y   ch a n n el   s p ac u s i n g   a n   o r t h o g o n al   p r o j ect i o n ,   w h i ch   d ep en d s   o n l y   o n  t h e s p ea k er .   T h p r o j ect i o n   m at r i x  o f  s i ze  d × d   i s  cal cu l at ed  u s i n g   co v ar i an ce  m a t r i x   o f  co - r a nk  k < d   a P = I u [ k ] u [ k ] T .  T h e l o w  r an k  r ect an g u l ar   m at r i x   u [ k ]   w h o s e co l u m n   i s   k  p r i n ci p al  ei g en v ect o r s  o f   t he  w i t hi n - c l as s  co v ar i an ce  m at r i x   S w   i n e q n.  ( 8 ) .   T h e  N A P  i s  pe r f or m e d on   w   a Φ N A P ( w ) = Pw .     4. 7.   W it h in - C l as s  C ovar i an c e  N or m al i z at i on  ( W C C N )   T he  m a i go a l  o f  W C C N   n or m a l i z a t i on  t o i m pr ov e  t he  r obu s t n e s s  of   t he  S V M - b a se d  A S f r am ew o r k  [ 35 ]  u s i n g  a co n s i s t en t  o p p o s i t e d eci s i o n  ap p r o ach .  T h e ai m  o f   t h e W C C N  l au n c h  i s  t o  r ed u ce   f al s e a l ar m  r at e s  an d   m i s s - e r r o r s  r a te s  d u r in g   S V M  tr a i n i n g .  C o v a r ia n c e   m a tr ix   w i th in - c l a s S w   is  c a lc u la te d   us i n g e q n.  ( 8 )  a n d pr oj e c t i on   on  W C C N   i s  pe r f or m e d a s   Φ W CCN ( w ) = A W CCN T w .   W i t h t he   he l p  o f   C ho l e s k f a c to r iz a tio n  o f   S w 1   A W CCN   i s c o m p u t e d  a S w 1 = A W CCN A W CCN T .  U nl i ke   L D A  a nd  N A P ,  t he  p r o j e c t i o n o f   W C C N  eas i l y  co n v er s e s  t h f e at u r e s p ace.         Evaluation Warning : The document was created with Spire.PDF for Python.
            I SSN :   2088 - 8708     In t  J  E l e c  &  C o m p  E n g ,   V o l.   8 , N o 5 O c t obe r  20 18   :   280 4   -   2811   2810   5.   A S R P E RF O RM ANCE  E V AL U A T I O N I N S T ANDAR D S P E E CH  DAT S E T S  A ND T Y P E O F  E RRO R   P er f o r m a n ce ev al u at i o n  o f   A S R  s y s t e m  i s  o n e o f  t h m a i n  as p ect s  o f  t h e r es ear ch  c y cl e.  I t  i s   s t r o ng l y d e p e nd e nt  o n t he   va r i a b i l i t y o f   t he  vo i c e   s i gna l ,  no i s e  a nd  d i s t o r t i o n  i n  t he  c o m m u ni c a t i o n c ha nne l .   R e c ogn i t i on h a s  t f a c e  m a ny   pr obl e m s :  un r e s t r i c t e i np ut  s p e e c h,   no n - co - o p er at i v s p eak er  a n d   unc o nt r o l l e d  e nvi r o n m e nt a l   no r m s .  T he r e  a r e  t w o  t y p e s  o f  e r r or s  m a y  o c c ur  i n s u c h d e c i s i o m a ki ng   p r o ces s es  i n   A S R  s y s t e m  ( i )  f al s e r ej ect i o n  ( i n  o t h er   w o r d s   n o n - d e te c tio n ) ,  th a t is ,  th e   s y s te m  d is a p p r o v e s  a   ge n ui n e i d en t i t y  cl a i m  o f  a s p eak er  u n d er  s cr u t i n y  a n d  ( i i )  f al s e accep t an ce ( i n  o t h er   w o r d s  f al s e al ar m ) ,  t h at   is ,  th e  s y s te m  a p p r o v e s  t h e  id e n tit y  c la i m  o f  a n  i m p o s to r .     T h es e er r o r s  ar e q u an t i f i ed   as  p er f o r m a n ce   m eas u r es  o f  a s ec u r i t y  s y s t e m .   T h e y  ar e ( i )  F al se   R ej ect i o n  R at e ( F R R ) ,   w h i c h  i n d i cat es  t h e p er cen t a g e o f   i n c o r r ect l y  r ej ect ed  cl i en t s  an d  ( i i )  F al s A ccep t an c e   R at e ( F A R ) .  I n  a  r e a l lif e  s it u a tio n ,  a  b io m e tr ic  s e c u r it y   s y s te m ,   w h ic h  is   u s u a ll y  i m p e r f e c t,  th e  c h a r a c te r is tic   c u r v e s o f  F RR a n d  F A R i n t e r s ect  at  a cer t ai n  p o i n t  cal l ed  ‘ E q u al  E r r o r  R at e ( E E R ) .  I f  o n e f i x e s  a v er y   l o w   t hr e s ho l d  va l ue ,  t he n t he  s ys t e m   w o ul d  e x hi b i t  ve r y   l o w   F R R   a nd  ve r y   hi g F A R  a nd  a c c e p t  a l l  i d e nt i t c l a i m s .   A l t e r na t i ve l y ,  i f  o ne  f i xe s  a   ve r y   hi g h t hr e s ho l d  va l u e ,  t he n t he   s ys t e m  w o ul d   e xhi b i t   ve r y hi g h F R R   an d  v er y  l o w  F A R  an d  r ej ec t  al l  i d en t i t y  cl ai m s .  I n  t h i s  c o n t ex t ,  o n e co u l d  p l o t  a cu r v e cal l ed  ‘ R ecei v er   O p e r a tin g  C h a r a c te r is tic  ( R O C ) ,   w h ic h  i n v o lv e s  F R R  a n d   F A R .   R O C  c u r v e   is  a  g r a p h ic a l in d ic a tio n  o f  t h e   s y s t e m p e r f o r m an ce.   A s   m e nt i on e d a bov e ,  E E R  doe s  n ot  di s t i ng u i s h be t w e e n t w o t y pe s  o f  e r r or s   w hi c h a r e  s om e t i m e s   u n r eal i s t i c p er f o r m an ce  ev al u at i o n  o f   A S R .  T h er e f o r e,  t h e d et ect i o n  co s t   f u n ct i o n  ( D C F )  i n t r odu c e s  t he   n u m er i cal / pe n a l t y  c os t   f or  t w o t y pe s  o f  e r r or s .  T h e   pr i or i  pr oba bi l i t y  of  e n c oun t e r i n g a  t a r g e t  s pe a k e r   p r o v i d es  p r i o r i t y  an d  D C F  i s  cal cu l at ed  as  t h e d eci s i o n  t h r es h o l d  v al u e as   DC F ( τ ) = C M IS S P ( τ ) P t ar g et + C FA P FA ( τ ) 1 P t ar g et .  W h e r e  C o s t o f  a   m is s /F R  e r r o r  is  in d ic a te d  b y   C M IS S ,  C o s t o f  a n   F A  e r r o r  is  in d ic a te d   b C FA ,  P r io r  p r o b a b ilit y  o f  ta r g e t  s p e a k e r  is  in d ic a te d  b y   P t ar g et ,  P r o b a b ilit y   o f   ( M I SS | T a r g et ,   T h r e s h o l d = τ )   is  in d ic a te d  b y   P m i ss ( τ )   a n d P r oba bi l i t y  of   ( F A | no nt a rg e r ,   T h r e s h o l d = τ )   is  in d ic a te d  b y   P FA ( τ ) .   T h e  a bov e  t h r e e  qu a n t i t i e s  i n  N I S T  S R E  2008  C M IS S = 1 0 C FA = 1   a nd   P t ar g et = 0 . 0 1   ar p r e d e f i ne d .  I n ge ne r a l ,  t he  go a l  o f  t he   A S R  s ys t e m  d e s i g n e r  i s  t o  f i nd  t he  o p t i m u m   t hr e s ho l d  va l ue   w hi c h   r ed u ces  t h e D C F .  N o w ,  t h e p r i o r  v al u P t a rge t = 0 . 0 1   i n d i cat es  t h at   A S R   s y s t e m   w i l l  b e d et ect ed  af t er   ev er y   100 a t t e m pt s  t o c h e c k t h e   s p eak er .   W he t he  s p e a ke r  r e c o gni t i o n p e r f o r m a nc e   i s  e va l ua t e d  i n d i f f e r e nt   o p e r a t i o na l  p o i nt s ,  t he n t he  e r r o r  d e t e c t i o n c ur ve  ( D E T )  i s  u s ua l l us e d .  D E T  c ur ve  i s  a   F A R  e rro r p l o t   c om pa r e d t o F R R / m i s s .  W h e n  t h e p er f o r m an ce o f  t h A S R   s y s t e m  i m p r o v es ,  t h c ur ve   m o ve s  t o w a r d  o r i gi n.   T h e D E T  cu r v e n ear es t  t o  o r i g i n  r ep r es en t s  a b et t er   A S R  s y s t e m .       6.   CO NCL U S I O N     T h e r e   i s   s t i l l   a  l ot  o f   w or k  t f u l l y   un de r s t a n t h e   w a y   t o de c i de   on   t h e   c o n t e nt   of   hum a n   br a i s p eech  an d  s p eak er s .  H o w e v e r ,  w h at   w e k n o w ,  i t  can  b s a i d t h a t  t h e  A S R  s y s t e m  s h ou l d f oc us   on  i m pr ov i n p e r f o r m a nc e ,  m o r e   o n hi gh - l e v el  s p eak er - s p eci f i f eat u r es .  H u m an  b ei n g s  ar e ef f ect i v e i n  t h e i d e n t i f i cat i o n   o f  u n i q u e s p ea k er s ;  t h e y   k n o w  i t  v er y   w el l ,   w h i l A S R  s y s t e m s  ca n  o n l y  l ear n  a s p eci f i c s ec t i o n  i f a   m eas u r ab l e f u n ct i o n  p ar a m et e r  can  b e d ef i n ed  co r r ect l y .   A   l ar g e n u m b er  o f  a u t o m a t ed  s y s t e m s  au d i o  i s  b et t er   i n  r es ear ch i n g  an d  p o s s i b l y ,   m o r e e f f ect i v e t o  r ed u ce t h e l i k el i h o o d  o f  t h o s e a u d i o  s a m p l es  b ei n g   s p eak er s   m a tc h e s ; w h ile  h u m a n s  a r e  b e tte r  to  c om pa r e  a  s m a l l e r  s u bg r o u p a n d do n ot  m a t c h  t h e   m i c r oph o n e  or   ch an n el   m o r e eas i l y .  I t  ca n  b e u s ef u l  t o  ch ec k  e x act l y   w h at  t h e “k n o w ” o f  a s p e ak er   m ea n s   f r o m  a  p er s p ect i v e o f  a  u s e f u l  s y s t e m .  T h e d i s co v er y  o f  al t er n at i v e co m p act  s p ea k er  r ep r es en t at i o n s  a n d  a u di s eg m e n t s  t h at  e m p h as i ze r el ev an t  i d e n t i f i cat i o n  p ar am e t e r s ,   w h i l e el i m i na t i ng  nui s a nc e  c o m p o ne nt s   w i ll  a l w a ys  b e  a  c o nt i n uo us  c ha l l e nge   f o r   s ta te - of - t he - a r t  A S s y s t e m  d ev el o p er s .       R EF ER EN C ES     [ 1]   S y ei v a N u r u l  D es y l v i e t a l,   M ode l i ng  T e x t  I nde pe nde nt  S p e a k e r  I de nt i f i c a t i on w i t h V e c t or  Q ua nt i z a t i o n,   T E L KO M NIKA ,  v ol . 15( 1) ,   20 17,   pp.  32 2 - 327 .   [ 2]   E . F o r m i s a n o et  a l ,    ‘ W ho’  i s  s a y i ng ‘ w ha t ?  B r a i nba s e d de c odi n g  of  hu m a n v oi c e   a nd s pe e c h,   S ci en ce ,  v ol .  32 2,   200 8,  pp .   9 70 97 3 .   [ 3]   D.   A .  R e y nol ds ,   et  a l ,  “S p eak er   v er i f i cat i o n  u s i n g  ad ap t ed  G au s s i an   m i x t u r m o d el s ,   D ig ita l S ig n a l Pr o c e s , v o l 10 (1 ) ,   20 00,   p p.  19 41 .   [ 4]   J ohn  H . L .  H a ns e n a nd T a uf i q H a s a n,  “ S pe a k e r  R e c og ni t i on by  M a c hi ne s  a nd H um a ns .   I E E E  S i g n a l  P r o c e s s Ma g .,  20 15,  p p.   74 - 9 9.   [ 5]   A m a li M a r y  B a s tin a  ,  N .   R a m a ,  “ B io m e tr ic  I d e n tif ic a tio n  a n d  A u th e n tic a tio n   P r o v id e n c e  u s in g  F in g e r p r in t f o r   C l o u d  D at a A cc es s , ”  I nt e r nat i o na l  J our n al   of  E l e c t r i c al  a nd C om p ut e r  E n gi ne e r i n g   ,   vol .  7 ( 1 ) ,   20 17,  p p.  40 8 - 41 6.   Evaluation Warning : The document was created with Spire.PDF for Python.
IJ E C E     I S S N :  2088 - 8708       F or e ns i c  and A ut om at i c  Spe a k e r  R e c ogni t i on  Sy s t e m   ( Sat y anand Si ng h )   2811   [ 6]   A .  D.   L a wso n ,   et  a l ,   “T h e m u l t i - s e s s i on a udi o r e s e a r c h pr oj e c t  ( M A R P )  c or pus :  G oa l s ,  de s i g n a nd i ni t i a l  f i ndi ng s ,   i n P r oc .  I nt e r s pe e c h,  B r i gh t o n,  U . K .,   20 09 ,  p p.   18 11 18 14 .   [ 7]   L .  A .  R a m i g  an d  R .  L .  R i n g el ,   “E f f e ct s  o f  p h y s i o l o g i cal  ag i n g   o n  s el ect ed  aco u s t i c ch ar act er i s t i cs  o f  v o i ce, ”  J Spe e c h L an g.  H e ar i ng  R e s .,  v o l . 2 6 ,   1 98 3,   p p.  22 30 .   [ 8]   F .  N o l an  an d  T .  O h ,  “I d e n t i cal  t w i n s ,  d i f f er en t  v o i ces , ”  I nt .  J .  S pe e c h L a ng.  L aw ,  v o l . 3 (1 ) ,   19 96,   pp.  3 9 49 .   [ 9]   W .  D.  V a n   Gy se l ,   et  a l ,   V o ic e  s im ila r it y  in  id e n tic a l tw in s ,   Ac ta  O to r h in o la r y n g o l . B e l g . ,  vo l .  55   (1 ) ,   200 1,   p p 49 - 55.   [ 1 0]   K .  M .  V an  L i er d e,   et  a l ,  “G en et i cs  o f   v o cal  q u al i t y   ch ar act er i s t i cs  i n  m o n o z y g o t i c t w i n s :  a  m u l t i p ar a m et er   ap p r o ach , ”  J.  V o i ce ,  vo l .  19 ( 4 ) ,   20 0 5,   pp .  5 11 - 51 8 .   [ 1 1]   D .  L oa ke s ,  “ A   f or e ns i c  phone t i c   i nv e s t i g a t i on i nt o t he  s pe e c h pa t t e r ns  of  i de nt i c a l  a nd non - i d e n tic a l tw in s ,   I n t .  J.   Spe e c h L an g.  L aw ,   vol .  1 5 ( 1 ) 20 08,  pp .   9 7 - 10 0 .   [ 1 2]   F . N o l a n T he  P h one t i c   B as e s  of   Spe ak e r  R e c og ni t i on .  C am b r i d g e,  U . K . :  C am b r i d g e U n i v .   P r es s ,  19 83.   [ 1 3]   F .  N ol a n,  “ T he  l i m i t a t i ons  of   a udi t or y - p h o n et i c s p eak er  i d en t i f i cat i o n , ”  i n T e x t e  Z ur  T he or i e  U nd P r ax i s   F o re n si sc h e r L i n g u i st i k ,  H.  K n i f f k a ,  E d .  B e rl i n ,  Ge rma n y :  D e  G r uy t e r ,  199 0,   pp .  4 57 47 9.   [ 1 4]   J .  H .  W i gm or e ,  “ A  ne w   m od e  o f   id e n tif y in g  c r i m in a ls ,   A me r I n st .  C ri m.  L .  C ri mi n o l o g y  1 6 5 ,   vol .  1 7 ( 2 ) ,   pp .  1 65 - 166 ,  A ug .  19 26 .   [ 1 5]   L .  G .  K e r s ta ,  “ V o ic e p r in i d e n tif ic a tio n ,   T he  J our n al  of  t he  A c o us t i c al  Soc i e t y  of  A m e r i c a ,  v ol .  34( 5) ,  20 05 ,   p p.   725 - 7 35.   [ 1 6]   F aj r i  K u r n i aw an  ,   et  a l . ,  “ S ta tis tic a l B a s e d   A u d io   F o r en s i c o n  I d en t i cal  M i cr o p h o n es ,   I nt e r nat i o nal  J o ur na l  of   E l e c t r i c al  a nd C om p ut e r  E n gi ne e r i ng,   vol .  6 ( 5 ) ,   2 01 6,  pp.   2 21 1 - 221 8   [ 1 7]   H .  F .  H o llie n ,   Fo r e n s ic  V o ic e  I d e n tific a tio n .  N e w  Y or k :  A c a de m i c   P r e s s ,   20 02.   [ 1 8]   L .  Y ount ,   F o r en s i S ci en ce:  F r o m  F i b er s  t o   F i n g e rp ri n t s .  N e w  Y or k :  C he l s e a  H ous e ,   20 07.   [ 1 9]   J . P C a m p b e l l et  a l ,  “F o r en s i c s p eak er  r e co g n i t i o n , ”  I E E E  S i g n a l  P r o c e s s M a g ., v o l . 2 6 (   2 ) ,   20 09,   pp.  95 10 3 .   [ 2 0]   G .  S .  M or r i s on,  “ F or e ns i c  v o i c e  c om pa r i s on,   i n  E x pe r t  E v i de n c e  99,   1 e d .  L on do n:  T hom ps o n  R e ut e r s ,  20 1 0 C ha p.  99,   p p .  10 51 - 10 71 .   [ 2 1]   S .  S i ng h,  A bha y  K u m a r ,  D a v i d R a j u K ol l ur i ,  “ E f f i c i e nt  M ode l l i ng  T e c hni que  ba s e d S pe a k e r  R e c og ni t i o n un de r   L i m i t ed  S p eech  D at a , ”  I nt e r nat i o nal  J our n al   of  I m age ,  G r a ph i c s  a nd  Si g na l  P r oc e s s i ng .  v o l .8 ( 11 )  20 1 6,   p p. 41 - 48.   [ 2 2]   F .  Be ri t e l l i  an d  A .  S p ad acci n i ,   “T h e r o l e o f  v o i ce act i v i t y  d et e ct i o n  i n  f o r en s i c s p eak er  v er i f i c at i o n , ”  i n P r oc .   D i gi t al  Si gn al  P r oc e s s i ng ,  20 11 ,  pp.  1 6.   [ 2 3]   S .  O .  S ad j a d i  an d  J .  H .  L .  H an s en ,  “U n s u p er v i s ed  s p eech  act i v i t y   d et ect i o n   u s i n g  v o i ci n g  m eas u r es  an d  p er cep t u al   s p ect r al  f l u x , ”  I E E E  S i g n a l  P r o c e s s . L e t t ., v o l . 2 0 ( 3 ) ,   20 13 ,  p p.   19 7 2 00 .   [ 2 4]   S . S i n g h  an d  D r .  E . G .  R aj an  “M F C C  V Q  B as ed  S p eak er  R ec o g n i t i o n  an d  I t s  A ccu r ac y   A f f e ct i n g  F act o r s ”  I nt e r nat i o nal  J our n al   of  C om p ut e r  A ppl i c at i on . vo l  21 ( 6 ) ,   20 11 ,   pp 1 - 6 .   [ 2 5]   H .  H er m an s k y ,  “P er cep t u al  l i n ea r  p r ed i ct i v e ( P L P )  an al y s i s  o f   s p eech , ”  J . A c o u s t . S o c . A m e r v o l . 8 7 ( 4 ) , 19 90 ,   p p 173 8 .   [ 2 6]   D o ugl a s  R e yno l d s et  a l “T h e S u p er   S I D  p r o je c t: Ex p l o iti n g  h ig h - le v e l in f o r m a tio n  f o r  h ig h - accu r ac y  s p eak er   r eco g n i t i o n , ”  i n  P r o c . I E E E  A c o u s t i c s ,   S p eech ,  a n d Si g nal   P r oc e s s i ng ,   2 00 3,   pp .  7 84 - 78 7.   [ 2 7]   R .  A u ck en t h al er ,  M .  C ar ey ,  an d   H .  L l o y d - T h o m as ,  “S co r e n o r m al i zat i o n  f o r  t ex t - i n d ep en d en t  s p ea k er  v er i f i cat i o n   s y s t e m s , ”  D i gi t al  Si gn al   P r oc e s s . v o l . 1 0 ( 1 ) ,   20 00,   p p.  42 - 54.   [ 2 8]   S . S i ng h a nd A j e e t  S i ng h “ A c c ur a c y  C o m pa r i s on us i ng  D i f f e r e nt  M ode l i ng  T e c hni que s   u n d er  L i m i t ed  S p eech  D at of  S pe a ke r  R e c og ni t i on S y s t e m s ”  G l obal  J our n al  of  Sc i e nc e  F r ont i e r  R e s e ar c h:  F  M at he m at i c s  and D e c is io n   S ci en ces ,   v ol   16 ( 2)  20 16 ,   , p p .1 - 17 .   [ 2 9]   P .  K en n y ,  “B a y es i an  s p ea k er   v er i f i cat i o n   w i t h  h eav y  t ai l ed  p r i o r s , ”  i n  P r o c.  O d ys s ey:  T he  Spe ak e r  and L a ng ua ge   R e c ogni t i o n W or k s ho p ,  B r no,  C z e c h R e publ i c ,  2 01 0.   [ 3 0]   S . V . S . P r as ad ,  T .  S at y a S av i t h r i ,  I y y an k i  V .  M u r al i  K r i s h n a,  “C o m p ar i s o n  o f   A ccu r ac y  M eas u r es  f o r  R S  I m a g C l a ssi f i c a t i o n  u si n g  S VM  a n d  ANN C l a ssi f i e r s,   I nt e r nat i o nal  J our n al  of   E l e c t r i c al  a nd C om put e r  E ngi ne e r i n g   , v ol .  7( 3) ,   20 17 ,   p p.  11 80 - 11 87 .   [ 3 1]   P .  K en n y  an d  P .  D u m o u ch el ,  “D i s en t an g l i n g  s p eak er  an d  ch an n el  ef f ect s  i n  s p eak er  v er i f i c at i o n , ”  i n  P r o c .  I EEE  I nt .  C onf .  A c o us t i c s ,  S pe e c h,  a nd   Si g nal  P r oc e s s i ng ,   20 04 ,   pp.  3 7 - 40 .   [ 3 2]   N.  De h a k,   et .  a l ,   “S u p p o r t  v ect o r  m ach i n es  an d  j o i n t  f act o r  an al y s i s  f o r  s p eak er  v er i f i c at i o n , ” i n   P r o c . I E E E  I n t .   A c ous t i c s ,  Spe e c h,  an S i g nal  P r oc e s s i ng   ,  20 09 ,   p p.  42 37 - 4 24 0.   [ 3 3]   N .  D eh ak ,   et .  a l ,   S upp or t  v e c t or   m a c hi ne s  v e r s us  f a s t  s c or i ng  i n t he  l ow - di m e ns i ona l to ta l v a r ia b ility  s p a c e   f o r   s p eak er  v er i f i cat i o n . ”  i n  P r o c.  I n t er s p eech ,  200 9,   pp .  1 55 9 - 15 62 .   [ 3 4]   A .  S ol om onof f ,  W .  M .  C a m pb e l l ,  a nd I .  B oa r dm a n,  “ A dva nc e s  i n c ha nne l  c om pe ns a t i on f or  S V M  s pe a k e r   r eco g n i t i o n , ”  i n  P r o c . I E E E   A c o u s t i c s ,   Spe e c h,  an d Si g nal   P ro c e ssi n g   ,  20 05 ,   pp.  6 29 - 63 2.   [ 3 5]   A .  O .   H at ch ,  S .  S .  K aj ar ek ar ,  a n d  A .  S t o l ck e,  “ W i t h i n - cl as s  co v ar i an ce n o r m al i zat i o n  f o r S V M - b as ed  s p eak er   r e c o g n itio n , ”  i n  P r oc .  I nt e r s pe e c h,  P i t t s b ur g h,  P A ,   20 06,   p p.  14 71 - 147 4.   Evaluation Warning : The document was created with Spire.PDF for Python.