I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   1 8 ,   N o .   2 M a y   20 20 ,   pp .   835 ~ 842   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 2 . pp 835 - 842             83 5       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   A n   e n sem b l e   t e c h n i q u e   f o r   sp e e c h   r e c o g n i t i o n   i n   n o i sy   e n v i r o n m e n t s       I m ad   Q as i m   H ab e e b 1 ,   Tam ar a   Z .   F ad h i l 2 ,   Y as e e n   N as e r   Ju r n 3 ,   Z e yad   Q as i m   H ab e e b 4   H an an   N ajm   A b d u l k h u d h u r 5   1 , 2 , 3 C o l l e g e   o f   E ng i ne e r i ng ,   U ni v e r s i t y   o f   I n f o r m a t i o T e c hno l o gy   a nd  C o m m uni c a t i o ns ,   B a g hda d ,   I r a q   4 B i o m e di c a l   E ng i ne e r i ng ,   U n i v e r s i t y   of   T e c hno l o gy ,   B a g hda d,   I r a q   5 M i n i s t r y   o f   H i g he r   E duc a t i o a nd   S c i e nt i f i c   R e s e a r c h,   B a g hda d,   I r a q       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e d   A ug  7 ,   2019   R e v i s e N o v   8 ,   2019   A c c e pt e N o v   22 ,   201 9       A ut o m a t i c   s pe e c r e c o g ni t i o ( A S R )   i s   a   t e c hno l o gy   t ha t   a l l o w s   a   c o m put e r   a nd  m o bi l e   de v i c e   t o   r e c o g ni z e   a nd  t r a ns l a t e   s po ke l a ng ua g e   i n t o   t e x t .   A S R   s y s t e m s   o f t e pr o duc e   po o r   a c c ur a c y   f o r   t he   no i s y   s pe e c s i g na l .   T he r e f o r e ,   t hi s   r e s e a r c pr o po s e d   a n   e n s e m b l e   t e c hn i qu e   t ha t   do e s   no t   r e l y   on  a   s i ng l e   f i l t e r   f o r   pe r f e c t   no i s e   r e duc t i o b ut   i nc o r po r a t e s   i nf o r m a t i o f r om   m ul t i p l e   no i s e   r e duc t i o f i l t e r s   t o   i m pr o v e   t he   f i na l   A S R   a c c ur a c y .   T he   m a i f a c t o r   of   t hi s   t e c hni q ue   i s   t he   g e ne r a t i o o f   K - c o pi e s   o f   t he   s pe e c s i g na l   u s i ng   t h r e e   no i s e   r e duc t i o f i l t e r s .   T he   s pe e c f e a t u r e s   o f   t he s e   c o pi e s   d i f f e r   s l i g ht l y   i o r de r   t o   e xt r a c t   d i f f e r e n t   t e x t s   f r o m   t he m   w he p r o c e s s e by   t he   A S R   s y s t e m .   T hu s ,   t h e   b e s t   a m o ng   t he s e   t e x t s   c a be   e l e c t e a s   f i na l   A S R   o ut pu t .   T he   e ns e m bl e   t e c hni que   w a s   c o m pa r e w i t t h r e e   r e l a t e c ur r e nt   no i s e   r e duc t i o t e c hn i qu e s   i t e r m s   o f   C E R   a nd  W E R .   T he   t e s t   r e s ul t s   w e r e   e nc o ur a g i ng   a nd  s ho w e a   r e l a t i v e l y   de c r e a s e d   by   16. 61 %   a n 1 1. 54 %   o C E R   a nd  W E R   c o m pa r e w i t t h e   be s t   c ur r e nt   t e c hni q ue .   A S R   f i e l d   w i l l   be ne f i t   f r o m   t he   c o nt r i bu t i o o f   t hi s   r e s e a r c t o   i nc r e a s e   t he   r e c og ni t i o a c c ur a c y   of   a   hum a s pe e c i t h e   pr e s e nc e   o f   ba c kg r o und  no i s e .     Ke y w or ds :   A E n s e m b l e   t e c hn i q ue   A ut o m a t i c   s pe e c h   r e c o gn i t i o n   N o i s y   s pe e c h   S pe e c h   e nha n c e m e nt   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   Im a d   Q a s i m   H a b e e b ,   D e pa rt m e n t   o f   M ob i l e   Co m m u n i c a t i o n s   a nd  Co m put i n g   E n g i n e e r i ng  (U O IT C) ,     Co l l e ge   of   E n gi n e e r i n g ,   U n i v e r s i t y   of   In f o r m a t i o T e c hn o l o g y   a n Co m m u ni c a t i o n s ,   B a g h d a d,   I ra q.     E m a i l :   e m a dk a s s a m @ uo i t c . e du. i q       1.   I N TR O D U C TI O N   T h e   m a i n   o b j e c t i ve   of   A S R   r e s e a r c h   i s   t o   b ui l a   s y s t e m   t o   c o n v e r t   s pe e c h   s i gna l s   t o   t e xt   [ 1 ] .   I r e c e n t   y e a r s ,   s pe e c h   t o   t e xt   t e c h n o l o g y   b e ga n   t o   c h a n ge   t h e   m a nn e r   i n   w hi c h   w e   l i v e   a n b e c a m e   o n e   of   t h e   b a s i c   m e a n s   f o r   h um a n s   t o   c o m m u ni c a t e   w i t h   c e rt a i n   de v i c e s .   H e n c e ,   m a n y   a ppl i c a t i o n s   ha v e   be e n   c r e a t e i w h i c h   s pe e c h   t o   t e xt   t e c hn o l o gy   pl a y s   a n   e s s e n t i a l   r o l e   [ 2 - 3 ] .   T h e s e   a ppl i c a t i o n s   p r o v i de   s e r v i c e s ,   s uc h   a s   vo i c e   s e a r c h ,   s pe e c h   t ra n s l a t i o n,   pe r s o na l   a s s i s t a n t ,   a n d   ga m i n g   [ 4 - 5 ] .   T h e   A S R   s y s t e m s   c o m pr i s e   o f   fo ur   c o n c e pt ua l l y   di s t i n c t   s t a ge s :   s i g na l   p r o c e s s i n g ,   f e a t ur e   e xt ra c t i o n,   a c o us t i c   m o de l ,   a nd  N - g r a m   l a n gu a ge   m o de l   [ 6 - 7 ] .   T h e   s i g n a l   p r o c e s s i n e nh a n c e s   t h e   s pe e c h   s i g n a l   by   e l i m i n a t i ng  n o i s e   a n m a ki n i t   m o r e   s ui t a b l e   fo r   r e c o gn i t i o n.   T h e   f e a t ur e   e xt r a c t i o n   s t a ge   i de nt i f i e s   i m po r t a nt   f e a t ur e s   i n   t h e   s pe e c h   s i gna l   a n d   e xt ra c t s   t h e m .   T h e   a c o us t i c   m o de l   m e a s ur e s   a   s c o r e   fo r   a l l   c ha r a c t e r s   i n   o r de r   t o   c l a s s i fy   t h e m   us i n s t a n d a r d   f e a t ur e s .   T h e   N - g ra m   l a n gu a ge   m o de l   m e a s u r e s   t h e   p r o b a b i l i t y   of   a   s e que n c e   o f   w o r ds   t o   v a l i da t e   t h e   r e s ul t e d   s e nt e n c e s .     M o s t   A S R   a ppl i c a t i o n s   pe r f o r m   a c c e pt a b l y   i n   c l e a n   e n v i r o nm e nt s   [ 8 ] .   H ow e ve r ,   t h e y   d o   n o t   w o r w e l l   i n   t h e   pr e s e n c e   of   n o i s e   [ 9 - 11 ] .   N o i s e   a s   a   t e r m   r e f e r s   t o   t h e   u n w a n t e e l e m e nt s   pr e s e nt   i n   s pe e c h   s i g n a l s .   T h e   n o i s e   of   a n y   t y pe   m a ke s   t h e   p r o c e s s   of   A S R   ha r de r .   F o r   i n s t a n c e ,   i de nt i f y i n t h e   s pe e c h   o f   a   pe r s o n   i a   s i l e n t   r o o m   i s   m uc h   e a s i e r   t ha n   i de n t i f y i n t h e   s pe e c h   i n   a   n o i s y   e n v i r o nm e n t .   T h us ,   s e v e r a l   r e s e a r c h e r s   r e po rt e t ha t   A S R   a c c ur a c y   i s   s t i l l   l o w   fo r   a   de gra de s pe e c h   s i g n a l   [ 12 - 14 ] .   T h e   e ff e c t   of  Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 2 :     8 3 5   -   8 4 2   836   di f fe r e nt   n o i s e   t y pe s   o n   s pe e c h   r e c o gn i t i o n   v a ri e s   s i g n i f i c a nt l y   a c c o r di n g   t o   t h e   s o ur c e   o f   t h e   n o i s e   [ 15 ] H ow e ve r ,   t h e   e n v i r o nm e nt   o t h e   a udi o   s i g n a l s   i s   t h e   m a i n   c a us e   of   n o i s e   a n c o n t ra s t   i n   t h e   s pe e c h     s i g n a l   [ 16 ] .   T h e   n o i s e   t y pe s   m a y   r e s ul t   f r o m   h u nd r e ds   o s o ur c e s ,   s uc h   a s   m i c r o ph o n e   qua l i t y ,   s pe a ke r   c h a ra c t e ri s t i c s ,   b a c kg r o un s o un ds ,   a n d i a l e c t   di f f e r e n c e s   [ 4 ] .   F urt h e r m o r e ,   v a ri o us   t y pe s   of   n o i s e   gi ve   di f fe r e nt   l e v e l s   of   e r r o r s ,   m a ki ng  i t   d i f f i c ul t   t o   i m p l e m e n t   a   f i l t e r   t e c hni que   f o r   e a c t y pe   of   n o i s e   o r   t ra i ni n g   t h e   A S R   o n   t h e m   [ 14 ] .   T h us ,   t h e   m o r e   e f f i c i e n t   i s   t h e   de s i g n   of   a   ge n e r a l   t e c hni que   t h a t   c a n   b e   m o r e   a c c u r a t e   fo r   s pe e c h   r e c o gn i t i o n   i n   t h e   p r e s e n c e   o f   n o i s e .   F i g u r e   1   p r e s e n t s   f o ur  t y pe s   o f   s pe e c h   s i g n a l s .             F i gu r e   1 .   F o ur  t y pe s   of   s pe e c h   s i g na l s       In   F i gu r e   1,   t h e   f o ur   t y pe s   of   s p e c t r o gr a m s   s h o w   t h a t   t h e   e nha n c e s pe e c h   s i gna l   (d)  i s   n o t   e xa c t l y   l i ke   t h e   c l e a n   s pe e c h   s i g n a l   (a ) .   T hi s   i s   b e c a us e   n o i s e   e s t i m a t i o n   (c p r e s e n t e by   o n e   of   t h e   s pe e c h   e nh a n c e m e n t   t e c hni que s   do e s   n o t   e xa c t l y   m a t c h   t h e   n o i s e   s i g n a l   due   t o   t h e   n o i s e   i s   u n p r e di c t a b l e   [ 17 ] .   F o r   e xa m pl e ,   w h e n   r i d i n g   i n   a   c a a n d   l i s t e ni n t o   t h e   f r i e n d ' s   s pe e c h ,   t h e   n o i s e   f r o m   t h e   c a r   i n c r e a s e s   a n de c r e a s e s   di s pr o po r t i o na t e l y   a s   t h e   c a c ha n ge s   i t s   s pe e w h i l e   t h e   s pe e c h   f r o m   t h e   f r i e n r e m a i n s   c o n s t a nt .   T h e r e f o r e ,   i t   i s   di f f i c ul t   t o   c a t e go r i z e   t h e   i n pu t   s i g na l   a s   e i t he r   n o i s e   o r   s pe e c h .   E n s e m b l e   t e c h ni que s   a r e   us e e ffe c t i ve l y   i n   a   v a ri e t y   of   do m a i n s   s uc h   a s   o pt i c a l   c h a ra c t e re c o gn i t i o n   t o   pr o duc e   hi g h   a c c u r a c y   w h e n   us i ng  n o i s y   t e s t i n g   da t a s e t s   [ 18 - 19 ] .   T h e r e f o r e ,   t h i s   r e s e a r c h   m o di f i e t h i s   t e c hni que   t o   b e   s ui t a b l e   fo r   t h e   a ut o m a t i c   s pe e c h   r e c o gn i t i o n   do m a i n.   T h e   m a i f a c t o r   o f   t hi s   t e c hni que   i s   t h e   ge n e r a t i o n   o f   K - c o pi e s   of   t h e   s pe e c h   s i g na l   us i ng  t hr e e   n o i s e   r e duc t i o n   f i l t e r s .   T h e   b e s t   s pe e c h   f e a t ur e s   fo r   t h e s e   c o pi e s   c a n   t h e n   b e   s e l e c t e a s   f i na l   A S R   f e a t ur e s   [ 19 ]   T h e   r e m a i n de r   o f   t h i s   r e s e a r c h   w a s   pr e pa r e i n   f o ur   s e c t i on s :   t h e   c urr e n t   a nd  o l de r   s t udi e s   w e r e   fo r m u l a t e i n   S e c t i o n   w h i l e   t h e   i m p l e m e n t a t i o n   o t h e   pro pos e t e c h ni que   w a s   e xpl a i n e i n   S e c t i o n   3.   I S e c t i o n   4,   t h e   r e s ul t s   o t h e   pr o po s e t e c h n i que   e v a l ua t i o n   w e r e   r e po r t e d .   F i n a l l y ,   t h e   c o n c l us i o n   w i t h   a   b ri e di s c us s i o n   a nd  f ut u r e   w o r o f   t h i s   r e s e a r c w e r e   de s c r i b e i S e c t i o n   5.       2.   R ELA TED   WO R K   R e s e a r c h e r s   ha v e   pr o po s e s e ve r a l   t e c hni que s   t h a t   p r o v i de   a   v a r i e t y   of  s o l ut i o n s   t o   de a l   w i t h   t h e   n o i s y   s p e e c h   s i g na l .   I [ 15 ] ,   t h e   A S R   s y s t e m   w a s   de s i gn e t o   r e c o gn i z e   t h e   s pe e c h   o f   a   s pe a ke r   i a   n o i s y   e n v i r o n m e n t .   T h e   A S R   s y s t e m   c o n s i s t s   o f   t hr e e   s e que n t i a l l y   c o n n e c t e c o m po n e n t s   t o   r e m o v e   t h e   n o i s e   of   a   s pe e c h   s i g na l .   T h e   f i r s t   c o m po n e nt   w a s   us e t o   m a i nt a i t h e   s pe e c h   s i gna l   c o m i n f r o m   t h e   s pe a ke r' s   di r e c t i o n   a n t o   i g n o r e   a n y   n o i s e   c o m i n f r o m   a n o t h e r   di re c t i o n .   T h e   s e c o n c o m po n e nt   w a s   us e t o   de a l   w i t h   a n y   n o i s e   a s s o c i a t e w i t h   t h e   s pe e c h   s i g n a l .   T h e   l a s t   c o m po n e n t   i m p r o ve A S R   r e c o gn i t i o n   b y   m a ppi n of   s pe c t r a l   f e a t u r e s   t o   s t a nda r f e a t u r e s .   E xpe r i m e nt a l   r e s ul t s   o f   di ff e r e n t   s e t t i n gs   o f   t h e   A S R   s y s t e m   s h ow   t h a t   i n t e g r a t i ng  t h e   t hr e e   c o m po n e n t s   c o ul i n c r e a s e   t h e   A S R   a c c ura c y .     In   [ 12 ] ,   t h e   A S R   s y s t e m   w a s   c r e a t e a n t ra i n e us i n e l e c t r o e n c e pha l o g r a p h y   fe a t u r e s   t o   i n c r e a s e   t h e   r e c o gn i t i o n   a c c ura c y   i n   t h e   a b s e n c e   a n pr e s e n c e   of   t h e   n o i s y   e n v i r o nm e nt .   T h e   e l e c t r o e n c e pha l o g r a p h y   f e a t ur e s   c a b e   m e a s ur e by   r e c o r di n t h e   e l e c t r i c a l   s i g na l s   t ha t   o c c ur   i n   t h e   h u m a n   b ra i n.   B a s e o n   t hi s   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A e ns e m b l e   t e c hni qu e   f or   s p e e c h   r e c ogni t i on  i noi s y   e nv i r onm e nt s   ( Im ad  Q as i m   H abe e b )   837   t e c hn o l o g y ,   a   s e t   o f   s pe e c h   s i g na l s   f e a t u r e s   w e r e   i de n t i f i e t ha t   c o ul b e   us e f o r   b e t t e r   r e p r e s e n t a t i o n   o a udi o   s i g na l s .   T h e s e   e l e c t r o e n c e ph a l o gra p h y   fe a t ur e s   ha v e   b e e n   de t e r m i n e us i ng  a   de e l e a rni n g   m o de l .   T h e   A S R   s y s t e m   h a s   b e e n   t e s t e w i t h   a   c o m b i n a t i o n   o a c o us t i c   a n e l e c t r o e n c e pha l o g r a p h y   fe a t ur e s .   T h e xpe r i m e nt a l   r e s ul t s   s h o w   t h a t   us i ng  e l e c t r o e n c e ph a l o gra p h y   fe a t u r e s   c o ul h e l t h e   a c c ura c y   of   s pe e c h   r e c o gn i t i o n   s y s t e m s .   H ow e v e r ,   t h e   t e s t i ng  da t a s e t   w a s   s m a l l ,   w h i c h   c o n s i s t   o f   t h e   f o ur   E n gl i s h   w o r ds   ’n o ’,   y e s ’,   ’ri g h t ,   ’l e f t ’  a nd  f i v e   E n g l i s h   v o w e l s .     In   [ 13 ] ,   t h e   A S R   m o de l   w a s   de s i gn e t o   i n c l ude   a a dd i t i o n a l   s ub s y s t e m   t o   c o rr e c t   t h e   r e s ul t i ng  e rr o r s   i n   s pe e c h   r e c o gn i t i o n.   T h e   s ub s y s t e m   m e a s u r e t h e   c o n t e xt   o f   t h e   phra s e   us i n a   n e u ra l   n e t w o r t h a t   t r a i n e f r o m   a   l a r ge   c o r pus   fo r   b e t t e r   c h o o s i n b e t w e e n   di f f e r e n t   po s s i b i l i t i e s   a s   w e l l   a s   r e - i n t r o duc e s   un s e e n   phra s e s   i n   t h e   c o r pus .   H e n c e ,   i t   c o ul p r o v i de   c o rr e c t i o n s   f or  A S R   e rr o r s   r e s ul t e f r o m   n o i s y   e n v i r o nm e nt s .   E xpe r i m e nt a l   r e s ul t s   s h o w e t h a t   t h e   A S R   m o de l   c o ul i m p r o v e   t h e   r e c o gn i t i o a c c u r a c y   (1)  by   s c o r i n g   t h e   l a t t i c e s ,   (2)   by   c o r r e c t i n g   w o r ds   p r u n e f r o m   t h e   l a t t i c e s ,   a nd  (3)  b y   ge n e r a t i n c a ndi d a t e s   f o r   a n y   w o r n o t   s h o w n   i t h e   di c t i o n a r y .   In  [ 20 ] ,   t h e   a ut h o r s   de s i g n e t h e   A S R   s y s t e m   b a s e o n   n e u r a l   n e t w o r ks   a n de e l e a rn i ng  o un s upe r v i s e da t a   t o   i m p r o v e   r e c o gn i t i o n   a c c u r a c y   i n   n o i s y   e n v i r o nm e nt s .   T h i s   A S R   s y s t e m   i n t e g ra t e s   r e s i du a l   l e a rn i ng  a n b a t c h   n o r m a l i z a t i o n ,   s h o w i n m o r e   r o b us t n e s s   t h a n   o t h e r   e xi s t i ng  w o r ks .   It   a l s fo c us e o n   t r a i n i ng  u s i ng  l a r ge   a nd  d i f fe r e nt   t y pe s   of   n o i s e s .   F u r t h e rm o r e ,   t h e   s y s t e m   pr o c e s s e s   t h e   s pe e c h   s i g n a l   s e v e r a l   t i m e s   i n   w hi c h   e a c h   s t a ge   c o r r e c t s   t h e   e rr o r s   o f   t h e   pr e v i o us   s t a ge .   In   t hi s   w a y ,   t h e   r e c o gn i t i o n   a c c ur a c y   fo r   e a c h   s t a ge   i s   i n c r e a s e d .   T h e   e v a l ua t i o n   p r o c e s s   o t h e   s y s t e m   w a s   a c h i e v e us i n c l e a n   a nd  n o i s y   s p e e c h   s i g na l s .   E x pe ri m e n t a l   r e s ul t s   s h o w e t ha t   us i n g   n e u ra l   n e t w o r ks   a n d   de e l e a rn i ng  c o ul r e duc e   t h e   w o r e rr o r   ra t e   b y   5. 67%.   In   [ 9 ] ,   t h e   a u t h o r s   c l a i m e t ha t   t ra d i t i o n a l   n e u r a l   n e t w or ks   t ha t   us e   s pe e c h   c l a s s i f i c a t i o n   a r e   s e n s i t i v e   t v a r i o us   n o i s y   c o n di t i o n s .   T h e r e f o r e ,   t h e y   pr o po s e a   n e w   m o d e l   fo r   t h e   n e ura l   n e t w o r t o   h a n d l e   un c e rt a i n t y   da t a .   T h e y   s ugge s t e t ha t   s pe e c h   s i g na l s   w e r e   c o n s i de r e a s   i n pu t   s i g n a l   a nd  t h e i n o i s e   w a s   m o de l e a s   un c e r t a i nt y   da t a .   U n c e r t a i n t y   da t a   w a s   c a l c u l a t e f o r   s pe c i f i c   f r e que n c y   p o i n t s   o f   s pe e c h   s pe c t r o gra m   t o   pr o duc e   t h e   u n c e rt a i nt y   m a t ri x.   T h e n,   t w o   pa ra l l e l   pa t h s   b a s e c l a s s i f i c a t i o n   m o de l   i s   s ugge s t e d.   T h e   f i r s t   p a t us e a   s pe e c h   s pe c t r o gra m   a s   i n pu t   w h i l e   t h e   s e c o n pa t us e u n c e rt a i n t y   m a t ri x.   T h e   t w o   pa t h s   o ut put s   w e r e   j o i n e t o   c a l c ul a t e   t h e   f i n a l   o ut p ut   o f   t h e   A S R   c l a s s i f i e r .   T h e   p r o po s e t e c hn i que   ha s   b e e n   c o m pa r e w i t h   t r a d i t i o na l   n e u ra l   n e t w o r ks   us i n g   i s o l a t e w o r ds .   T h e   e xpe r i m e n t a l   r e s ul t s   s h o w e d   t h a t   t h e   p r o po s e t e c h ni que   a c hi e v e s   r e c o gn i t i o n   a c c ura c y   of  85%   i n o i s y   e n v i r o nm e nt s .   In  [ 17 ] ,   t h e   a u t h o r s   us e a   v a ri a nt   o f   s e v e r a l   de e n e ura l   n e t w o r ks   (S D N N b a s e s pe e c h   r e c o gn i t i o n   t e c hn i que s .   T hi s   t e c hni que   e s t i m a t e s   t h e   de s i re s pe e c h   s pe c t r u m   a s   a a v e r a ge   of   m ul t i pl e   S D N N   o ut put s .   T h e   w e i gh t s   w e r e   m e a s ur e by   a n   a dd i t i o n a l   n e t w o r k.   T h e   m u l t i pl e   S D N N s   a nd  t h e   a ddi t i o na l   n e t w o r a r e   t r a i n e t o ge t h e r .   E xpe ri m e n t s   ha v e   b e e n   c o n duc t e us i n t w o   a n f o ur   S D N N s   t h a t   t r a i n e o n   t h e   l a rge   c o r pus   w i t h   v a ri o us   n o i s e   t y pe s .   T h e   pr o po s e t e c h n i q ue   ha s   b e e n   c o m pa r e w i t h   a   s i ngl e   D N N   b a s e d   A S R   s y s t e m .   T h e   e v a l ua t i o n   m e t ri c s   w e r e   n o n - s t a n da rd,   w h i c h   a r e   S h o r t - T e r m   O b j e c t i ve   Int e l l i gi b i l i t y   a n d   P e r c e pt u a l   E v a l u a t i o o f   S pe e c h   Q ua l i t y .   T h e   t e s t   r e s ul t s   i n di c a t e t h a t   t h e   p r o po s e d   t e c hn i q ue   w a s   be t t e r   t h a t h e   b a s e l i n e   s c h e m e   i n   b o t h   c l e a a n n o i s y   e n v i r o nm e nt s .   T h e   i m p r o v e m e n t   w a s   0. 07  a n d   0. 04  i P e r c e pt u a l   E v a l u a t i o n   o f   S pe e c h   Q ua l i t y   c o m pa r e t o   s i n gl e   D N N   f o r   c l e a n   a n d   n o i s y   s pe e c h   s i g n a l s   r e s pe c t i v e l y .   R e l a t e w o r o f   t hi s   r e s e a r c h   s h o w s   t ha t   v a ri o us   e ffo r t s   a n d   t e c hni que s   w e r e   a c h i e v e fo r   r e c o gn i z i n n o i s y   s p e e c h   s i g n a l .   H ow e ve r ,   m o s t   of   t h e m   di n o t   i n v o l v e   e n s e m b l e   t e c h n i q ue s   a s   a   m e c h a ni s m   t o   c o r r e c t   A S R   e rr o r s .   H e n c e ,   t h e   c o n t ri b ut i o n   o f   t h i s   r e s e a r c h   i s   t o   de s i gn   a n e v a l ua t e   w h e t h e r   e n s e m b l e   t e c hn i que s   c a n   m a ke   a   di f f e r e n c e   i n   i m p r o v i n A S R   s y s t e m s .   F ur t h e rm o r e ,   a n y   i m p r o ve m e n t s   i t h e   A S R   f i e l c a n   i n c r e a s e   t h e   o v e r a l l   pe r f o r m a n c e   o f   s pe e c r e c o gn i t i o n   t e c hn o l o g y .       3.   P R O P O S ED   TEC H N I Q U E   A s   m e n t i o n e pr e v i o us l y ,   s i n c e   t h e   n o i s e   s o ur c e s   c a n   v a ry   w i de l y   a n t h e   c o n di t i o n s   o f   s pe e c h   s urr o u n di ng  a r e   v a ri a b l e   a n c ha n ge   o ve r   t i m e ,   i t   i s   n o t   po s s i b l e   t de s i gn   a   f i l t e r   t e c hni que   fo r   e a c h   t y pe   of  n o i s e .   H e n c e ,   t hi s   r e s e a r c h   p r o po s e s   t h e   e n s e m b l e   t e c h ni que   t h a t   c a n   b e   m o r e   a c c ur a t e   f o r   s pe e c h   r e c o gn i t i o n.   T h e   m a i n   i de a   o t h i s   t e c hni que   i s   t ha t   i n s t e a d   of   r e l y i n o n   a n y o n e   i m pe r f e c t   n o i s e   r e duc t i o n   f i l t e r,   t h e   pr o po s e t e c h n i que   i n c o r po r a t e s   i n f o r m a t i o n   f r o m   m u l t i pl e   n o i s e   r e duc t i o n   f i l t e r s   o f   t h e   s a m e   s pe e c h   s i g na l   t o   i m p r o v e   A S R   o ut put   [ 21 ] .   T h e   p r o po s e t e c hn i q ue   s ugge s t e t ha t   di f f e r e n t   n o i s e   r e duc t i o n   f i l t e r s   po t e n t i a l l y   o ffe r e c o m pl e m e n t a r y   i n f o r m a t i o n   a b o ut   t h e   p h o n e m e s   t o   b e   c l a s s i f i e w h i c h   c o ul b e   ha rn e s s e t o   i n c r e a s e   t h e   pe r f o r m a n c e   of   t h e   A S s y s t e m .   F i gu r e   pr e s e nt s   a   di a g r a m   t o   i l l us t r a t e   t h e   pr o po s e e n s e m b l e   t e c hn i q ue .       Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 2 :     8 3 5   -   8 4 2   838       F i gu r e   2 .   T h e   D i a g ra m   o f   t h e   p r o po s e e n s e m b l e   t e c hni que       In   F i g u r e   2,   t hr e e   m a i n   s t e ps   a r e   i n c l ude i n   t h e   p r o po s e e n s e m b l e   t e c h ni que .   I n   S t e p1 ,   t h e   e n s e m b l e   t e c h ni que   i s   us e t o   c r e a t e   3 - c o pi e s   of   t h e   i n p ut   s pe e c h   s i g n a l   by   us i n t hr e e   di f f e r e n t   n o i s e   r e duc t i o n   f i l t e r s :   S pe c t r a l   S ub t r a c t i o n ,   W i e n e r   f i l t e r,   a nd  G a m m a t o n e   f i l t e r .   T h e s e   t hr e e   f i l t e r s   w e r e   c h o s e n   b e c a us e   t h e y   a r e   c o n s i de r e t h e   b e s t   i n   r e m o v i n n o i s e   f r o m   t h e   s i g n a l   [ 14 ] .   T h e   ge n e r a t e c o pi e s   a r e   s i m i l a b ut   n o n - i de nt i c a l .   H e n c e ,   t h e   s m a l l   di f f e r e n c e   be t w e e n   ge n e ra t e c o pi e s   c a n   p r o duc e   di f fe r e n t   A S R   o ut put s   a n t h e n   c h o o s e   t h e   b e s t   a m o n g   t h e m .   T h e   de t a i l s   o f   n o i s e   r e duc t i o f i l t e r s   a r e   i t h e   f o l l ow i n p a ra g r a p h s .   (F i l t e r   1)  S pe c t ra l   s ub t r a c t i o n   i s   o n e   o t h e   b a s i c   a l go r i t hm s   pr o po s e fo r   r e m o v i n t h e   n o i s e   i n   a a udi o   s i g n a l   [ 22 ] .   I n   t hi s   a l go r i t hm ,   a   c l e a n   s i g na l   o f   n oi s y   s pe e c h   c a n   b e   r e s ul t e f r o m   r e m o v i n t h e   e s t i m a t i o n   o f   n o i s e   f r o m   t h e   i n put   a udi o   s i g n a l .   T h e   n o i s e   i s   e s t i m a t e du r i n n o n - s pe e c h   a r e a s ,   w h i c h   a r e   ga ps   i n   t h e   s i g na l   t ha t   c o n t a i n s   o nl y   n o i s e .   T h e   s pe c t ra l   s ub t ra c t i o n   m o de l   i n   t h e   t i m e   do m a i n   i s     e xpr e s s e by :     d( m ,   k )   =   s ( m ,   k )   -   n( m ,   k )   (1)     w h e r e   s ( m ,   k ) ,   d( m ,   k ) ,   a n d   n( m ,   k )   r e p r e s e n t   t h e   s i g na l s   o f   t h e   i nput   s pe e c h ,   t h e   de s i r e s pe e c h ,   a n d   t h e   n o i s e   e s t i m a t i o n   r e s pe c t i v e l y .   T h e   v a ri a b l e s   m   a n d   k   r e fe r   t o   t h e   di s c r e t e - t i m e   a n d   t h e   f ra m e   num b e r   r e s pe c t i v e l y   [ 22 ] .   A s s um i n g   t h e   s pe e c h   s i g na l   a n d   n o i s e   a r e   p r o duc e by   i n de pe n de nt   s o ur c e s   fo r   m o s t     r e a l - w o r l c a s e s .   I t h e   f r e que n c y   do m a i n,   ( 1 )   c a b e   r e p r e s e nt e a s :     S(w ,   k ) =   D (w ,   k ) + N (w ,   k )   (2)     w h e r e   t h e   v a r i a b l e s   S(w ,   k ) ,   D (w ,   k )   a n d   N(w ,   k )   a r e   t h e   s ho r t   t i m e   d i s c r e t e   F o uri e r   t ra n s f o r m s   of  n o i s y   s p e e c h ,   de s i r e s i g na l ,   a nd  n o i s e   r e s pe c t i v e l y ,   a n t h e   v a r i a b l e   w   r e pr e s e n t s   t h e   d i s c r e t e   f r e que n c y   i n de o f   t h e   f ra m e s .   T h e   f i r s t   s t e i s pe c t ra l   s ub t ra c t i o n   i s   t o   di v i de   t h e   n o i s y   s pe e c h   s i g n a l   s ( m ,   k )   i nt o   ov e r l a pp i n f r a m e s .   T h e   f r a m e   l e n g t h   i s   us ua l l y   e qua l   t o   0 . 020s   w h e a a udi o   f i l e   i s   s a m p l e t o   16   kH z .   H e n c e ,   e a c h   f r a m e   h a s   s a m pl e s   of   400  pe r   s e c o n d.   S i n c e   t h e   ove r l a b e t w e e n   f r a m e s   i s   50%,   t h e n   t h e   f r a m e - 0,   f ra m e - 1,   a n d   f ra m e - s t a rt   a t   s a m pl e s   0 ,   20 0,   a n d   400   r e s pe c t i v e l y   a n s o   o n .   S i n c e   t h e   f i r s t   f e w   f r a m e s   o a n   i n p ut   s i g na l   c o n s i s t i n o f   s i l e n c e ,   t h e y   s h o ul b e   g oo s a m p l e s   of   t h e   n o i s e   s pe c t r um .   Co n s e que n t l y ,   t h e   m e a n   o f   t h e s e   f i r s t   f e w   f r a m e s   c a n   b e   t a ke t o   e s t i m a t e   t h e   n o i s e   s i g n a l .   F i na l l y ,   t h e   c l e a s i g na l   o f   n o i s y   s pe e c h   c a b e   p r o duc e f r o m   s ub t ra c t i n g   t h e   n o i s e   e s t i m a t i o f r o m   t h e   i nput   s pe e c h   s i g n a l   [ 22 ] .   (F i l t e r   2)  T h e   W i e n e r   f i l t e r   i s   t h e   m o s t   i m po r t a n t   t e c hn i q ue   fo r   n o i s e   r e duc t i o n   a n h a s   b e e n   us e i n   v a r i o us   s i g na l   e nha n c e m e n t   a p pl i c a t i o n s   [ 23 ] .   T h e   b a s i c   i de a   of   t hi s   t e c hni que   i s   t o   m e a s u r e   t h e   e s t i m a t i o of  t h e   de s i r e s i g na l   f r o m   t ha t   de g r a de by   n o i s e   s i gna l .   T h i s   c o ul b e   a c h i e v e by   c a l c ul a t i ng  t h e   M e a S qua r e   E rr o us i ng  ( 3 )   a s s um i n g   k n o w n   t h e   de s i r e d   s i g na l   ( , )   a nd   t h e   i n p ut   s i g na l   ( , )   a nd  t h e n   t r y i n g   t o   m i ni m i z e   i t .   T h e   f i l t e t ra n s f e r   f u n c t i o o f   t h e   f r e que n c y   f i e l i s   e xp r e s s e by :     ( , ) = ( , ) ( , ) + ( , )     (3)     w h e r e   H ( ω ,   k )   i s   t h e   W i e n e r   f i l t e r   t ra n s f e r   f un c t i o n ,   P d ( ω ,   k )   i s   t h e   s pe c t r um   o f   t h e   de s i r e s i g na l ,   P n ( ω ,   k )   i s   t h e   s pe c t r u m   o f   t h e   n o i s e ,   k   i s   t h e   f ra m e   num b e r ,   a nd  t h e   v a ri a b l e   w   r e pr e s e n t s   t h e   di s c r e t e   f r e que n c y   i n de o f   t h e   f r a m e s .   T h e   de s i r e s i g na l   e s t i m a t i o n   i n   t h e   f r e que n c y   f i e l us i n t h i s   f i l t e r   i s   e xpr e s s e by :     ^ ( ) = ( ) =   (4)     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A e ns e m b l e   t e c hni qu e   f or   s p e e c h   r e c ogni t i on  i noi s y   e nv i r onm e nt s   ( Im ad  Q as i m   H abe e b )   839   w h e r e   d^ (w )   i s   t h e   e s t i m a t i o n   o f   t h e   de s i r e s pe e c h   s i g n a l ,   s (w )   i s   t h e   i n p ut   s pe e c h   s i gna l ,   a n h k   i s   t h e   W i e n e f i l t e r   c o e ff i c i e n t s   [ 23 ] .   (F i l t e r   3)  T h e   G a m m a t o n e   f i l t e r   w a s   de s i g n e t o   e xpr e s s   t h e   pe r f o r m a n c e   of   t h e   hu m a n   a u di t o r y   s y s t e m   a n d   t o   i m p r o v e   t h e   a ut o m a t i c   s pe e c h   r e c o gn i t i o s y s t e m   [ 14 24 ] .   I t   i s   a   l i n e a f i l t e r   t ha t   us e s   l o ga ri t hm i c a l l y   s pa c e de f i n e i n   t h e   i m pu l s e   r e s po n s e   t i m e ,   w hi c h   i s   m e a s u r e by   t h e   p r o du c t   of   a   s i nus o i da l   t o n e   a n d   g a m m a   di s t r i b ut i o n .   H e n c e ,   t h e   m a t h e m a t i c a l   e xp r e s s i o n   o f   t h i s   f i l t e r   i s   s h o w n   i ( 5 ) .     ( ) = 1 2 c o s   ( 2  + )   (5)     w h e r e   r ( t )   r e pr e s e n t s   t h e   G a m m a t o n e   f i l t e r   i m pu l s e   r e s po n s e ,   t h e   s y m bo l s   t ,   c ,   n,   f ,   θ ,   a nd   r e f e r   t o   t h e   t i m e ,   t h e   a m pl i t u de ,   t h e   f i l t e r' s   o r de r,   t h e   f r e que n c y ,   t he   ph a s e   of   t h e   c a rr i e r,   a n t h e   f i l t e r ' s   b a n dw i dt h   r e s pe c t i v e l y   [ 14 ]   F i gu r e   2   a l s o   s h o w s   t h a t   i S t e p   o f   t h e   p r o po s e t e c hn i que ,   t h e   3 - c o pi e s   o f   t h e   i n pu t   s pe e c h   s i g na l   a r e   p r o c e s s e by   t hr e e   A S R   s y s t e m s   i pa ra l l e l   t o   c r e a t e   di f f e r e nt   3 - A S R   o ut put s .   F i gu r e   3   s h o w s   a n   e xa m pl e   of   di f fe r e n t   3 - A S R   o ut put s .             F i gu r e   3 .   A E xa m pl e   o f   di f f e r e n t   3 - A S R   o ut put s       F r o m   F i gu r e   3 ,   i t   c a n   b e   s e e n   t ha t   t h e   num b e o f   c h a r a c t e r s   of   A S R   o ut put   i s   d i f fe r e nt .   T hi s   c a us e s   v e r t i c a l   o v e r l a b e t w e e n   w o r ds   o f   t h e   A S R   r e s ul t i n g   t e xt s .   H e n c e ,   I n   S t e o f   t h e   p r o po s e t e c h ni que ,   t h e r e   i s   a   n e e t o   m a t c e a c l e t t e r   w i t a e qui v a l e n t   i n   o t h e r   A S R   o ut put s ,   w h i c h   i s   c a l l e a a l i g nm e n t   t a s k .   T h e   a l i g n m e n t   t a s h a s   b e e n   pe r f o r m e i t hi s   r e s e a r c h   by   us i ng  t h e   S m i t h - W a t e rm a n   a l go r i t h m .   A f t e t h e   a l i g n m e n t   t a s k ,   a   v o t i ng  t a s w i l l   s e l e c t   t h e   b e s t   c h a r a c t e r   o f   e a c h   c o l um n   t o   pr o duc e   a   f i n a l   A S R   o ut put .   F o r   t h e   vo t i n t a s k,   t h i s   r e s e a r c h   us e s   t h e   r e c o gn i t i o n   c o n f i de n c e   v a l ue   r e t u rn e by   t h e   A S R   e n gi n e   t o   s e l e c t   t h e   b e s t   c h a r a c t e r   o f   e a c h   c o l um n.   T h e   r e c o gn i t i o n   c o n f i de n c e   v a l ue   i s   a   m e t ri c   c a l c ul a t e by   e v a l ua t i n h o w   c l o s e   t h e   f e a t u r e s   de t e c t e i n   t h e   p h o n e m e   s i g na l   a r e   t o   s t a n da rd  p h o n e m e   s i g na l   a n d   s h o ul b e   a   s i ngl e   n u m b e r   f r o m   t o   100.   F i na l l y ,   S t e a n S t e a re   e x e c ut e i n   pa r a l l e l   p r o c e s s i n t o   i n c r e a s e     A S R   pe r f o r m a n c e .         4.   R ES U LT  A N D   D I S C U S S I O N   T h i s   s e c t i o n   hi g hl i g ht s   t h e   r e s ul t s   o f   t h e   t e s t s   o f   t h i s   s t udy .   T h e   e v a l ua t i o o f   t h e   p r o po s e e n s e m b l e   t e c hn i q ue   (E T ha s   b e e n   o r ga ni z e i f o ur   e xpe r i m e nt s .   T h e   f i r s t   e xpe r i m e nt   w a s   c o n duc t e t o   t e s t   a n d   r e c o r t h e   r e s ul t s   o f   t h e   E T   t e c hni qu e .   B e s i de s ,   t hr e e   e xpe r i m e nt s   w e r e   c o n duc t e t o   t e s t   a n r e c o r t h e   r e s ul t s   o f   t hr e e   e xi s t i n n o i s e   r e duc t i o n   t e c hni que s   t o   b e   c o m pa r e w i t h   t h e   f i r s t   e xpe r i m e nt .   T h e y   a r e   S pe c t r a l   S ub t ra c t i o n   [ 22 ] ,   W i e n e r   f i l t e r   [ 23 ] ,   a n G a m m a t o n e   f i l t e r   [ 2 4 ] .   A l l   t h e s e   t e c h ni que s   ha v e   be e n   i m p l e m e nt e i M A T L A B   s of t w a r e .   I a ddi t i o t o   t h a t ,   t he   e xpe r i m e n t s   us e t h e   K a l di   t o o l ki t   a s   a n   A S R   e n gi n e ,   w h i c h   i s   a   f r e e ,   o pe n - s o ur c e   l i b r a r y   fo r   A S R   r e s e a r c [ 25 - 26 ] .   T h e   f o ur   e xpe ri m e nt s   us e W o r E rr o R a t e   (W E R a n d   C h a ra c t e r   E rr o R a t e   (C E R a s   c o m pa ra t i v e   m e a s u r e s .   W E R   a nd  C E R   h a v e   b e e n   c a l c ul a t e us i n ( 6 )   a n d   ( 7 )   r e s pe c t i v e l y   [ 18 26 - 27 ] .        =             (6)      =           (7)     L e v e n s h t e i a l go ri t hm   ha s   b e e n   us e t o   c o un t   i n c o rr e c t   w o r ds   a nd  i n c o rr e c t   c h a ra c t e r s   i   ( 6 )   a nd  ( 7 )   [ 27 ] .   B e s i de s ,   5000  p hra s e s   c o n t a i n e 26 531  w o r ds   h a v e   b e e n   us e a s   a   t e s t i n d a t a s e t   i t h e   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 2 :     8 3 5   -   8 4 2   840   e xpe r i m e nt s .   T h e s e   phra s e s   w e r e   c h o s e n   r a ndo m l y   f r o m   G oo gl e   Boo ks   N gr a m   V i e w e r ,   w h i c h   i s   f r e e   t dow n l o a a n i s   c o m m o n l y   us e i n   s e ve r a l   do m a i n s   [ 18 - 19 ] .   T h e   t e xt   o f   t h e s e   phr a s e s   i s   us e f ul   a s   a   r e f e r e n c e   i n   t h e   e xpe ri m e n t s .   T h e   s pe e c h   a ud i o   f i l e s   of   t he s e   phr a s e s   h a v e   b e e n   p r o duc e us i n G o o gl e   Cl o ud  T e xt - to - S pe e c h   t o   c r e a t e   t h e   t e s t i n da t a s e t .   N o i s e   s i gn a l   ha s   b e e n   ge n e r a t e us i n G a us s i a n   di s t r i b ut i o n   [ 28 ]   a n a dde t o   t h e   s pe e c h   a u di o   f i l e s   of   t h e   t e s t i n g   d a t a s e t .   T a b l e   p r e s e nt s   t h e   t e s t s   r e s ul t   of  t h e   f o ur   e xpe ri m e n t s   us i ng  t h e   W E R .         T a b l e   1 .   T e s t s   R e s ul t   o t h e   W E R     S p e c t ra l   S u b t ra c t i o n   W i e n e fi l t e r   G a m m a t o n e   fi l t e r   T h e   p r o p o s e d   t e c h n i q u e   T o t a l   w o r d s   2 6 5 3 1   2 6 5 3 1   2 6 5 3 1   2 6 5 3 1   W ro n g   w o rd s   1 3 6 1 5   1 2 4 1 1   1 1 7 4 7   8686   WER   5 1 . 3 2 %   4 6 . 7 8 %   4 4 . 2 8 %   3 2 . 7 4 %       In  T a b l e   1,   t h e   t e s t   r e s ul t s   o f   t h e   e xpe ri m e nt s   p r e s e n t   v a r i o us   v a l ue s   o f   W E R   fo r   e a c t e s t e t e c hn i q ue   a n t h e   W E R   of   a l l   t e s t e t e c hni que s   i s   s t i l l   h i g fo r   n o i s y   s p e e c h   s i g na l s .   T h e y   a l s o   pr e s e n t   t h a t   t h e   S pe c t r a l   S ub t r a c t i o n   t e c hn i q ue   a c hi e v e t h e   l o w e s t   v a l ue   of   a c c ur a c y   w i t t h e   W E R   o f   51. 32%.   T h e   r e s ul t s   c o n f i rm   t h a t   t h e   W i e n e r   f i l t e t e c hni que   a c hi e v e be t t e r   a c c ura c y   t ha n   t h e   p r e v i o us   w i t h   t h e   W E R   of  46. 78 %,   f o l l ow e by   t h e   G a m m a t o n e   f i l t e r   t e c hn i que   w i t h   W E R   of   44. 28%.   M o r e o ve r ,   t h e   p r o po s e d   t e c hn i q ue   w a s   t h e   o n e   t ha t   a c h i e v e t h e   m o s t   r o b us t   r e s ul t s   w i t h   t h e   W E R   of   32. 74% .   It   o b t a i n e a   14 . 72 r e l a t i v e   r e duc t i o n   c o m pa r e t o   t h e   a v e r a ge   e rr o r   r a t e   fo r   o l de r   n o i s e   r e duc t i o n   m e t h o ds .   In   a ddi t i o n,   i t   ob t a i n e a n   11 . 54 r e l a t i v e   r e duc t i o n   c o m pa r e t o   t h e   b e s t   e rr o r   ra t e   f o r   t h e s e   m e t h o ds .   T hi s   i n d i c a t e s   t h a t   t h e   pr o po s e e n s e m b l e   t e c hn i q ue   a c hi e v e t h e   b e s t   a c c ur a c y   a ga i n s t   o t h e r   c u rr e n t   m e t h o ds .   T a b l e   pr e s e nt s   t h e   t e s t s   r e s ul t   o f   t h e   f o ur   e xpe ri m e nt s   us i ng  t h e   C E R .         T a b l e   2 .   T e s t s   R e s ul t   o f   t h e   CE R     S p e c t ra l   S u b t ra c t i o n   W i e n e fi l t e r   G a m m a t o n e   fi l t e r   T h e   p r o p o s e d   t e c h n i q u e   T o t a l   c h a ra c t e r s   1 0 8 1 2 4   1 0 8 1 2 4   1 0 8 1 2 4   1 0 8 1 2 4   W ro n g   c h a ra c t e r s   4 9 4 7 7   4 1 8 5 4   4 1 0 2 2   2 3 0 7 2   CE R   4 5 . 7 6 %   3 8 . 7 1 %   3 7 . 9 4 %   2 1 . 3 3 %       A s   c a n   b e   s e e n   i n   T a b l e   2,   t h e   w o r s t   pe r fo r m a n c e   i n   t e rm s   of   CE v a l ue   w a s   a c h i e v e by   t h e   S pe c t r a l   S ub t ra c t i o n   t e c hni que ,   w h i c h   ha s   a   r a t e   o f   45. 76%.   M o r e o v e r ,   t h e   v a l ue s   o f   CE R   fo r   t h e   c urr e n t   t e c hn i q ue s   of   W i e n e r   f i l t e r   a n G a m m a t o n e   f i l t e r   d i f fe s l i g h t l y   w i t h   v a l ue s   of   38. 71%  a n 37. 9 4%  r e s pe c t i v e l y .   In   c o n t ra s t ,   t h e   p r o po s e t e c h n i que   a c h i e v e t he   be s t   CE R   r e duc t i o w i t a   v a l ue   o f   21. 33% .   It   ob t a i n e a   19 . 47%  r e l a t i v e   r e duc t i o c o m pa r e t o   t h e   a v e ra g e   e rr o r   ra t e   f o r   o l de r   n o i s e   r e duc t i o m e t h o ds .   I a ddi t i o n,   i t   o b t a i n e a   16 . 61 r e l a t i v e   r e duc t i o n   c o m pa r e t o   t h e   b e s t   e rr o r   r a t e   f o r   t h e s e   m e t h o ds .   H e n c e ,   w h e n   c o m pa r i ng  t h e   r e s ul t s   o f   t h e   p r o po s e t e c h n i q ue s   t o   t h o s e   of   o l de r   s t udi e s ,   t h e y   i n d i c a t e   t ha t   t h e   E T   t e c hn i q ue   a c h i e v e t h e   b e s t   r e duc t i o i t h e   i n c o rr e c t   c h a ra c t e r   c o unt   a ga i n s t   t h e   o l de s t udi e s .     T h e   e xpe r i m e n t a l   r e s ul t s   p r o v e   h ow   c o m b i n i n m ul t i p l e   n o i s e   r e duc t i o n   t e c hn i q ue s   c a n   h e l i n   de s i gni n a   b e t t e r   A S R   s y s t e m .   F ur t h e r m o r e ,   t h e y   s h ow   t h a t   t h e   W E R   of   n o i s y   s p e e c h   s i g n a l   w i l l   a l w a y s   b e   pr o b l e m   s i n c e   n o i s e   i s ,   by   c l a s s i f i c a t i o n ,   u np r e di c t a b l e .   M o r e o ve r ,   t h e   S pe c t ra l   S ub t r a c t i o n   t e c hn i q ue   ha s   a   l o w   a c c ur a c y   be c a us e   i t   a s s um e s   t h a t   n o i s e   i s   a   s l ow l y   v a r y i n p r o c e s s   o r   s t a t i o na r y   a n t h a t   t h e   s pe c t r u m   of  n o i s e   i s   n o t   s i g ni f i c a n t l y   di f fe r e n t   d ue   t o   b a c kg r o un d   s o un ds .         4.   C O N C LU S I O N   D ue   t o   t h e   c o m pl e xi t y   of   t h e   h um a n   h e a ri n s y s t e m   a n t h e   qua l i t y   of   s pe e c h   s i g n a l s ,   i m p r o v i n t h e   a c c ur a c y   o f   A S R   i s   s t i l l   a   c h a l l e n g i n t a s k .   T h e r e f o r e ,   i n   a   r e a l   e n v i r o n m e nt ,   r o b us t   a u t o m a t i c   s pe e c h   r e c o gn i t i o i s   a   c o m m o n   i nt e r e s t   i n   t h e   s pe e c h   r e c o gn i t i o n   c o m m u n i t i e s .   T h e   m a i r e a s o n   i s   t ha t   t h e   s pe e c h   of   t h e   s pe a ke r   i s   c o rr up t e by   di ff e r e n t   b a c kg r o und  n o i s e s .   I n   t hi s   w o r k,   a e n s e m b l e   t e c hni que   ha s   b e e n   pr o po s e fo r   s pe e c h   r e c o gn i t i o n   i n   n o i s y   e n v i r o n m e nt s   b a s e o n   t hr e e   di f fe r e n t   n o i s e   r e duc t i o n   f i l t e r s .   A s   m e nt i o n e p r e v i o us l y ,   t h e   m a i n   i de a   o f   t hi s   t e c hni que   i s   t h a t   i n s t e a o f   r e l y i n o n   a n y o n e   i m pe r f e c t   n o i s e   r e duc t i o n   f i l t e r,   t h e   p r o po s e t e c h ni que   i n c o rpo r a t e s   i n f o r m a t i o n   f r o m   m ul t i p l e   n o i s e   r e duc t i o n   f i l t e r s   o f   t h e   s a m e   s pe e c h   s i g n a l   t o   i m p r o v e   A S R   o ut put .     T h e   e xpe r i m e n t a l   r e s ul t s   p r o v e t ha t   d i f f e r e n t   n o i s e   r e duc t i o n   f i l t e r s   po t e n t i a l l y   offe r e c o m pl e m e n t a r y   i n f o r m a t i o n   a b o ut   t h e   ph o n e m e s   t o   b e   c l a s s i f i e w h i c h   c o ul b e   h a rn e s s e t o   i n c r e a s e   t h e   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       A e ns e m b l e   t e c hni qu e   f or   s p e e c h   r e c ogni t i on  i noi s y   e nv i r onm e nt s   ( Im ad  Q as i m   H abe e b )   841   a c c ur a c y   of   t h e   A S R   s y s t e m .   F urt h e rm o r e ,   t h e   r e s ul t s   a l s o   s h o w   t h a t   t h e   p r o po s e t e c h ni que   o ut pe r f o r m s   o l de r   s t ud i e s   f o r   t h e   c o m pa r a t i v e   m e a s u r e s   o f   W E R   a n CE R .   Co n s e que n t l y ,   i t   i s   c l e a r   t ha t   t h e   e xpe ri m e n t s   of   t hi s   r e s e a r c c o n f i rm   t h a t   t h e   go a l   o f   t h i s   s t udy   ha s   b e e n   a c c o m pl i s h e d.   M o r e o ve r ,   t h e y   fo un c l e a s uppo r t   f o r   t h e   e v i de n c e   t h a t   i t   i s   ha r f o r   t h e   A S R   e r r o r   ra t e   t o   b e   0%  due   t o   t h e   di f f e r e n t   t y pe s   of   n o i s e .   In  f ut ur e   w o r k,   f a r t h e r   r e s e a r c h   i s   r e qui r e t o   de ve l o m e t h o ds   t ha t   c a n   i m p r o v e   t h e   c urr e nt   s t udi e s '   l i m i t a t i o n s   of   s pe e c h   t o   t e xt - do m a i n   f o r   m o b i l e   a ppl i c a t i o n s .   I n   a dd i t i o n,   s i n c e   a   pe r s o n   c a n   e s t i m a t e   w o r ds   a n p hra s e s   e ve n   i f   h e   do e s   n o t   h e a r   t h e m   c o m pl e t e l y ,   t h e n   i t   c a n   de s i g n   a   po s t - p r o c e s s i n t e c hn i que   b a s e o n   t h e   n - g r a m   l a n gu a ge   m o de l   t o   p r o v i de   a   m e c ha n i s m   s i m i l a t o   t h a t   o f   t h e   h u m a h e a ri n s y s t e m .         R EF ER EN C ES   [ 1]   K .   R a m l i   a nd  A .   J a r i n ,   " A   r e a l - t i m e   a pp l i c a t i o f r a m e w o r f o r   s pe e c r e c o g ni t i o us i ng   H T T P / a n S S E , "   I ndo ne s i an   J our nal   o f   E l e c t r i c a l   E ngi ne e r i ng   and   C om p ut e r   Sc i e nc e   ( I J E E C S) ,   v o l .   12 ,   pp .   1230 - 12 38 ,   2 018 .     [ 2]   S .   A j a m i ,   " U s e   o f   s pe e c h - to - t e x t   t e c hno l o gy   f o r   doc um e nt a t i o b y   he a l t hc a r e   pr o v i de r s , "   T he   N at i ona l   m e di c al   j our na l   o f   I n di a,   v o l .   2 9,   p .   148 ,   2016 .     [ 3]   Z .   Z h a ng ,   J .   G e i g e r ,   J .   P o hj a l a i n e n,   A .   E . - D .   M o us a ,   W .   J i n ,   a nd  B .   S c hul l e r ,   " D e e l e a r n i ng   f o r   e nv i r o nm e nt a l l y   r o bus t   s pe e c r e c o g ni t i o n:   A o v e r v i e w   of   r e c e nt   de v e l o pm e nt s , "   A C M   T r ans ac t i o ns   on  I n t e l l i ge nt   Sy s t e m s   and   T e c hnol o gy   ( T I ST ) ,   v o l .   9,   p .   49 ,   2 018 .     [ 4]   J. - Y .   F o ur n i o l s ,   N .   N a s r e dd i ne ,   C .   E s c r i ba ,   P .   A c c o ,   J .   R o ux,   a nd  G .   S o t o - R o m e r o ,   " A O v e r v i e w   of   B a s i c s   S pe e c R e c og ni t i o a nd  A ut o no m o us   A ppr o a c f o r   S m a r t   H o m e   I O T   L o w   P ow e r   D e v i c e s , "   J o ur na l   o f   Si gna l   and   I nf or m a t i on  P r o c e s s i ng,   v o l .   9,   p .   239 ,   2018 .     [ 5]   R .   S ha d i e v ,   W . - Y .   H w a ng ,   Y . - M .   H ua ng ,   a n C . - J .   L i u,   " I n v e s t i g a t i ng   a ppl i c a t i o ns   o f   s pe e c h - to - t e xt   r e c o g ni t i o t e c hno l o gy   f o r   a   f a c e - to - f a c e   s e m i na r   t o   a s s i s t   l e a r ni ng   o f   n o n - na t i v e   E ng l i s h - s p e a k i ng   pa r t i c i pa n t s , "   T e c hnol ogy ,   P e dagogy   and   E d uc a t i on ,   v o l .   2 5 ,   pp.   1 19 - 134 ,   2016 .     [ 6]   J .   B e ne s t y ,   I .   C o he n,   a n J .   C he n ,   F undam e nt al s   of   Si g na l   E nh anc e m e nt   and  A r r a y   Si gna l   P r oc e s s i ng :   W i l e y   O nl i ne   L i br a r y ,   2018 .     [ 7]   G .   B o ho ut a   a nd   V .   K ë pus ka ,   " P e r f o r m a nc e   o f   W U W   a nd  g e ne r a l   A S R   s pe e c r e c o g ni t i o s y s t e m s   i di f f e r e nt   ac o us t i c   e nv i r o nm e nt s , "   T he   J our nal   o f   t he   A c ou s t i c a l   So c i e t y   o f   A m e r i c a ,   v o l .   143 ,   pp .   1758 - 17 58,   2 018 .     [ 8]   A .   S r i r a m ,   H .   J un ,   Y .   G a ur ,   a nd   S .   S a t h e e s h,   " R obu s t   s pe e c r e c og ni t i o u s i n ge ne r a t i v e   adv e r s ar i a l   ne t w or k s , "   i n   2018   I E E E   I nt e r na t i o na l   C o nf e r e nc e   o n   A c o us t i c s ,   S pe e c a n S i g n a l   P r o c e s s i ng   ( I C A S S P ) ,   20 18 ,   p p.   56 39 - 5643 .     [ 9]   E .   R a s hno ,   A .   A kba r i ,   a nd  B .   N a s e r s h a r i f ,   " A   C o nvo l ut i o na l   N e ur a l   N e t w o r m o de l   b a s e o N e u t r o s o phy   f o r   N o i s y   S pe e c R e c o g ni t i o n, "   a r X i v   pr e pr i nt   a r X i v : 1901 . 10 629 ,   201 9.     [ 10]   K .   V e r m e i r e ,   A .   K no o p,   C .   B o e l ,   S .   A uw e r s ,   L .   S c he nus ,   M .   T a l a v e r o n - R o dr i g ue z ,   e t   al . ,   " S pe e c r e c o g ni t i o i n   no i s e   by   y o un g e r   a nd   o l de r   a dul t s :   E f f e c t s   o f   a g e ,   he a r i ng   l o s s ,   a nd   t e m po r a l   r e s o l u t i o n, "   A nna l s   of   O t o l og y ,   R hi no l o gy   &   L ar y n gol ogy ,   v o l .   12 5,   pp .   297 - 30 2,   2 016 .     [ 11]   V .   Z .   K ë p us k a   a nd  H .   A .   E l ha r a t i ,   " R o bus t   s p e e c r e c o g ni t i o s y s t e m   u s i ng   c o nv e nt i o na l   a nd  hy br i f e a t u r e s   o f   M F C C ,   L P C C ,   P L P ,   R A S T A - P L P   a nd  hi dde n   m a r ko v   m o de l   c l a s s i f i e r   i no i s y   c o ndi t i o ns , "   J ou r na l   o f   C om p ut e r   and  C om m un i c a t i ons ,   v o l .   3 ,   p.   1 ,   2015 .     [ 12]   G .   K r i s hna ,   C .   T r a n ,   J .   Y u,   a nd  A .   H .   T e w f i k,   " S pe e c R e c o g ni t i o w i t no   s pe e c o r   w i t no i s y   s pe e c h, "   ar X i v   pr e pr i nt   ar X i v : 19 03 . 007 39,   2 019 .     [ 13]   P .   G .   S h i v a kum a r ,   H .   L i ,   K .   K ni g ht ,   a nd  P .   G e o r g i o u,   " L e a r ni ng   f r o m   pa s t   m i s t a ke s :   i m pr o v i ng   a ut o m a t i c   s p e e c r e c o g ni t i o o ut put   v i a   no i s y - c l e a phr a s e   c o nt e xt   m o de l i ng , "   A P SI P A   T r ans a c t i on s   on  S i gn al   an I n f or m at i on   P r oc e s s i ng ,   v o l .   8 ,   2019 .     [ 14]   K .   G a r g   a n G .   J a i n,   " A   c om pa r a t i v e   s t ud y   o f   no i s e   r e duc t i on   t e c hni que s   f or   a ut om at i c   s pe e c r e c ogn i t i on   s y s t e m s , "   i n   201 I nt e r na t i o na l   C o nf e r e nc e   o A d v a nc e s   i C o m put i ng ,   C o m m uni c a t i o ns   a n I n f o r m a t i c s   ( I C A C C I ) ,   2016 ,   pp .   2 098 - 21 03.     [ 15]   D .   B a g c hi ,   M .   I .   M a nde l ,   Z .   W a ng ,   Y .   H e ,   A .   P l um m e r ,   a n E .   F o s l e r - L us s i e r ,   " C om bi n i ng  s pe c t r al   f e at ur e   m appi ng  a nd  m u l t i - c ha nne l   m ode l - ba s e s o ur c e   s e pa r at i o f or   noi s e - r ob us t   au t om a t i c   s pe e c r e c ogn i t i on , "   i n   2015   I E E E   W o r ks ho o A ut o m a t i c   S p e e c R e c o g ni t i o a n U n de r s t a ndi ng   ( A S R U ) ,   20 15,   p p.   49 6 - 503 .     [ 16]   D .   J u r a f s ky   a nd  J .   H .   M a r t i n ,   " Spe e c and  l angu age   pr oc e s s i n g:   A i n t r o duc t i on  t na t ur a l   l angu age   pr oc e s s i n g,   c om pu t at i o nal   l i n gu i s t i c s ,   a nd  s pe e c r e c ogn i t i on " ,   2 nd   e d . :   P e a r s o E duc a t i o I ndi a ,   200 9.     [ 17]   P .   K a r j o l ,   M .   A .   K um a r ,   a nd  P .   K .   G ho s h,   " Spe e c e nhanc e m e nt   us i ng  m u l t i p l e   de e ne ur al   ne t w or k s , "   i 201 I E E E   I nt e r na t i o na l   C o nf e r e nc e   o A c o us t i c s ,   S p e e c a nd   S i g na l   P r o c e s s i ng   ( I C A S S P ) ,   201 8,   pp .   504 9 - 5052 .     [ 18]   I .   Q .   H a b e e b ,   " H y br i m o de l   o f   po s t - pr o c e s s i ng   t e c hn i qu e s   f o r   A r a bi c   o pt i c a l   c ha r a c t e r   r e c o g ni t i o n, "   P hD   t h e s i s ,   U ni v e r s i t i   U t a r a   M a l a y s i a ,   K e d a h ,   M a l a y s i a ,   2 016 .     [ 19]   I .   Q .   H a be e b ,   Z .   Q .   A l - Z a y di ,   a n H .   N .   A bdu l khu dhu r ,   " E nh an c e E ns e m bl e   T e c hni que   f or   O p t i c al   C har a c t e r   R e c ogni t i on , "   i I nt e r n a t i o na l   C o nf e r e nc e   o N e w   T r e nds   i I nf o r m a t i o a nd  C o m m uni c a t i o ns   T e c hno l o g y   A ppl i c a t i o ns ,   201 8,   pp .   213 - 22 5.     [ 20]   T .   T a n ,   Y .   Q i a n ,   H .   H u ,   Y .   Z ho u ,   W .   D i ng ,   a nd  K .   Y u ,   " A da pt i v e   v e r y   de e c o nvo l ut i o na l   r e s i d ua l   ne t w o r f o r   no i s e   r o bus t   s p e e c r e c og ni t i o n , "   I E E E / A C M   T r ans ac t i o ns   o A u di o ,   Spe e c h,   and  L ang uage   P r oc e s s i ng ,   v o l .   26 ,   pp.   13 93 - 1405 ,   201 8.     [ 21]   I .   Q .   H a be e b ,   S .   A .   Y u s o f ,   a nd   F .   B .   A hm a d,   " I m pr o v i ng   O pt i c a l   C ha r a c t e r   R e c o g ni t i o P r o c e s s   f o r   L ow   R e s o l ut i o I m a g e s , "   I nt e r n at i on al   J ou r na l   o f   A d v an c e m e nt s   i C om put i ng   T e c hno l og y ,   v o l .   6,   pp .   13   -   21,     M a y   30  2 014 .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 2 :     8 3 5   -   8 4 2   842   [ 22]   S .   P u l i g i l l a   a nd  P .   M o nda l ,   " C o - e xi s t e nc e   o f   a l um i no s i l i c a t e   a nd  c a l c i um   s i l i c a t e   g e l   c ha r a c t e r i z e t h r o ug s e l e c t i v e   di s s o l u t i o n   a nd   F T I R   s pe c t r a l   s ub t r a c t i o n, "   C e m e nt   an C onc r e t e   R e s e ar c h,   v o l .   70,   p p.   39 - 49 ,   201 5.     [ 23]   D .   W a ng   a n C .   B a o ,   " A I de al   W i e ne r   F i l t e r   C o r r e c t i on - ba s e c I R M   Spe e c E n han c e m e nt   M e t h od  U s i n D e e N e ur al   N e t w or k s   w i t h   Sk i C onne c t i o ns , "   i n   20 18  1 4t h   I E E E   I nt e r na t i o na l   C o nf e r e nc e   o S i g na l   P r o c e s s i ng   ( I C S P ) ,   2 018 ,   pp.   2 70 - 275 .     [ 24]   B .   M a r ko v i ć ,   J .   G a l i ć ,   Ð .   G r o z di ć ,   S .   J o v i č i ć ,   a nd  M .   M i j i ć ,   " W hi s pe r e s pe e c r e c o g ni t i o ba s e d   o g a m m a t o ne   f i l t e r b a nk  c e ps t r a l   c o e f f i c i e nt s , "   J our n al   of   C om m u ni c at i o ns   T e c hnol ogy   an E l e c t r on i c s ,   v o l .   62,     pp.   12 55 - 1261 ,   201 7.     [ 25]   D .   P o v e y ,   A .   G ho s ha l ,   G .   B o u l i a nne ,   L .   B ur g e t ,   O .   G l e m be k ,   N .   G o e l ,   e t   al . ,   " T h e   K a l d i   s pe e c r e c o g ni t i o n   t o o l ki t , "   I E E E   Si gna l   P r oc e s s i n Soc i e t y ,   2011 .     [ 26]   Z .   W a ng ,   E .   V i nc e nt ,   R .   S e r i z e l ,   a nd  Y .   Y a n,   " R a n k - c o ns t r a i ne m u l t i c ha n ne l   W i e ne r   f i l t e r   f o r   s pe e c h   r e c o g ni t i o i no i s y   e nv i r o nm e nt s , "   C om pu t e r   S pe e c &   L angu age ,   v o l .   49 ,   pp .   37 - 51 ,   2018 .     [ 27]   H .   N .   A bdul kh udhu r ,   I .   Q .   H a be e b ,   Y .   Y us o f ,   a nd  S .   A .   M .   Y u s o f ,   " I m pl e m e nt a t i o o f   I m pr ov e L e v e ns ht e i n   A l go r i t hm   f o r   S pe l l i ng   C o r r e c t i o W o r C a ndi d a t e   L i s t   G e n e r a t i o n, "   J o ur na l   o f   T he or e t i c a l   and  A p pl i e I nf or m a t i on  T e c hno l og y ,   v o l .   8 8,   pp .   449 - 45 5,   20 16 .     [ 28]   S .   C h e hr e hs a   a nd  T .   J .   M o i r ,   " S pe e c e nha nc e m e nt   us i ng   M a x i m u m   A - P o s t e r i o r i   a nd  G a us s i a M i x t u r e   M o de l s   f o r   s pe e c h   a nd   no i s e   P e r i o do g r a m   e s t i m a t i o n, "   C om pu t e r   Spe e c &   L a nguage ,   v o l .   3 6,   pp .   58 - 71 ,   201 6.                                                                                         Evaluation Warning : The document was created with Spire.PDF for Python.