I n te r n ati o n al   Jo u r n al   o El e c tr i c a l   an d   C o m p u te r   En gi n e e r i n g   (I JEC E )   V o l .   10 ,   N o .   3 J u n i   202 0 ,   pp .   2 742~ 2754   IS S N :   2088 - 8708 D O I :   10. 1 1591 / ij ece . v 10 i 3 . pp2742 - 2754             2742       Jou r n al   h o m e pa ge ht t p: / / i j e c e . i ae s c or e . c om / i nd e x . php / IJ E CE   c o m p r e h e n si v e   i n s i g h t   t o w a r d s p r e - p r o c e ssi n g   m e t h o d o l o g i e a p p l i e d   o n   G PS  d a t a       R .   P r ab h a 1 M o h an   G .   K ab ad i 2   1 V i s v e s v a r a y a   T e c hno l o g i c a l   U ni v e r s i t y ,   I ndi a   2 D e pa r t m e n t   o f   C o m put e r   S c i e nc e   a nd   E ng i n e e r i ng ,   S a i   V i dy a   I ns t i t ut e   o f   T e c hno l o gy ,   I ndi a       A r ti c l e   I n fo     A B S TR A C T   Ar t i c l e   h i s t or y :   R e c e i v e d   A pr   30 ,   201 9   R e v i s e N o v   6 ,   20 19   A c c e pt e N o v   24 ,   20 19       R e l i a b i l i t y   i t he   ut i l i z a t i o o f   t he   G l o ba l   P o s i t i o ni ng   S y s t e m   ( G P S )   da t a   de m a nd s   a   hi g he r   de g r e e   o f   a c c ur a c y   w i t r e s pe c t   t o   t i m e   a nd  po s i t i o na l   i nf o r m a t i o r e qu i r e by   t he   us e r .   H o w e v e r ,   v a r i o us   e x t r i n s i c   a n i n t r i ns i c   pa r a m e t e r s   di s r u pt   t he   d a t a   t r a n s m i s s i o phe no m e no f r o m   G P S   s a t e l l i t e   t o   G P S   r e c e i v e r   w h i c a l w a y s   que s t i o ns   t h e   t r us t w o r t h i ne s s   o f   s uc da t a .   T he r e f o r e ,   t hi s   m a n us c r i pt   o f f e r s   a   c o m pr e he ns i v e   i ns i g ht   i nt o   t he   da t a   pr e p r o c e s s i ng   m e t ho do l o g i e s   e v o l v e a nd  a do pt e d   by   pr e s e n t - da y   r e s e a r c he r s .   T h e   d i s c us s i o i s   c a r r i e o ut   w i t h   r e s pe c t   t o   s t a nd a r d   m e t ho ds   o f   da t a   c l e a n i ng   a s   w e l l   a s   d i v e r s i f i e e xi s t i ng   r e s e a r c h - ba s e a p pr o a c he s .   T he   r e v i e w   f i nds   t ha t   i r r e s pe c t i v e   o f   a   go o num be r   o f   w o r c a r r i e o ut   t o   a ddr e s s   t he   pr o bl e m   o f   da t a   c l e a n i ng ,   t he r e   a r e   c r i t i c a l   l o o pho l e s   i a l m o s t   a l l   t he   e xi s t i ng   s t ud i e s .   T he   p a pe r   e x t r a c t s   o pe e nd  r e s e a r c pr o bl e m s   a s   w e l l   a s   i t   a l s o   o f f e r s   a n   e v i d e nt i a l   i n s i g ht   us i ng   u s e - c a s e s   w he r e   i t   i s   f o und  t h a t   s t i l l   t h e r e   i s   a   c r i t i c a l   n e e d   t o   i nv e s t i g a t e   da t a   c l e a ni ng   m e t ho ds .   Ke y w or d s :   D a t a   c l e a n i ng   D a t a   p re - p r o c e s s i n g   G l o b a l   po s i t i o n i ng  s y s t e m   R e c e i v e r   S a t e l l i t e     C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e   A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   R .   P ra b ha ,   V i s v e s v a r a y a   T e c hn o l o gi c a l   U n i v e r s i t y ,   B e l a ga v i ,   K a rn a t a k a ,   I ndi a     E m a i l :   r e s e a r c h . p r a b ha . r @ gm a i l . c o m       1.   I N TR O D U C TI O N   T h e   ut i l i z a t i o n   o f   t h e   G l o b a l   P o s i t i o n i n S y s t e m   (G P S h a s   b e e n   i n c r e a s i n s i n c e   t h e   l a s t   de c a de   a s   i t   i s   o n e   of  t h e   m o s t   c o s t - e ff e c t i v e   n a v i ga t i o n a l   a s s i s t a n c e   [1].   W i t h   t h e   p r o l i f e r a t e us a ge   o s m a rt p h o n e ,   v a r i o us   n a v i g a t i o n a l   a ppl i c a t i o n s   a n l o c a t i o s e r v i c e s   a r e   di r e c t l y   de pe n de n t   o n   t h e   G P S   da t a .   T h e   G P S   s y s t e m   e xt r a c t s   t h e   s i g na l   i n f o r m a t i o n   f r o m   t h e   s a t e l l i t e s   i n   o r de r   t o   ob t a i n   t h e   l o c a t i o n - s pe c i f i c   i n f o r m a t i o n.   O n   t h e   b a s i s   o f   t h e   us a ge   o f   t h e   d i f f e r e n t   G P S   r e c e i v e r ,   t h e   i n f o r m a t i o n   o f   t h e   l o c a t i o n   i s   ge n e ri c a l l y   pr o v i de i n   t h e   fo r m   o f   L o n gi t ude ,   L a t i t ude ,   a nd  a l t i t ude   [2 ].   T h e   i nt e r e s t i ng  f a c t o r   a b o ut   t h e   G P S   s i g n a l   i s   i t s   pub l i c l y   a v a i l a b i l i t y   a n a c c e s s i b i l i t y .   F r o m   a   t e c hn i c a l   v i e w p o i n t ,   t h e   t i m e   f a c t o r   a n t h e   s pa t i a l   f a c t o r   ar e   t h e   s o l e   b a c kbo n e s   of   G P S   s a t e l l i t e s   t ha t   b e a r   a n   a t o m i c   c l oc w i t h   s upe ri o r   s y n c hr o n i z a t i o n   c a pa b i l i t y .   T h e y   a r e   a l s o   c a pa b l e   of   r e c t i fy i n a n c o m pe n s a t i n a n y   fo r m   o f   dr i f t   i n   t h e   c l o c t i m i ng  w i t h   t h e   g r o u n de v i c e s   v e r y   s p o n t a n e o us l y .   A   r a d i o   s i gna l   i s   b e i n c o n s i s t e nt l y   t r a n s m i t t e by   a l l   t h e   s a t e l l i t e s   of   G P S   t h a t   c o n s i s t s   o f   upda t e po s i t i o na l   da t a   a nd  t i m e   i n f o r m a t i o n   of   t ha t   po s i t i o n.   It   i s   a l s o   b e l i e ve t ha t   l a t e n c y   b e t w e e n   t h e   G P S   s a t e l l i t e   i s   hi g hl y   de pe n de n t   o t h e   d i s t a n c e   f r o m   t h e   e a rt h l y   r e c e i ve r   a nd  G P S   s a t e l l i t e   a s   i t   i s   f r e e   f r o m   a n y   d e pe n de n c y   of  t h e   s pe e of   s a t e l l i t e   a n m o r e o v e r   t h e   ra di o - w a v e s   h a v e   un i f o r m   v e l o c i t y   [3].   T h e r e   i s   a   t y pi c a l   c o m put a t i o n   c a rri e o ut   by   t h e   e a r t hl y   r e c e i v e r   t oo   w h i c h   i s   r e s po n s i b l e   fo r   c o m put i n t h e   a pp r o p ri a t e   po s i t i o na l   i n f o r m a t i o n   a f t e r   i t   ob t a i n e m ul t i p l e   da t a   f r o m   m ul t i pl e   s a t e l l i t e s .   T h e   c o m put a t i o n   w i l l   n e e t o   be   c a r ri e o ut   w i t h   hi g h e r   a c c ura c y .   It   i s   a l s o   be l i e ve t h a t   i n   o r de r   t o   c o m put e   t h e   po s i t i o n   i n f o rm a t i o n   b y   t h e   G P S   r e c e i ve r ,   t h e r e   s h o ul b e   t h e   pr e s e n c e   o f   a t   l e a s t   f o ur   G P S   s a t e l l i t e   w i t h i n   a   l i n e   o s i gh t .   A l t h o ug h,   t hi s   i s   a   c o n di t i o n   a n t hi s   c o n di t i o n   i s   qu i t e   ha r t o   b e   s a t i s f i e i n   m a n y   r e a l - t i m e   c a s e s .   T h e   s i g n a l   f o r w a r de by   t h e   G P S   s a t e l l i t e   c o n s i s t s   o f   m uc h   e s s e n t i a l   i n f o r m a t i o n .   T h e   f i r s t   Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       A   c om pr e h e ns i v e   i ns i ght   t ow ar ds   pr e - pr oc e s s i ng   m e t hod ol og i e s   a ppl i e d   on   G P da t a   ( R .   P r abha )   2743   fo r m   o f   c o n t e n t   i s   a   c o de   w h i c b e a r s   ps e udo ra n do m   c ha r a c t e r i s t i c s .   I n f o r m a t i o n   o f   t h i s   c o de   i s   o n l y   i de nt i f i e a n i n f e rr e by   t h e   G P S   r e c e i v e r .   T h e   r e c e i ve c a n   o b t a i n   t h e   e po c h   o n   t h e   b a s i s   o f   m ul t i pl e   pa r a m e t e r s   f r o m   t hi s   c o de .   T h e   s e c o n c o n t e n t   o f   t h e   G P S   s i gna l   i s   t h e   m e s s a ge   t ha t   b e a r s   t h e   i n f o r m a t i o n   of  t h e   po s i t i o o f   s a t e l l i t e   a n d   t ra n s m i s s i o n   o f   t h e   pa rt i c ul a r   e poc h .   T h e   r e c e i v e r   t h e n   c o m put e s   t h e   t i m e   o f l i ght   o n   t h e   b a s i s   of   t h e s e   t w o   pa r a m e t e r s ,   i . e .   t i m e   o f   a rr i v a l   a n t i m e   o t r a n s m i s s i o n   a n t h i s   c o m put e i n f o r m a t i o n   i s   r e qui r e by   a n y   us e r s   [4].   It   s h o ul b e   kn o w n   t ha t   t h e   of fs e t   of   t h e   c l o c m a i nt a i n e w i t hi n   a   r e c e i ve r   a s   w e l l   a s   t h e   po s i t i o o f   t h e   r e c e i ve r   i s   s o m e t h i n g   t ha t   i s   r e qui r e t o   b e   c o m put e i pa ra l l e l   t o   e a c h   o t h e r.   F i n a l l y ,   t h e   o b t a i n e i n f o r m a t i o n   i s   c o n v e r t e t o   l o n gi t ude ,   l a t i t u de ,   a l t i t ude ,   s pe e d,   e t c .   w h i c h   i s   fo r w a r de t o   t h e   na v i ga t i o na l   s y s t e m   of   t h e   us e r .   T h e   m a p - u pda t e ,   t ra f f i c   m o n i t o ri n g ,   e t c   ki n ds   o f   a ppl i c a t i o n   us e s   G P S   s e n s o r   t o   r e c o r t h e   3D   c o o r di n a t e s   X ,   Y ,   Z   w i t h   a   t i m e   s t a m c h a ra c t e r i z e by   i t s   v a l ue ,   t h a t   t o ha v e   a n o t h e r   c h a ra c t e ri z e l i ke   v o l um e .   If   t h e   pe r i o o f   re c o r di n g   i s   v e r y   l a rge   a s   w e l l   a s   i f   a n y   s y s t e m   f a i l u r e   ha ppe n s   t h e n   i t s   w i l l   h a v e   ve r a c i t y .   T h e   v e r a c i t y   a s   u n c e rt a i n   o r   m i s s i n d a t a   o r   r e du n d a n t   da t a   p l a y s   a   c r uc i a l   r o l e   i n   t h e   o pe r a t i ng  o f   t h e   a c c ur a t e   t r a f f i c   m a n a ge m e nt   s y s t e m .   T h e   l a r ge   G P S   da t a   t ra c e s   c o n s i s t   of   a l l   t hr e e   c h a ra c t e r i s t i c s   of  vo l um e ,   v a l ue ,   a nd  v e r a c i t y   a l o n w i t h   v e l oc i t y   a n v a ri e t y .   T h i s   l a r ge   vo l um e   of   t h e   s pe c t ra l   d a t a   po s e s   h uge   c r i t i c a l   c h a l l e n ge s   du r i n t h e   da t a   p r o c e s s i n m o s t   i m po r t a n t l y   t h e i r   l a r ge   vo l um e   of   da t a   w i t h   a   l o w   gr a d i n a   m i b l e nd  o r a w   da t a   a n t h e   un c e rt a i n   a s pe c t s   i m p a c t s   l a rge l y   t h e   da t a   a n a l y t i c s   pr o c e s s   i n   b o t h   v i e w po i n t   o f   da t a   s c i e n c e   a nd  e n g a gi ng  t o   m i n e   t h e   us e f ul   i n s i g h t .   T h e r e fo r e ,   t h i s   p a pe r e v i e w s   t h e   e xi s t i n s y s t e m   of   G P S   da t a   p r e - p r o c e s s i n g.   S e c t i o n - d i s c us s e s   t h e   e s s e n t i a l   o f   G P S   da t a   f o l l ow e by   e s s e n t i a l   o f   t h e   pr e - p r o c e s s i n m e c h a ni s m   o f   G P S   da t a   i n   S e c t i o n - 3 .   S e c t i o n - d i s c us s e s   e xi s t i n g   r e s e a r c h   w o r f o l l ow e by   a   b r i e f i n g   o f   o p e n - e n d   pr o b l e m s   i n   S e c t i o n - 5.   F i na l l y ,   S e c t i o n - b r i e f s   a b o ut   t h e   c o n c l us i o a nd  f ut u r e   w o r d i r e c t i o n.       2.   ES S EN TI A LS   O F   G P S   D A TA   B e fo r e   b r i e f i n a b o ut   G P S   da t a ,   i t   i s   e s s e n t i a l   t o   u n de rs t a n t h e   f un d a m e nt a l   s t r uc t u r e   o f   i t .   It   c o n s i s t s   o f   r e c e i v e r gr ound  c on t r ol   s t at i on ,   a n s a t e l l i t e .   A t   p r e s e nt ,   t h e   G P S   s y s t e m   t ra n s m i t s   t h e   s i g n a l   us i n t w s i gn i f i c a nt   f r e que n c y   l e v e l s   i . e .   t h e   f i r s t   o n e   i s   1, 575 . 42  M H z   a nd  s e c o n o n e   i s   1, 227. 6 M H z .   T h e   w i de l y   us e c o m m e r c i a l   a ppl i c a t i o n   us e by   c o m m o pe o pl e   us e s   G P S   s i gn a l s   t ha t   a r e   e n c o de b y   c o ur s e / a c qui s i t i o n   c o de ,   a n t h i s   e n c o di n s y s t e m   i n v o l ve s   c o de s   of   i de n t i f i c a t i o o f   a l l   t h e   s a t e l l i t e s .   S pe c i a l   a c c e s s i b i l i t y   i s   a l s o   gi ve n   t o   m i l i t a r y   a ppl i c a t i o n   w h e r e   t he   G P S   s i gn a l   i s   e n c o de w i t h   p r e c i s e   c o d e   [5].   A l t h o ug h ,   t h e r e   i s   a   s o ph i s t i c a t e p r o c e s s   t o   e n s ur e   t ha t   da t a   o f fe r e by   G P S   i s   a c c ur a t e ,   b ut   s t i l l   v a ri o us   e xt e rn a l   f a c t o r s   ha v e   a i m pa c t   o n   t h e   a c c ura c y   (F i g ur e   1 v i z .   i e f f e c t   of   t r o po s ph e r e   t ha t   c a us e s   ra d i r e f l e c t i o n   i n duc i ng  e rr o r s ,   i i e f fe c t   of   i o n o s ph e r e   c a us i n m uc h   s l o w e r   s pe e of   s i gn a l   p r o pa ga t i o n   c a us i n g   e rr o r   i n   t ra n s m i s s i o n   p r o c e s s ,   a n d   i i i e f f e c t   of   m ul t i pa t h   t r a n s m i s s i o c a us i n g   a dv e r s e   e f fe c t   of   r e f l e c t i o n   due   to   m a n y   p h y s i c a l   s t r uc t u r e s   o t h e   g r o u n d   [6] .           F i gu r e   1 .   E xt e rna l   f a c t o r   f o r   e rr o i G P S   d a t a       In   p r e s e n t   t i m e s ,   a   s t a n d a r m e a s u r e   o f   D i l ut i on   of   P r e c i s i on   o r   c o m m o nl y   kn ow n   a s   D o P   i s   us e fo r   c h e c ki ng  h o w   m uc h   i s   a   de gr e e   of   de gr a da t i o n   h a s   b e e n   i n v o ke o n   G P S   da t a   i n   t e rm s   of   a c c ur a c y   [7].   N o r m a l l y   D o P   v a l ue   i s   s m a l l e r   o t h e r e   i s   a   n o n - u ni f o r m   po s i t i o n   of   G P S   s a t e l l i t e   o r   e l s e   D o P   v a l ue   i s   f o un hi g h e r .   A n o t h e r   e s s e n t i a l   pa ra m e t e r   i s   s i gn al   s t r e n gt h   w hi c s i gni f i e s   t h e   l e v e l   of   s i gn a l   s t a b i l i t y   t oo   dur i n   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   3 J u ni   20 20  :     27 42   -   2 754   2744   t h e   r e c e pt i o n   s t a t e .   N o rm a l l y ,   G P S   s i gna l   b e c o m e s   un s t a b l e   i n   t h e   p r e s e n c e   of   ob s t a c l e   o r   a rt i f a c t s   c a us i n g   w e a ke r   s t r e ngt h   o f   G P S   s i gn a l .   T h e   t h i rd  f a c t o r   t ow a r ds   h o l di n G P S   d a t a   a c c u r a c y   i s   a qua n t i t y   of   s a t e l l i t e s   w i t h   G P S   c a p a b i l i t y .   M o r e   t h e   n u m b e r   o f   s a t e l l i t e s ,   r e l i a b l e   a r e   t h e   po s i t i o ni n v a l ue s .   D i s c us s i o n   o f   s uc h   e xt e rn a l   f a c t o r s   c a us i ng  de g r a d a t i o n   o f   G P S   s i gna l   i s   pub l i c l y   kn o w n ;   h o w e v e r ,   t h e r e   a r e   v a r i o us   i nt e rna l   fa c t o r s   t oo   w h i c h   i s   b e i n i n v e s t i ga t e by   t h e   r e s e a r c h   c o m m u n i t y   s i n c e   t h e   l a s t   de c a de .   T h e r e   a r e   v a ri o us   fo r m s   a n t y p e s   of   r e s e a r c h - b a s e s o l ut i o n   t o   a d d r e s s   t h i s   p rob l e m   of   pr e - p r o c e s s i n a rt i f a c t s   f r o m   G P S   d a t a .   T h e   s t a n d a r p r o c e s s   of   pe r f o r m i n t h i s   p re - p r o c e s s i n t h e   a r t i f a c t s   f r o m   G P S   da t a   a r e   c l a s s i f i e i n t o   t w t y p e s   v i z .   s t a t i s t i c a l - b a s e a p p r o a c h   a n d   l o gi c a l - b a s e a pp r o a c [8 - 11 ].   T h e s e   m e t h o ds   w e r e   us e d   t r a d i t i o n a l l y   t o   pr e pr o c e s s   G P S   da t a   due   t o   i t s   b e h a v i o r   of   l e s s   s us c e pt i b l e   t o   t h e   e rr o s t r e a m i n f r o m   s a m pl i n i n t e r v a l s .   T h e   de n s i t y   of   t h e   da t a   po i nt   i n   G P S   s i g na l   c o rr e l a t e s   i t s e l f   w i t h   t h e   p r o b a b i l i t y   f a c t o r s   of  m a n y   n o t i o n s   o f   t h e   v e h i c l e   m o m e n t   o n - t ra c o r   o f f - t r a c k.   B e c a us e   of   t h i s ,   t h e   l o w - de n s i t y   da t a   po i nt   i s   c o n s i de r e a n   o ut l i e r   i n   t h e   c a s e   of   G P S   da t a .   M a j o r i t y   of  pr o b l e m s   of   a r t i f a c t s   i n   G P S   da t a   r e s ul t s   due   t o   m i s s i n g   d a t a   a n d   f o l l ow i n a r e   t h e   s t a nda r d   p r o c e dur e s   t o   de a l   w i t t h e   s i t ua t i o v i z .       O ut l i e r   r e m ov a l :   T r a di t i o na l l y ,   t h e   da t a   po i nt   o f   t h e   G P S   s i g n a l   i s   i ni t i a l l y   s o r t e w i t a i nt e l l i ge nt   s e n s e   o f   e i t h e a s c e n d i n g   o r   de s c e n di n w i t t h e   di s t a n c e   a nd  m e di um ,   a n d   t h e   c o n s i s t e n t   d a t a   i s   t a ke n   a s   fo r   f urt h e p r o c e s s i n g.   T h e   s i m p l i f i e m e t h o c a l l e K e rn e de n s i t y   i s   us e t o   ge t   t h e   de n s i t y   of   t h e   d a t a   po i n t s ,   a n l o w - de n s i t y   da t a   po i n t s   a r e   c o n s i de r e a s   r e du n d a n t   d a t a .   O t h e r   m e t h o ds   i n c l ude   a da p t i v e   de n s i t y   o pt i m i z a t i o n ,   r e gi o n   g r o w i n c l us t e r i ng  w i t h   k n o w l e dge .   M o s t   of   t h e   m e t h o ds   f a i l   t o   h a n d l e   o ut l i e r e m o v a l   i t h e   s i t ua t i o o f   t h e   hi g h - de n s i t y   da t a .     T r aj e c t or y   F i l t e r i ng :   I n   t ra j e c t o r y   f i l t e r i ng  t h e   G P s   da t a   p o s i t i o n   a c c ura c y   i s   a i m s   t o   be   i m pr o v i s e d.     T h e   a pp r o a c h e s   o f   a da pt i v e   K a l m a n   f i l t e ri n g ,   p a r t i c l e   f i l t e ri n g   b a s e m e t h o ds   a r e   de v e l o pe t o   s m oo t h     t h e   n o i s e   t ha n   e n s u r e   r e duc t i o n   o f   e rr o r   i n   t h e   v a l ue s   of  t h e   d a t a   po i nt .   T h e s e   f i l t e r s   i n t e r o pe r a t e   t h e   po s i t i o a n s pe e d,   b ut   t h a t   i s   a   c o m put a t i o n a l l y   c o m pl e t a s k.     Sy s t e m   Mod e l   f or   G P D at Co l l e c t i on:   T h e   t y pi c a l   s y s t e m   m o de l   f o r   t h e   G P S   da t a   c o l l e c t i o n   i n c l ude s   N   us e r   o r   c us t o m   de v i c e s   e qui ppe w i t h   t h e   G P S   s e n s o r   s . t   D   =   {N 1 ,   N 2 ,   . . . N i } ,   w h e r e   i   = t o   N .   T h e   D i   r e c o r t h e   da t a   po i n t s   o f   t h e   G P S   s e n s o r   a n d   ge t   l o gge w i t t h e   l o c a l   b uf fe r ,   w hi c i s   s y n c hr o n i z e w i t h   a   a c c e s s   po i n t   t o   c l o ud  fo r   t h e   c o n t i nuo us   s t r e a m   a nd  upd a t e   o f   t h e   da t a   t o   t h e   c l o ud  a n f urt h e r   f o r     t h e   n u m e ri c a l   c o m put i n e n v i r o n m e n t   s e t up  o n   t h e   o n - p r e m i s e   s y s t e m   A   t y pi c a l   s y s t e m   a r c h i t e c t ur e   of    t h e   da t a   ge n e ra t i o n,   s t o r a ge   a n d   t h e   p r o c e s s i n o f   t h e   G P S   da t a   i s   s h o w n   i n   F i gu r e   2 .           F i gu r e   2 .   S y s t e m   m o de l   o f   t h e   G P S   d a t a   c o l l e c t i o n       3.   P R E - P R O C ES S I N G   G P S   D A TA   A c c o r di n t o   t h e   e xi s t i n g   r e s e a r c h   s t u di e s ,   a l l   t h e   p r o c e s s   a s s o c i a t e w i t h   t h e   a r t i f a c t   r e m o v a l   of  G P S   da t a   us e s   t i m e - s e ri e s   a na l y s i s   m e t h o a n d   i s   b r o a dl y   c l a s s i f i e i nt o   t w o   c l a s s e s   i s t a t i s t i c a l   b a s e a pp r o a c h   a nd  i i l o gi c a l   b a s e a ppr o a c h.   T h e   r e s e a r c h   s t ud y   o n   e a c h   a pp r o a c h   i s   di s c us s i n a s   f o l l ow s :   i S t a t i s t i c a l   b a s e a pp r o a c h Q ua nt i t a t i v e   o r   s t a t i s t i c a l   m e t h o i s   c o n s i de r e a s   o n e   o f   t h e   e f fe c t i ve   a pp r o a c h e s   t o   i de n t i fy   t h e   b e s t   i t e m   s e t s   a n d   c l e a n e t h e   da t a s e t s   w hi c h   a r e   s t a t i s t i c a l l y   c l o s e s t   t o   a   us e r - s pe c i f i e d   da t a   s e t   [12].   U s ua l l y ,   t h e   G P S   da t a   p r e - p r o c e s s i n m e t h o f o l l ow s   t w o   s i gn i f i c a n t   p ha s e s ;   i E rr o r   D e t e c t i o n   a n i i )   E rr o R e pa i r i n g   [13 ].       Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       A   c om pr e h e ns i v e   i ns i ght   t ow ar ds   pr e - pr oc e s s i ng   m e t hod ol og i e s   a ppl i e d   on   G P da t a   ( R .   P r abha )   2745   3. 1 .     Q u al i ta ti v e   e r r o r / an o m al d e t e c t i o n   T h i s   f o r m   o f   de t e c t i o n   m e t h o de a l s   w i t e xpl o r i n g   s t a t i s t i c a l   e rr o r s   a s   f o l l o w s ;     E rr o r   t y pe :   It   r e l a t e s   t o   t h e   s e a r c h   f o r   t h e   t y p e   of   e r r o a n d   s e l e c t i n t h e   a pp r o pri a t e   m e t h o t o   de s c r i b e     t h e   pa t t e rn s   o f   l e ga l   d a t a   i n s t a n c e .   E x a m p l e -   i nt e g r i t y   c on s t ra i nt s ,   f i r s t - o r de r   l o gi c   by   t h e   f r a c t i o n a l   m e t h o d,   f u n c t i o na l   de pe nde n c i e s ,   a nd  de n i a l   c o n s t ra i nt s .     A ut o m a t i o n :   T hi s   m e t h o c l a ri f i e s   h o w   us e r s   a r e   i n v o l v e i t h e   e rr o de t e c t i o n   m e t h o d.   E x a m p l e s   a r e     t h e   de t e c t i o o f   f un c t i o n a l   de pe n de n c i e s   a n d t r a c i ng  a l l   t h e   r e pl i c a t e d   e nt r i e s   o f   da t a   [ 14] .     B us i n e s s - Int e l l i ge n c e :   T h e r e   a r e   goo p o s s i b i l i t i e s   of   a r t i f a c t s   t o   o c c ur   o n   B s t a c k,   l i ke e rr o r - p r o n e   da t a   a r e   us ua l l y   t r a n s m i t t e t hr o ug h   c e rt a i n   c o m m u ni c a t i o n   c h a nn e l   w i t da t a   p r o c e s s i n c a p a b i l i t y .   M e a n w hi l e ,   m a j o r i t y   of   t h e   s t ra t e gi e s   de a l s   w i t h   t ra c i n g   o f   t h e   a rt i f a c t s   i n   d a t a   o v e r   a c t u a l   da t a b a s e .   S t a t i s t i c a l   A rt i f a c t s   T r a c i ng  T a xo n o m y   a s   s h o w n   i F i gu r e   3 .           F i gu r e   3 .   S t a t i s t i c a l   a rt i f a c t s   t ra c i n g   t a xo n o m y       3 . 2   A r t i fac ts   r e p ai r i n g   m e th o d   V a r i o us   i n s t a n c e s   of   da t a   a r e   i de n t i f i e i n   t hi s   m e c h a ni s m   fo r   a s c e r t a i ni n t h e   e s s e n t i a l   qua l i t y   de m a n ds   o da t a s e t .   S i m i l a r   a s   a n   e rr o r   de t e c t i o n   m e t h o d,   t h i s   m e t h o a l s o   a dd r e s s e s   t hr e e   s i gn i f i c a nt   que s t i o n s   l i ke   W ha t ,   H ow   a n W h e r e   t o   r e pa i r.   E rr o r   r e pa i ri n m e t h o c o n t a i n s   p h a s e s   a s   s h o w n   i n     F i gu r e   4 ,   v i z . ;   i )   R e pa i T a r ge t ,   i i )   A ut o m a t i o n   a n d   i i i )   R e pa i M o de l .     R e pa i r   T a r ge t :   T hi s   p r o c e s s   m a ke s   a   di f f e r e n t   a s s um p t i o a b o ut   da t a   a n qua l i t y   r ul e s ,   e . g.   t r us t i n g   de c l a r e i nt e g r i t y   c o n s t ra i nt s ,   t r us t i n t h e   c o m pl e t e   da t a ,   a l l o w i n c o n s t r a i n t s   r e l a xa t i o n ,   e xpl o r i ng    t h e   c ha n gi ng  po s s i b i l i t i e s   of   da t a   a n d   c o n s t r a i n t s .   H ow e ve r ,   m o s t   o f   t h e a pp r o a c h e s   de a l s   w i t r e c t i f i c a t i o n   o f   da t a   c o n s i de ri n o v e r   a   s e t   of   a r t i f a c t s   w hi l e   t h e r e   a r e   a l s o   pr e s e n c e   of   a ppr o a c h e s   t o w a r ds   i n v o l v i n g   c o m m u n i c a t i o m e di um   a s   a   r o o t   c a us e   o e rr o r s .     A ut o m a t i o n :   S pe c i f i c a l l y ,   e r r o r   r e pa i r i ng  t e c hn i que s   a r e   c l a s s i f i e a c c o r di ng  t o   t h e   us e r ' s   i n v o l v e m e n t   (i . e . ,   W h e r e   a n h o w   h um a n s   i n v o l v e d).   S o m e   of   t h e   e xi s t i ng  t e c hn i que s   a r e   f ul l y   a ut o m a t e   (e . g. ,   da t a b a s e   r e c o ve r y ).   O t h e r   t e c hni que s   i n v o l ve   h um a n   i nt e ra c t i o n   d u r i ng  t h e   r e pa i ri n p r o c e s s   w h i c h   v e r i f i e s   t h e   r e pa i r e w o r o r   i n c o r po ra t e   t ra i ni n g   o pe r a t i o i o r de r   t o   c a rr y   o ut   i n v o l un t a r y   de c i s i o n   o r e pa i r i ng  [ 15].     R e pa i r   M o de l :   T h e   e xi s t i ng  m e t h o ds   r e p a i r   t h e   d a t a b a s e   i s i t a n d   de s t r uc t   t h e   da t a b a s e .   T h e   que ri e s   a n s w e r e by   r e pa i r   m o de l ,   s a m p l e dc o n s i de ri n v a r i o us   po s s i b i l i t i e s   o f   r e c t i f i c a t i o n   w i t h   pa ra l l e l   s o l ut i o n   t o w a r ds   t h e   p r o b a b i l i s t i c   a p p r o a c [16] .   S o m e   po pul a r   e rr o r e pa i r i ng  m e t h o ds   a r e   di s c us s e i n   [17 - 22 ].           F i gu r e   4 S t a n d a r d   da t a   r e pa i r i n g   m e t h o d       D ue   t o   t h e   i n c r e a s i n o f   a n a l y t i c a l   c o m pl e xi t i e s ,   i t   i s   e s s e n t i a l   t o   kn o w   t h e   s t a t i s t i c a l   i m p l i c a t i o n   o da t a   p r e - p r o c e s s i n g.   T h e r e   a r e   m ul t i p l e   t e c hn i q ue s   t h a t   e x i s t s   w h i c h   e nha n c e   t h e   a c c u r a c y   o r   e ff i c i e n c y   o da t a   p r e - p r o c e s s i n t hr o ug h   s t a t i s t i c a l   a pp r o a c h ,   e . g.   M a c hi n e   l e a rn i ng  m e t h o d.   S o m e   po pul a r   da t a   pr e - p r o c e s s i n a l go r i t h m s   a r e   di s c us s e a s   f o l l ow s .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   3 J u ni   20 20  :     27 42   -   2 754   2746   A c t i v e - L e a rn i ng  f o r   c r ow ds o ur c i n i s   s l o w l y   i n c r e a s i n i po pul a r i t y .   Cr o w ds o ur c i n i s   r a pi d l y   a do pt i n i n   b us i n e s s   f i e l ds   fo r   da t a   p r e - p r o c e s s i n [23 ] .   I n   t h e   e duc a t i o n a l   s e c t o r ,   t h e r e   i s   a i n c r e a s i n g   n e c e s s i t y   t o   a ddr e s s   s uc h   c o m pl e xi t y   pr o b l e m a n m u l t i p l e   r e c e n t   r e s e a r c h   s t u di e s   e m pl o y   a n   A c t i v e - L e a rn i ng  a pp r o a c h   t o   s o l ve   t h e   c r o w que r i e s   [24 - 26].   T h e   s upe r v i s e l e a rn i n m e t h o ds   (i . e . ,   S uppo rt   V e c t o r   M a c hi n e   a n R a n do m   f o r e s t a r e   a   m o s t   i m po r t a n t   m e t h o t o   f o r m u l a t e   t h e   us e r   i nput   t o   da t a   p r e - p r o c e s s i n g,   a n A c t i v e - L e a r ni n g   i s   a a l go ri t hm i c   a pp r o a c h   w hi c e l e c t s   t h e   m o s t   i n f o r m a t i v e   da t a s e t s   t o   a c qu i r e .     T h e   s e ve r a l   s t a t i s t i c a l   da t a   p r e - p r o c e s s i n g   a pp r o a c h   ha s   b e e n   p r e s e n t e i n   e xi s t i n a r c hi v e s   of  r e s e a r c h   pub l i c a t i o n   t o   m o r e   p r e c i s e l y   a n a c c u r a t e l y   c l e a n   t h e   d a t a   r e po s i t o r y   e . g.   T h e   f a m o us   p r o j e c t   " E r a c e r "   w a s   us e fo r   de pi c t i n g   t h e   c o r e   p r o c e s s   of   da t a   p re - pr o c e s s i n o v e r   t h e   n o i s y   da t a   c a n   o f f e r   du a l   s t a ge s   of   l e a rn i n o pe r a t i o n .   T h e   f a m o us   gra p h - b a s e m e t h o ds   a r e   us e fo r   r e p r e s e n t i n t h e   m e s s a ge   pa s s i n a n r e l a t i o n   a l go r i t hm   w h i c h   s o l v e   t h e   i n c o n s i s t e n c i e s   [27].   A ddi t i o n a l l y ,   t h e r e   a r e   s e ve r a l   r e c e n t   a pp r o a c h e s   t o   r e pr e s e nt   t h e   s t a t i s t i c a l   o ut l i e r   de t e c t i o n   m e t h o ds   l i ke   [28,   29].   I n   [30],   a ut h o r s   e m pl oy   a   m a c h i n e   l e a rn i ng  a pp r o a c t o   i m p r o v e   t h e   p r e - p r o c e s s i n d a t a   r e l i a b i l i t y .     T h e   e xt e n de w o r o f   pe r f o r m i n g   s o ph i s t i c a t e d   da t a   p r e p ro c e s s i n a s s o c i a t e w i t c l e a n   t h e   d a t a   a n p r e c e de s   m a c h i n e   l e a rni n t r a i ni n m o de l   i s   c a l l e A c t i v e   c l e a n   [31] .   T hi s   a p p r o a c e m pl o y s   a   s e l e c t i o n   m e t h o f o r   m o s t   s i g ni f i c a nt   d a t a   a n m e t h o ds   t o   r a pi d l y   upda t e   t h e   m a c hi n e   l e a rni n g   m o de l   gi v e n e w   c l e a n   da t a .   A c c o r di n t o   t h e   s t u dy   of   [13],   s pe c i f i c   n um b e r s   of   c o n s i de r e da t a s e t   a r e   s ub j e c t e t o   c l e a n i n p r o c e s s   w h i l e   s u r pl us   da t a   a r e   f ur t h e r   s ub j e c t e t o   t r a i ni n g .   G P S   t ra j e c t o r i e s   o r   s e n s o r   da t a   r e a di ng  s e que n c e s   a r e   c o m pos e of   i m pr e c i s e   o r   e rr o r - p r o n e   v a l ue s .   E v e n   b us i n e s s   da t a b a s e   c o ul be   e r r o r - p r o n e   [32] .   T h e   e xi s t i n a pp r o a c h   o f   s e que n t i a l   da t a   p r e - p r o c e s s i n c o n s i de r e t h e   c o n s t ra i nt   a s s o c i a t e w i t h   s pe e t ha t   i s   l i n ke w i t h   c o n s um pt i o n   o f   f ue l   [33].   D e t e r m i na t i o n   o f   t h e   e rr o r s   a s s o c i a t e w i t h   huge   s pi ke s   c a n   b e   c a rr i e o ut   b y   c o n s t ra i nt ,   w h i l e   c o n s t ra i nt s   b a s e pr e - pr o c e s s i n r e pa i r s   t he   di r t y   v a l ue s   w i t h   r e s pe c t   t m i n i / m a s pe e ds .   H ow e ve r ,   t h e   c o n s t r a i n t   a s s o c i a t e w i t h   t h e   s pe e i s   n o t   s uc c e s s f ul   fo r   de t e r m i n i ng  c e rt a i n   e rr o r s   w h i c h   i s   a t   pa r   w i t h   t h e   pra c t i c a l   c o n s t ra i nt s   o s pe e d.   F o r   be t t e r   i n v e s t i ga t i o n ,   i t   i s   e s s e n t i a l   t o   c o n s i de r   s m a l l e r   v e r s i o of   e r r o r s .   O n e   s m a l l   e xa m pl e   t o   t a l a b o ut   i s   w h e n   t h e r e   i s   a   de v i a t i o n   o f   1m   ov e r   t h e   r e a di n gs   o f   G P S .   A pa r t   f r o m   t hi s ,   a gg r e ga t i n a   m a s s i v e   n um b e r   o f   e r r o r s ,   m i ni n r e s ul t s   c a n   b e   s e r i o us l y   m i s l e fo r   e xa m pl e ;   n o t   a b l e   t o   c r e a t e   c l us t e r s   i n   i na c c ur a t e   G P S   r e a d i n gs   w i t m ul t i pl e   s m a l l   e rr o r s   [34] .   F urt h e rm o r e ,   n o i s e   i s   us ua l l y   a s s oc i a t e w i t h   G P S   r a w   da t a   [35],   a nd  i t   i n c r e a s e s   a n   u n c e rt a i n t y   s i g n a l   o n   r e s ul t s   t h a t   a r e   u n de s i ra b l e   t o   t h e   a u t h o r s   a n i n dus t r i a l   e n gi n e e r s   i n   ge n e r a l .   H ow e ve r ,   t h e   e v a l ua t i o n   p r o c e s s   d e f i n e s   h o w   a   da t a s e t   i s   r e l i a b l e   w h i c h   i n c l u de   G P S   e r r o r   de t e c t i o n s   a n m i s s i n d a t a .   A l s o ,   t h i s   e v a l ua t i o n   i n c l ude s   s a m pl e   s i z e ,   r a t e ,   s pa t i a l   c ov e r a ge   a nd  e x i s t e n c e   of   a ddi t i o na l   da t a   t y pe   (i . e . ,   w e a t h e r ).   I n   t h e   r e s e a r c h   s t udy   of  V i t o r   e t   a l .   [36 i n v e s t i g a t e t h e   l i m i t a t i o n s   o f   pr i o r   w o r o n   t h e   t o pi c   of   da t a   qu a l i t y   i n di c a t o r s   ( i . e . ,   f l o a t i n c a r   da t a ) .   A ut h o r s   l e ve r a ge o n   t h e   n u m b e r   o f   s t a t i s t i c a l   i ndi c a t o r s   c ove r s   a   num b e r   o f   s t a t i s t i c a l   i ndi c a t o r s   i n c l udi ng;   r e l i a b i l i t y ,   a c c u r a c y   a n c i t y   s pa t i a l   c o ve r a ge   a nd  e v a l ua t e   t h e   s pe c i f i c   da t a   qua l i t y .   T h e   s t a t i s t i c a l   i n d i c a t o r s   r e l y   o n   a   s e que n c e   of   s t a t i s t i c s ,   c l us t e ri n a n e xt e rna l   d a t a   e l e m e n t s   l i ke   r o a m a ps .     Y uki - S a n   M e t h o d:   S uc h   a pp r o a c h   i s   us e fo r   s e t t l i ng  v a r i o us   fo r m s   of   s t a t i s t i c a l   i n d i c a t o r s   w h i c h   a r e   b a s i c a l l y   of   t w o   t y p e ’s   v i z .   i v a l ue :   i t   r e p r e s e nt s   t h e   qua l i t y   of   t h e   da t a ,   i i v e r a c i t y :   i t   i s   m a i nl y   a s s o c i a t e w i t h   d a t a   r e l i a b i l i t y   f r o m   t h e   s o ur c e   po i n t .   S uc h   G P S   b a s e v a l ue s   a r e   r e p r e s e n t e i t h e   f o r m   of   gr a nul a r i t y   a n c o ve r a ge   f a c t o r .   M i c r o - T e m po r a l   c o v e r a g e   (a n a l y z e   t h e   d a y   t i m e   t e m po ra l   c o v e r a ge a n S pa t i a l   c ov e r a ge   (pr o v i de   r e a l - t i m e   s pa t i a l   i n f o rm a t i o n ) .   W hi l e ,   v e r a c i t y   i s   e n um e ra t e a s ;   M i s s i n g   da t a   (c o m put e   a n y   s i gna l   ga ps   f r o m   t h e   da t a s e t ) ,   r e l i a b i l i t y   ( m e a s u r e s   t h e   l o gi c a l   p r e c i s i o n a nd  a c c ur a c (s pa t i a l   p r e c i s i o o f   G P S   de v i c e s ).     In d i c a t o r   o S pa t i a l   Co ve r a ge :   T hi s   t e r m   i s   a s s o c i a t e w i t h   t h e   m e a s u r e m e n t   o f   t h e   di s t a n c e   b a s e d   di v e r s i t y   of   da t a   of   v e h i c l e .   S uc h   v a l ue s   us ua l l y   i n c r e a s e   w i t h   t h e   m o r e   de n s i t y   of  t r a c e s   of   G P S .   T h e   e nt i r e   p r o c e s s   of   s pa t i a l   c o ve r a ge   i s   i l l us t ra t e i a l go ri t hm i c   s t r uc t u r e   [36] ,   w h e r e   a   s e t   o f   t r a c e s   a s s o c i a t e w i t h   G P S   o ve r   a   de f i n e G r i d - Ce l l   (S gc i s   w e i ght e b a s e o n   i t s   r e l e v a n c e   a n f o r m u l a   o s pa t i a l   c o ve r a ge   i n di c a t o c a n   b e   r e p r e s e n t e a s ;     S pa t i a l   c o ve r a ge             Mi s s i ng  D a t a:   M i s s i ng  da t a   r e f e r   a s ;   t h e   t i m e   s i g na l   ga p   b e t w e e n   t h e   t w o   t r a n s m i t t e s i g na l s   o v e r   a   s i n gl e   c y c l e .   It   m a y   be   o c c urr e by   m i s us e   of   de v i c e   o r   m a l f un c t i o n i n g .   T h e   m i s s i ng  da t a   r e p r e s e nt   a   s e t   o f   G P S   t ra n c e s   w h i c a r e   m i s s i n g ,   a n d   i t   i s   f o r m ul a t e d   a s ;   Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       A   c om pr e h e ns i v e   i ns i ght   t ow ar ds   pr e - pr oc e s s i ng   m e t hod ol og i e s   a ppl i e d   on   G P da t a   ( R .   P r abha )   2747   M i s s i n D a t a   W h e r e   R F i s   a   c o m pl e m e n t a r y   G a us s i a e rr o r   f un c t i o n,   P   i s   a   n u m b e r   o f   pa c ke t s   l o s t ,   a nd  G   i s   g r a nul a r i t y .     R e l i a b i l i t y :   T h e   r e l i a b i l i t y   c ov e r s   t h e   d a t a s e t   o b j e c t i v i t y ,   a nd   i t   i s   c o m put e a s ;   R e l i a b i l i t y   W h e r e :   ( a t   a w a ke   t ra c e   r a t i o ,   ( a T   a w a ke   t r i ra t i o ,   (rt   r e a c h a b l e   t r a c e   r a t i o ,   a nd  ( rT )     r e a c ha b l e   t r i ra t i o .     A c c ur ac y :   A c c ura c y   m e a s ur e by   i n c o n s i s t e n c y   a m o n g   t h e   po s i t i o n s   o f   G P S   de v i c e   a n v e hi c l e   t r ue   l o c a t i o n .   A u t h o r s   f o r m a l i z e t h e   a c c ura c y   i n di c a t o r   by   a l go r i t hm i c   f o r m ,   a n i t s   r e s ul t a nt   e qua t i o n   i s   de f i n e a s   f o l l ow ;   A c c ur a c y   A c c   (m e di a n   (e T ) W h e r e   T   r e p r e s e n t s   E rr o of   e a c h   t ri p .   Y uki   S a n   m e t h o h a s   e xpe r i m e nt e o n   da t a   a g g r e ga t e f r o m   f o ur   w h e e l e r s   i n S a n   F r a n c i s c o   a n N a n j i n g .   F r o m   t h e   ob t a i n e r e s ul t s   a ut h o r s   a na l y z e t ha t   p r o po s e Y uki   S a n   m e t h o i s   v e r y   po t e n t i a l   t o   un c o v e r   t h e   v a l ue   i f l o a t i n c a r   d a t a   s o ur c e s   i a a ut o m a t e m a nn e r.     Y ou - Se ns e   T ool :   It   i s   a   m o ni t o ri n t o o l   w h i c h   c o l l e c t s   t he   G P S   r a w   da t a   v i a   a   m o b i l e   a pp l i c a t i o n.   It   t ra c ks   t h e   po s i t i o w i t G P S ,   W i - F i ,   a n a c c e l e r o m e t e r s .   T h e   a dv a nt a ge   o f   Y o uS e n s e   i s   da t a   pr e - p r o c e s s i n a n d a t a   a na l y s i s .   In   [37 a u t h o r s   i n v e s t i ga t e   m ul t i pl e   f i l t e r   c r i t e ri a   f o r   Y o uS e n s e   G P S   da t a - p r e - p r o c e s s i n by   s t a t i s t i c a l   a na l y s i s   of   di ff e r e n t   pe r s o n’s   da t a s e t .   Y o u S e n s e   c o l l e c t e t h e   G P S   da t a   r e c o r ds   a n d i s pl a y e a c c o r di n t o   t h e   t i m e   s t a m o f   G P S   c hi p,   a n c o rr e s po n di ng  pa ra m e t e r s   a r e ;   T i m e   m i l l i s ,   L o n gi t ude ,   L a t i t ude ,   A c c ur a c y ,   A l t i t ude ,   S pe e a n d   B e a r i ng.   H ow e v e r ,   c o l l e c t e G P S   da t a   r e c o r ds   p r o v i de   h i g a c c u r a c y   pos i t i o n   d a t a ,   b ut   t hi s   d a t a   c o n t a i n s   g a ps   ( i . e . ,   m i s s i ng  d a t a   e rr o r s ).   T h i s   da t a   ga ps   m a y   be   pl a nn e ga ps   (i . e . ,   t h e   ph o n e   i s   n o t   i n   o pe r a t i o na l   m o de ,   G P S   d e v i c e   i s   s w i t c h e off   m o de o r   u n p l a nn e d   ga ps   (i . e . ,   p h o n e   b a t t e r y   i s   de a d,   G P S   de v i c e   una b l e   t o   r e c e i v e   s i gna l s ).   H e n c e ,   t o   r e s o l v e   t h i s   ki n o da t a   ga ps   t h e   da t a s e t   n e e t o   c l e a n   by   i f i l t e r i ng  t h e   w r o n l o c a t i o n   i n f o r m a t i o n ,   a n i i )   f i l l - up  t h e   g a ps   du r i ng  G P S   de v i c e   i s   s w i t c h e o ff   m ode .     T o   un de r s t a nd  t h e   ra w   G P S   da t a   (F i gu r e   5),   a u t h o r s   de v e l o p e a   " Q ua nt u m   G e o gr a p h i c   I n f o r m a t i o n   S y s t e m , "   i . e . ,   Q G IS   t o o l   t h a t   v i s ua l i z e s   t h e   G P S   da t a   (i . e . ,   G P S   v i e w i n g ,   e di t i ng  a s   w e l l   a s   a n a l y s i s ).   A l s o ,   t h i s   s up po r t s   w e b   m a s e r v i c e s .   T o   r e pa i r   G P S   s e que n t i a l   t ra j e c t o r y   da t a   w i t t h e   c o n s i de r i ng   t h e   v a ri a b l e   a s   x   =   [1] ,   x   [2] .   I t hi s   c a s e ,   x[ i i s   c o n s i de r e a s   i t h   po i n t   o f   da t a   o v e r   a   do m a i o f   f i n i t e   s t ruc t u r e .   T h e r e   i s   a   s pe c i f i c   t i m e s t a m t i   l i nke w i t h   xi   a s   w e l l   a s   a rt i f a c t s   w i t h   c e r t a i n   p r e de f i n e r a nge   θ i .   T h e r e   a r e   v a ri o us   po s s i b i l i t i e s   t h a t   t h e   ra n ge   o f   θ di ff e r s   f r o m   e a c h   di f f e r e n t   f o r m s   o f   da t a   w h i c h   a c t ua l l y   a f fe c t s   t h e   a c c ura c y   s c o r e   o f   t h e   G P S   r e a d i n gs .   T h e r e   a r e   a l s o   go o p o s s i b i l i t i e s   o f   di r e c t i n a   m a x i m u m   v a l ue   o f   θ fo r   de pi c t i n g   h i g h e s t   po s s i b l e   a rt i f a c t s   f o r   a l l   f o r m s   o f   s e qu e n c e da t a s e t .           F i gu r e   5 .   V i s u a l i z a t i o o f   r a w   G P S   da t a   w i t h   m u l t i pl e   g a ps   i t h e   G P S   t ra c e       T h e   a b ove   (1)  di s pl a y s   pa s t - pr o b a b i l i t y   (P (x))  o r   a l s o   kn ow n   a s   a   l i ke l i h o o of   s e que n c e s   x   w i t r e s pe c t   t o   s pe e c h a n ge s .   Q   (u i e xh i b i t s   t h e   f ut u r e   p r o b a b i l i t y   of   s p e e c h a nge s   ui ,   a nd  P (u i r e p r e s e n t s     t h e   c o rr e s po n di n g   (l o g)pa s t - p r o b a b i l i t y   w h e r e   e m p i r i c a l   d i s t ri b ut i o o f   pr o b a b i l i t y   Q   c a rr i e o v e r   t h e   s pe e f a c t o r   t h a t   a l t e r s   a n d   c a n   b e   de t e rm i n e us i n g   s i m p l i f i e s t a t i s t i c a l   f e a t u r e   o ve r   t h e   s a m e   s e que n c e .   A ut h o r s   h a v e   fo r m u l a t e a n   i s s ue   a s s o c i a t e w i t h   t h e   re c t i f i c a t i o n   o f   t h e   s e que n t i a l   da t a   o v e r   a   v a s t   pr o b a b i l i t y   of   c o m pu t a t i o n a l   c o m pl e p r o b l e m   [38]   f o r   t h e   pu r po s e   of   e v a l ua t i n p r a c t i c a l   G P S   da t a   a gg r e ga t e ov e r   us i n s m a r t p h o n e   w h i l e   t h e   s ub j e c t   i s   m ob i l e   ov e r   t h e   o b s e r v a t i o n   a r e a .   T h e   p r e s e n t e s t udy   ha s   c o n s i de r e c o m pr e h e n s i v e   t e s t   e n v i r o n m e n t   w i t h   i n c l us i o n   o f   e r r o r s .   H ow e v e r ,   t h e   o n l y   pa ra m e t e r   t o   be   i de nt i f i e i δ   c o nn e c t e w i t h   c o s t   a s s o c i a t e w i t r e c t i f i c a t i o n   o f   da t a   a s   s h o w n   i T a b l e   1 .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   3 J u ni   20 20  :     27 42   -   2 754   2748     ( 1)       T a b l e   1 .   S t ra t e gy   a do pt e i [38]   M e t h o d o l o g y   A d o p t e d   A n a l y s i s   D P C,   c o n s t a n t   - f a c t o a p p r o x i m a t i o n   L a rg e   b u d g e t   D P ,   d y n a m i c   p r o g ra m m i n g   E x a c t   D P L ,   l i n e a t i m e   h e u ri s t i c s   F a s t ,   H i g h   e rr o r   Q P   q u a d ra t i c   P r o g ra m m i n g   A p p r o x i m a t e   d i s t r i b u t i o n   S G ,   S i m p l e   g r e e d y   F a s t e s t   S CRE E N   E x i s t i n g   a p p ro a c h       G P S   t r a j e c t o r y   da t a   a n a l y s i s   i s   t h e   t r e n di ng  r e s e a r c h   t o pi c   m a i n l y   us e fo r   t r a n s po rt a t i o n   m o de   de t e c t i o n   v i a   G P S   da t a   a na l y s i s .   T h e r e   a r e   di v e r s i f i e p r o pe rt i e s   a s s o c i a t e w i t t h e   de t e r m i na t i o n   o f   m o de   of   t r a n s po rt a t i o n   (e . g.   s pe e d,   l a t i t ude ,   l o c a t i o n,   l o ngi t ude ,   a c c e l e r a t i o n,   e t c ).   U n f o r t u n a t e l y ,   t h e r e   i s   n o   i n c l us i o n   o f   a n y   m o d e   of   t r a n s po r t a t i o n   c ha r e c t e r i s t i c s   ov e r   t h e   a g g r e ga t e G P S   da t a .   T h e   s t udy   c a rr i e o ut   by   [33]  h a s   p r e s e n t e a   di s c us s i o n   o f   e n t r o p y   f a c t o r   P E   c o n s i de ri n t h e   m o b i l i t y   f a c t o r .   A   c l a s s i f i e r   de s i g n   i s   de ve l o pe fo r   us i ng  l e a rni n m a c hi n e   i s   us e fo r   m i ni m i z i ng  t h e   t r a i n i ng  t i m e   w i t h o ut   c o m pr o m i s i n g   a c c ur a c y .     P e r m u t a t i o n   E n t r o py :   T h i s   m e c h a ni s m   i s   us e f o r   i de n t i fy i n a l l   t h e   dy n a m i c   a l t e r a t i o n s   o   t h e   c o m put a t i o n a l l y   c o m pl e a s pe c t s .   T h e   v a ri a b l e   P E   i s   a s s o c i a t e w i t h   t h e   o r i gi na l   s e r i e s   o t i m e   b a s i c a l l y   r e pr e s e nt s   a   S ha nn o n   e n t r o py   fo r   a l l   K   s y m bo l s .   It s   m a t h e m a t i c a l   r e p r e s e n t a t i o n s   i s   (2) ,       (2)       W h e r e   r e p r e s e nt s   t h e   e m b e ddi n d i m e n s i o n ,   P r e p r e s e n t s   di s t r i b ut i o n   o f   pr o b a b i l i t y   f a c t o r   a s s o c i a t e w i t a l l   t h e   s e r i e s   o f   di v e r s e   s y m bo l .     E x t r e m e   L e ar n i ng  Mac hi n e   ( E L M) :   It   i s   fo r m   of   m a c h i n e   l e a rn i ng  a pp r o a c h   t ha t   t a r ge t s   us i n s i n g l e   hi dde n   l a y e r   w h i l e   a   c o n v e n t i o n a l   t ra i ni n m e c ha ni s m   of   f e e d - fo r w a r a pp r o a c h .   T h e   s p e e of   t h e   t r a i n i ng  us i ng  t hi s   a pp r o a c i s   q ui t e   f a s t e r   a s   c o m pa r e t o   a n y   l e ga c y   m a c h i n e   l e a rn i ng  o f   n e ura l   n e t w o r k.   T h e   e xpe r i m e n t a l   a n a l y s i s   of   s uc h   a n   a pp r o a c h   i s   a s   f o l l ow s :   T h e   A ut h o r s   c o n s i de r e ' ' M i c r o s of t   G e o L i f e   da t a s e t "   w h i c h   i n c l ude s   17621  m o v i n g   t ra j e c t o r i e s   of  182  us e r s   i n   y e a r s .   T h e s e   t r a j e c t o r i e s   w e r e   r e c o r de by   di ff e r e n t   G P S   l o gge r s   a n G P S   ph o n e s .   A ut h o r s   e xt ra c t e t h e   fe a t u r e s   f r o m   e a c h   t r a j e c t o r y   a n c a t e go ri z e i nt o   b a s i c   fe a t ur e s   (A v e r a ge   ve l o c i t y ,   v e l o c i t y   v a r i a n c e a n d   s o ph i s t i c a t e p r o pe r t i e s   e . g.   s o phi s t i c a t e f e a t ur e s   a nd  P E   of   ve l oc i t y ).   T h e   o ut c o m e s   of   t r a i n i n g   a n d   t e s t i n f r o m   t h e   f e a t u r e s   a r e   s h o w n   i T a b l e   2 .           T a b l e   2 .   O u t c o m e s   of   t ra i ni n g   a n d   t e s t i n g   S a m p l e   s i z e s     T ra i n i n g   T e s t i n g   F e a t u r e s   10%   90%   AV   20%   80%   DV   30%   70%   H CR   40%   60%   SR   50%   50%   V C R       4.   EX I S TI N G   R ES EA R C H   TR EN D S   A pa r t   f r o m   t h e   s t a nda rd  m e t h o do l o g y   of   G P S   da t a   p r e pr o c e s s i n g,   t h e r e   i s   v a r i o us   r e s e a r c h   c o n t ri b ut i o n   t o w a r ds   a d d r e s s i ng  dat c l e a ni ng   p r o b l e m s .   T he   e xi s t i n s t ud i e s   a r e   b r o a dl y   r e po r t e t o   a do pt   4   di f fe r e nt   a p p r o a c h e s ,   e . g .   i s t a t i s t i c a l - b a s e a pp r o a c h,   i i l o gi c a l   a pp r o a c h ,   i i i o ut l i e r - de t e c t i o n   a pp r o a c h,   a n i v t r a j e c t o r y - b a s e a ppr o a c h .   T h e   s t a t i s t i c a l - b a s e a ppr o a c h   i s   de v e l o p e e m pha s i z i n g   t i m e - s e ri e s ,   pr e di c t i o n,   t ri de t e c t i o n,   qu a n t i t a t i v e   pa t t e rn s ,   m a c h i n e   l e a rn i ng  [39 - 4 8].   T h e   e xi s t i ng  l o gi c a l - b a s e a pp r o a c h e s   a r e   r e po rt e t o   c o n s i de r   v e l o c i t y   c o n s t ra i nt s ,   r e d uc t i o n   o f   t r a v e l   di s t a n c e ,   a nd  h u m a n a v i ga t i o n a l   s y s t e m   [49 - 51].   N e a rl y ,   s i m i l a r   p r o b l e m s   a r e   a l s o   c o n s i de r e w h e n   w o r ki n w i t o ut l i e r - de t e c t i o b a s e d   a pp r o a c w h e r e   t h e   c o n s i de ra t i o n   o f   dri v i n g   b e h a v i o r,   s t a t i s t i c a l   p r o c e s s   c o n t r o l s ,   p a r t i t i o n i ng  i s   c a rr i e d   Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       A   c om pr e h e ns i v e   i ns i ght   t ow ar ds   pr e - pr oc e s s i ng   m e t hod ol og i e s   a ppl i e d   on   G P da t a   ( R .   P r abha )   2749   o ut   [52 - 55].   T ra j e c t o r y - b a s e a ppr o a c h e s   a r e   fo un t o   us e   s e c ur i t y   f a c t o r ,   c o n ge s t i o n   a na l y s i s ,   c l us t e r i n g ,   m i ni n g ,   upd a t i ng  m a p ,   s i m i l a r i t y   a s s e s s m e n t   [5 6 - 63] .   T a b l e   s um m a ri z e s   t h e   r e s e a r c h   c o n t ri b ut i o n   o pr e s e nt   t i m e s   w i t h   r e s pe c t   t o   di f fe r e nt   pa ra m e t e r s   t o   e xhi b i t   t ha t   a l l   t h e   p r o b l e m s   a r e   a s s o c i a t e w i t a dv a n t a ge   a s   w e l l   a s   s i g n i f i c a n t   l i m i t a t i o t o o .       T a b l e   3 .   S u m m a r y   of   a   di f f e r e n t   m e t h o f o r   p r e - p r o c e s s i n g   G P S   da t a       A u t h o r s   M e t h o d o l o g y   Ca p a b i l i t y   A d v a n t a g e   l i m i t a t i o n   S t a t i s t i c a l - b a s e d   A p p r o a c h   S o n g   [3 9 ]   M o d e l i n g   w i t h   s p e e d   c o n s t ra i n t   f a c t o r   D e t e r m i n e   t h e   p o s s i b i l i t y   o f   s e q u e n c e   H i g h e a c c u ra c y   - L a r g e   s p i k e   e rr o r   - F a i l   t o   i d e n t i fy   s m a l l   e r ro r s   J i a n g   e t   a l . [4 0 ]   M a c h i n e   L e a r n i n g   P re d i c t i o n   o f   f a v o ra b l e   d e s t i n a t i o n   A c h i e v e d   s a t i s f a c t o r y   p r e d i c a t i o n   a n a l y s i s ,   b e t t e p e r f o r m a n c e   - N o t   a p p l i c a b l e   fo o t h e t ra n s p o rt a t i o n   s e r v i c e s   l i k e   t a x i s ,   p r i v a t e   c a r s .   W a n g   e t   a l .   [4 1 ]   T ri p   d e t e c t i o n   b a s e d   o n   m o b i l e   d a t a   Id e n t i fy   a n d   e l i m i n a t e   f a l s e   t ri p   d a t a   A c c u ra c y   b e t w e e n   9 5 - 97%   N a rro w e d   s t u d y   s c o p e   Z h a n g   e t   a l .   [4 2 ]   T h e   q u a d ra t i c   t i m e   c o n s t a n t   f a c t o a p p r o x i m a t i o n ,   L i n e a h e u ri s t i c s ,   g r e e d y   h e u ri s t i c   1 .   Re p a i ri n g   a   s e ri e s   o d a t a   w i t h   m a x i m u m   l i k e l i h o o d .   Be t t e r   p e r f o r m a n c e   w . r . t   re p a i ri n g   a n d   a p p l i c a t i o n   a c c u ra c y   In d u c e   c o m p u t a t i o n a l   c o m p l e x i t y   E q u i l l e   e t   a l .   [4 3 ]   Id e n t i f i c a t i o n   o f   s p e c i fi c   p a t t e rn s   o c o m p l e x   d a t a   D e t e c t   a n d   c l e a n   Be t t e r   d e t e c t i o n   p e r f o r m a n c e .   P e r fo r m a n c e   l i m i t e d   t o   s y n t h e t i c   d a t a   H i g h   d a t a   p re - p ro c e s s i n g   a c c u ra c y   i n   r e a l - w o rl d   d a t a s e t s   Ce r q u e i ra   e t   a l .   [4 5 ]   Y u k i   S a n   q u a l i t y   i n d i c a t o r   A u t o m a t i c a l l y   e v a l u a t e   t h e   q u a l i t y   A u t o m a t i c a l l y   u n c o v e r   t h e   v a l u e   i n   s o u r c e s   N o t   a p p l i c a b l e   fo r e a l - w o rl d   a p p l i c a t i o n s   P e n g   e t   a l .   [4 6 ]   M a c h i n e   l e a r n i n g   Ca n   p e r f o r m   ro a d   s a fe t y   a n a l y s i s .   S t u d y   a p p l i c a b l e   t o   V A N E T   s y s t e m   L a c k   b e n c h m a rk i n g   A p p l i c a b l e   t o   d i ffe r e n t   t y p e s   o d a t a   S u n   e t   a l .   [4 7 ]   U s e s   e x i s t i n g   t o o l s   fo d a t a   f i l t e ri n g   (Y o u S e n s e )   E ffe c t i v e   a n d   s i m p l i fi e d   f i l t e ri n g   A p p l i c a b l e   i n   re a l - t i m e   H i g h   e n e r g y   c o n s u m p t i o n .   N e e d   m o r e   m e m o r y   s p a c e   G ra n a t   [4 8 ]   H i d d e n   M a rk o v   m o d e l ,   E n h a n c e d   E x p e c t a t i o n   M a x i m i z a t i o n   S u p p o r t s   f a s t e a s s e s s m e n t   Ro b u s t ,   r e l i a b l e   L a c k   o f   e x t e n s i v e   a s s e s s m e n t   L o g i c a l   M e t h o d s   S o n g   e t   a l .   [4 9 ]   P o l y n o m i a l   t i m e ,   t h e   l i n e a m o d e l   c o n s t ru c t e d   u s i n g   t i m e   f a c t o r   c a n   p r e - p r o c e s s i n g   s t r e a m   d a t a ,   Be t t e r   a c c u ra c y   o v e r   t h e   re a l   d a t a s e t   L a c k   o f   e x t e n s i v e   a s s e s s m e n t   L u o   e t   a l .   [5 0 ]   Re c o m m e n d a t i o n   fo r   o p t i m a l   r o u t e   d a t a   S u p p o r t s   d y n a m i c   r e a l - t i m e   t ra v e l   p l a n n i n g   E ffe c t i v e   ro u t e   re c o m m e n d a t i o n   Re s t r i c t e d   c o m p u t e p o w e r   W e e ra k o o n   e t   a l .   [5 1 ]   F u z z y   l o g i c   M u l t i - m o d e   n a v i g a t i o n   s y s t e m   A p p l i c a b l e   f o r   p h y s i c a l l y   i m p a i r e d   p e d e s t r i a n s   L a c k   o f   e x t e n s i v e   a s s e s s m e n t   O u t l i e r   D e t e c t i o n   M e t h o d   H i e u   e t   a l .   [5 3 ]   S t a t i s t i c a l ,   S h e w h a rt   c o n t r o l   c h a rt s   P re d i c t i v e   p e r fo r m a n c e   O ffe g ra n u l a ri t y   i n   o u t l i e r   d e t e c t i o n   N o   c o m p a ra t i v e   a n a l y s i s   L e e   e t   a l .   [5 5 ]   D a t a   p a rt i t i o n i n g   a p p r o a c h   A b i l i t y   t o   i d e n t i fy   o u t l i e r s   r e s i d i n g   i n   s u b - t ra j e c t o r y   d a t a   Be t t e r   a c c u ra c y   L a c k s   a n y   n u m e ri c a l   a n a l y s i s   i n   a n   e x t e n s i v e   m a n n e r   T ra j e c t o r y   F i l t e ri n g   M e t h o d   P a t i l   e t   a l .   [5 6 ]   Id e n t i f i c a t i o n   a n d   e l i m i n a t i o n   o f   d a t a   a n o m a l y   M a i n t a i n s   i n t e g r i t y ,   s e c re c y   o f   c l e a n e d   d a t a   c o n s i d e r s   r e a l - t i m e   p a ra m e t e r s   f o r   a n o m a l y   d e t e c t i o n .   O ffe r s   s e c u ri t y   a n d   b a l a n c e   c l e a n i n g   p r o c e s s   a t   t h e   s a m e   t i m e   L a c k s   a n y   n u m e ri c a l   a n a l y s i s   i n   a n   e x t e n s i v e   m a n n e r   W a n g   e t   a l .   [5 7 ]   Co n g e s t i o n - b a s e d   a n a l y s i s   o t h e   t ra j e c t o r y   Id e n t i f i e s   b o t t l e n e c k   a n d   e l i m i n a t e s   a rt i f a c t s   f r o m   t ra j e c t o r y   d a t a   S i m p l e v i s u a l   a n a l y s i s   Ca n n o t   s u p p o r t   m u l t i p l e   t a s k   a n a l y s i s     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2088 - 8708   Int   J   E l e c   &   Co m E n g ,   V o l .   10 ,   N o .   3 J u ni   20 20  :     27 42   -   2 754   2750   T a b l e   3 .   S u m m a r y   of   a   di f f e r e n t   m e t h o f o r   p r e - p r o c e s s i n g   G P S   da t a   ( c on t i n ue )       A u t h o r s   M e t h o d o l o g y   Ca p a b i l i t y   A d v a n t a g e   l i m i t a t i o n   T ra j e c t o r y   F i l t e ri n g   M e t h o d   Id ri s s o w   [5 8 ]   Cl u s t e r i n g   a p p r o a c h   - O u t l i e d e t e c t i o n ,   S t o p   d e t e c t i o n ,   I n t e rp o l a t i o n ,   M a p   M a t c h i n g   Im p ro v e   t h e   q u a l i t y   o f   t h e   o b t a i n e d   c l u s t e r s .   N o   b e n c h m a rk i n g   Y i n   e t   a l .   [5 9 ]   Re c o m m e n d a t i o n - b a s e d   fi l t e ri n g   p ro c e s s   O ffe r s   t h e   b e s t   p e r f o r m a n c e   o n   t h e   re c o m m e n d e d   d a t a   A c h i e v e d   h i g h e r   p r e c i s i o n   O v e rh e a d   n o t   s t u d i e d   P e i x o t o   [6 0 ]   D e t e c t i o n   S t a y   p o i n t s   E l i m i n a t e   t h e   n o i s y   d a t a   A   g o o d   a p p ro a c h   fo l o c a t i o n   s u g g e s t i o n   a n d   d e t e c t i o n   o u s e e x p e ri e n c e   N o   b e n c h m a rk i n g   S h a n   e t   a l .   [6 1 ]   A n   e x p e ri m e n t a l   s t u d y ,   g ra p h i c a l - b a s e d   fi l t e ri n g   W o rk s   b e t t e w i t h   a   v a l i d   i n fe r e n c e   o f   m a p   a l o n g   w i t h   t h e   p r o p e u p d a t e .   A p p l i c a b l e   f o r   d i ffe r e n t   c i r c u m s t a n c e s   T h e   s c o p e   o f   m a p   d a t a   n o t   d i s c u s s e d   w i t h   re s p e c t   t o   c o m p u t a t i o n   V e m e n t a l a   e t   a l .   [6 2 ]   G e o - s p a t i a l   s i m i l a ri t y   a s s e s s m e n t   Be t t e r   u p d a t i n g   o t h e   m a p   F a s t e r   p ro c e s s i n g   N o   b e n c h m a rk i n g   T a n g   e t   a l .   [6 3 ]   S i m u l a t i o n - b a s e d ,   d i v e r s i f i e d   n e t w o rk   d a t a   E ffe c t i v e   c l u s t e r i n g   p e r f o r m a n c e   Co n s t ru c t   t h e   a s s o c i a t i o n   w i t h   d a t a   s e m a n t i c s .   H i g h   c o m p u t a t i o n a l   c o s t       5.   O P EN   EN D   P R O B LE M S   F r o m   di s c us s i o n   m a de   i n   t h e   p ri o r   s e c t i o n s ,   i t   c a n   b e   s e e n   t ha t   t h e r e   a r e   v a ri o us   s t a n da r a n u ni que   a pp r o a c h e s   m e a nt   f o r   a dd r e s s i n t h e   da t a   c l e a ni n p r o b l e m s   i G P S   s i g n a l s .   H ow e ve r ,   i t   c a n   a l s o   b e   s e e n   t h a t   t h e   m a j o r i t y   of   t h e   r e s e a r c h e r s   ha v e   n o t   m uc h   c o n s i de re a b o ut   t h e   p r o b l e m s   a s s o c i a t e w i t h   t h e   s i gna l   l aps e   o f   t h e   G P S   d a t a .   T h e   p ri m e   r e a s o b e h i n d   t hi s   i s   t h e   us a ge   o f   t h e   s t a n d a r da t a s e t   w hi c h   m i s s e s   t h e s e   pr o b l e m s .   G e n e ra l l y ,   i n f o r m a t i o n   a b o ut   s uc h   s i gn a l   l a ps e   c a n   b e   ob t a i n e f r o m   t h e   G P S   de v i c e   t h a t   o b t a i s i g n a l i n f r o m   m u l t i pl e   G P S   s a t e l l i t e s .   S uc h   f o r m s   of   d y n a m i c   da t a   c a nn o t   b e   ob t a i n e f r o m   t h e   s t a n d a r d   da t a s e t   a s   t h e y   a r e   a   d i r e c t   r e pr e s e nt a t i o o f   a n y   fo r m   o f   c on s i s t e nt   i nt e rrupt i o n   i n   G P S   da t a   w i t h   r e s pe c t   t o   t i m e .   H e n c e ,   t h e r e   i s   a   s i g ni f i c a nt   s k i o f   pr o b l e m   c o n s i d e r a t i o w h i l e   a t t e m p t i ng  t h e   G P S   da t a   c l e a n i ng  pr o c e s s .   It   s h o ul a l s o   b e   kn ow n   t ha t   c o n s i de r a t i o n   o f   s u c h   p r o b l e m   i s   o f   h i g h e r   i m po rt a n c e   a s   t h e y   a r e   hi g h l y   pr a c t i c a l   a n i n e v i t a b l e   ow i n t o   t h e   p r e s e n c e   of  di ff e r e n t   f o r m s   o i n f ra s t r uc t u r e   o n   t h e   e a rt h   s ur f a c e ,   e . g.   t r e e s ,   t a l l   b ui l d i n gs ,   e t c .   A   c l o s e r   l o o i nt o   a l l   t h e   e xi s t i n a pp r o a c h e s   e xhi b i t s   t ha t   v a r i o us   m e t h o ds   i n di r e c t l y   a t t e m pt s   t o   s o l v e   t h i s   p r o b l e m   w i t h   t h e   a i o t i m e   s e r i e s   a na l y s i s   s ki ppi n t h e   l a ps e   f a c t o r .   R e c e n t   w o r ks   a r e   n o t   fo un t o   h a v e   a n y   s uc h   c o n s i de ra t i o n.   H ow e ve r ,   a   w o r c a rri e o ut   by   W h e e l e r   e t   a l .   [64] ,   a n d   L a c h o w y c z   e t   a l .   [65]  ha v e   a   un i que   a pp r o a c h   w h e r e   t h e   a ut h o r s   h a v e   us e t h e   r a w   G P S   da t a   i n   o r de r   t o   c h e c t h e   l a ps e   f a c t o r .   T h i s   i m p l e m e nt a t i o n   pe rm i t s   v a ri o us   o t h e r   f o r m s   o f   t i m e - s e r i e s   da t a   t o   b e   a ggr e ga t e w h i l e   i n v e s t i ga t i n g   t h e   l a ps e   f a c t o r   by   r e t a i n i ng  c o n t e xt u a l   s p a t i a l   da t a   a s   w e l l   a s   da t a   o b t a i n e f r o m   a c c e l e r o m e t e r s .   H ow e v e r ,   t h i s   a pp r o a c h   i s   o n l y   v a l i f o r   o ut doo r   a pp l i c a t i o n s   a nd  n o t   i n do o r   a pp l i c a t i o r e s ul t i n g   i n   m i s s i ng  d a t a   i f   t h e   i n do o r   a ppl i c a t i o n   i s   c o n s i de r e d.   I n   t h e   s a m e   y e a r   o f   2010,   t h e r e   w a s   a   w o r c a rri e o ut   by   O l i v e r   a n B a d l a n [ 66]  w h e r e   t h e   s t udy   i gn o r e t h e   pa rt i c i p a nt - b a s e i n f o r m a t i o n   w h i c h   f a i l s   t o   m e e t   t h e i r   c ri t i c a l   f a c t o r .   T h e   n e xt   r e s e a r c h   m e t h o do l o g y   a t t e m pt e f o r   m i s s i n d a t a   w a s   by   us i n i m pu t a t i o n   t e c hn i q ue   by   T r o pe e t   a l .   [67].   I rr e s pe c t i v e   of   a   s l i gh t   di f f e r e n c e   i n   a l l   t h e s e   a ppr o a c h e s ,   a   c o m m o n   t r a i t   o f   us a ge   of   s pa t i a l   d a t a   a nd  t e m po ra l   d a t a   i s   f o u n t o   b e   us e d;   h o w e v e r ,   a l l   t h e m   s e r i o us   m i s s e s   a n y   fo r m   o c o m put a t i o n a l   m o de l i n f o r   pe r f o r m i ng  v a l i da t i o n   o r   b e n c hm a r k i n o f   t h e   pr e s e n t e a pp r o a c h e s   o f   de a l i n g   w i t h   m i s s i n d a t a   f r o m   G P S   s i g na l .   E v e n t u a l l y ,   t h e   r e s e a r c h e r s   w o r ki n o n   s t a n da rd  da t a s e t   a l s o   i g n o r e t h e   f a c t   t ha t   t h e r e   i s   a l w a y s   a   c e r t a i a m o unt   o f   e r r o r   e v e n   i s t a nda rd  G P S   da t a   a s   s uc da t a   a r e   n e v e r   c l a i m e t o   c o n s i de r   a n y   fo r m   o f   e n v i r o nm e nt a l   f a c t o r s .   If   s uc h   p ra c t i c a l   p a r a m e t e r s   a r e   n o t   c o n s i de r e i n   t h e   da t a s e t   t h a t h e r e   i s   a l w a y s   a   f a i r   c h a n c e   of   e r r o r   de g r a d i n t h e   a c c ura c y   of   t h e   a n a l y s i s .   T h e r e   a r e   v a r i o us   us e   c a s e s   t o   r e pr e s e n t   t h a t   m i s s i n d a t a   c o ul s i gni f i c a n t l y   de gr a de   t h e   da t a   qu a l i t y   of   G P S   S i g n a l .     Use - Cas e - 1 :   T h e   f i r s t   us e   c a s e   i s   v e r y   c o m m o n   t o   e v e r y o n e   a n d   i s   t e rm e a s   a   dr i f t i n pr ob l e m   t ha t   i s   hi g h l y   i n e v i t a b l e   a nd  r e s ul t s   i n   m i s s i n da t a .   F i g u r e   h i g hl i ght s   t h e   G P S   t r a c e s   of   t h e   de n s e   fo r e s t   a r e a   w h e r e   i t   c a n   b e   s e e n   hi g h e r   a c c ura c y   of   t r a c ki n b e i ng  m a i n t a i n e o n   t h e   r o a a r e a ,   b ut   i t   s t a rt s   s h o w i n g   ra n do m   po s i t i o n   w h e n   i t   e n t e r s   t h e   f o r e s t   a r e a .   H e n c e ,   t h e   p o s i t i o n i n g   da t a   i n   t h e   f o r e s t   a r e a   i s   m i s s i n g ,   a n t h e r e   i s   n o   e xi s t i ng  a pp r o a c t o   a dd r e s s   t hi s   m i s s i ng  d a t a   p r o b l e m .     Use - Cas e - 2 :   T hi s   i s   a n o t h e r   m o s t   e n c o un t e r e p r o b l e m   i n   G P S   s i gna l   r e c e i v i n c h a ra c t e r i z e by   s i gnal   at t e nuat i on   pr obl e m .   F i g u r e   s h o w c a s e s   a   s t ra i g ht   l i n e   i t h e   c i r c l e   w hi c i s   a   f a l s e   r o ut e   i n   t h e   t e rra i Evaluation Warning : The document was created with Spire.PDF for Python.
Int   J   E l e c   &   Co m E n g     IS S N :   2088 - 8708       A   c om pr e h e ns i v e   i ns i ght   t ow ar ds   pr e - pr oc e s s i ng   m e t hod ol og i e s   a ppl i e d   on   G P da t a   ( R .   P r abha )   2751   r e gi o n .   I n   s uc h   c a s e ,   a   l i n e a r   l i n e   i s   dra w n   b e t w e e n   t h e   s o ur c e   a n de s t i na t i o n   po i n t   w hi c h   i s   hi g h l y   i n a c c ura t e   p r o v i ng  t h e   c o m pl e t e   l o s s   of   da t a .   N o n e   o f   t h e   e xi s t i n g   r e s e a r c h   w o r ha s   e m p ha s i z e o t hi s   pr o b l e m   o f   m i s s i n g   da t a   t i l l   d a t e .     Use - Cas e - 3:   T h i s   p r o b l e m   i s   us ua l l y   m o r e   e n c o un t e r e i n   t h e   u r b a n   a r e a   a n v e r y   l e s s   i n   t h e   r u ra l   a r e a ,   a n i t   r e s ul t s   i n   b ounc i ng  i s s ue   o f   G P S   s i gna l .   F i g u r e   h i ghl i g ht s   t hr e e   l o c a t i o n s   w h e r e   t h e   s c a t t e r e d   G P S   s i gn a l   i s   r e c e i v e ow i n t o   t h e   pr e s e n c e   of   t a l l   b ui l di n gs .   T h e   n a v i g a t i o n   s y s t e m   s h ow s   s o m e   s e pa ra t e   t ra c ks   e ve n   o n   a   s t ra i g ht   r o a o r   v i c e - v e r s a   a s   t h e y   a r e   i n c a p a b l e   of   t r a c i ng  t h e   o ri gi na l   s i g n a l s .   U n fo r t u na t e l y ,   s uc h   p r o b l e m s   a l s o   di r e c t l y   c o n t r i b ut e   t o   m i s s i n d a t a   w h e r e   t h e r e   i s   n o   e ffe c t i v e   s o l ut i o n   fo un i t h e   e xi s t i n g   s t udy .     F r o m   a l l   t hi s   e v i de n c e ,   i t   i s   q ui t e   c l e a t ha t   t h e r e   i s   a   c ri t i c a l   n e e f o r   a   r e l i a b l e   G P S   s e r v i c e   w h e r e   t h e   s o l ut i o c a nn o t   b e   t ow a r ds   t h e   e xt e rna l   pa ra m e t e r s   b ut   s ho ul b e   m o r e   f o c us e o n   i nt e rna l   p a r a m e t e r s .           F i gu r e   6 .   U s e   c a s e   of   dr i f t i ng  G P S   s i g na l           F i gu r e   7 .   U s e   c a s e   of   s i gna l   a t t e n u a t i o n   G P S   s i g na l           F i gu r e   8 .   U s e   c a s e   of   bo un c i n o f   G P S   s i g n a l     Evaluation Warning : The document was created with Spire.PDF for Python.