I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   18 ,   N o .   3 J u n e   20 20 ,   pp .   1539 ~ 1550   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 3 . pp 153 9 - 1550             1539       Jou r n al   h o m e pa ge ht t p: / / i j e e c s . i a e s c or e . c om   Pe r f o r m a n c e   e v a l u a t i o n   o n   st r u c t u r a l   m a p p i n g   c h o i c e s   f o r     d a t a - c e n t r i c   X M L   d o c u m e n t s       Su - C h e n H aw ,   Em yl i an a   S o o n g   F a c ul t y   o f   C o m put i ng   a nd   I nf o r m a t i c s ,   M u l t i m e d i a   U n i v e r s i t y ,   M a l a y s i a       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e S e p   24 ,   2 019   R e v i s e N o v   26 ,   2019   A c c e pt e D e c   1 0 ,   2 01 9       e X t e n s i bl e   M a r k - up  L a ng ua g e   ( X M L )   ha s   b e e n   w i d e l y   us e d   a s   t h e   de   f a c t s t a nda r f o r   da t a   e xc ha ng e   o v e r   t he   W e b.   I t   i s   c r uc i a l   t o   e ns ur e   t h a t   t he   da t a   c a be   m a ppe c o r r e c t l y   i nt o   t he   und e r l y i ng   da t a   s t o r a g e   f o r m a t ,   t ha t   i s ,   w i t ho ut   a ny   l o s t   o f   i nf o r m a t i o n.   T he   t w o   m a pp i ng   s t r a t e g i e s   a r e   s t r uc t ur a l - ba s e a nd  m o de l - ba s e d.   T h e   s t r uc t u r a l - ba s e m a ppi ng   i nv o l v e s   t he   pr e s e nc e   o f   D a t a   T y pe   D e f i ni t i o ( D T D )   f o r   s c he m a   m a ppi ng   w hi l e   t he   m o de l - ba s e d   m a ppi ng   do e s   no t   r e qu i r e   t he   p r e s e n t   o f   D T D   o r   a ny   s c he m a   f o r   t he   m a pp i ng   pur p o s e .   T he   s t r uc t u r a l - ba s e m a pp i ng   i s   g oo e s pe c i a l l y   f o r   da t a - c e nt r i c   t y pe   of   da t a ,   i . e . ,   da t a   w h i c i s   s t r uc t u r e a nd  c a be   b i nd e i n t o   c e r t a i s c he m a .   A s   s uc h,   t hi s   pa p e r   e v a l ua t e s   a nd  c o m pa r e s   t he   p e r f o r m a n c e s   o f   t w s e l e c t e e xi s t i ng   s t r uc t ur a l - ba s e m a ppi ng   v i a   s i m ul a t i o n.   T w o   m a i e v a l ua t i o ns   a r e :   ( i )   s t o r i ng   t h e   X M L   da t a   i nt o   r e l a t i o na l   da t a b a s e   ( R D B ) ,     a nd  ( i i )   qu e r y i ng   t he   X M L   da t a   f r o m   t h e   R D B .   T he   t i m e   t a ke n   f o r   e a c r e s pe c t i v e   p r o c e s s   w i l l   be   r e c o r de d   a n c o m pa r e d .   F r o m   t he   e x pe r i m e n t a l   r e s ul t s ,   i t   i s   o bs e r v e t h a t   t he   s - X M L   a ppr o a c o ut pe r f o r m e d   t he   S A X   a ppr o a c i t e r m s   o f   s t o r i ng   a nd  que r y   e v a l ua t i o ns   f o r   m o s t   o f   t he   t e s t   c a s e s   c o nduc t e d.   Ke y w or ds :   D a t a - c e n t ri c   X M L   M a ppi ng  s c h e m e   S t ruc t u r a l   m a ppi ng   T r a n s f o r m a t i o n   X M L   que r y   C opy r i gh t   ©   2020   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   Su - C h e n g   H a w   F a c ul t y   of   Co m put i n g   a n d   I n f o r m a t i c s ,   M ul t i m e di a   U ni v e r s i t y ,   M a l a y s i a   E m a i l :   s uc h e n g @ m m u . e du. m y       1.   I N TR O D U C TI O N     Int e rn e t   i s   pow e r f ul   s i n c e   i t   w o r ks   a s   c o m m uni c a t i o pl a t f o r m   t o   s uppo r t   a n y   d o c um e n t s   t r a n s m i s s i o n   g l o b a l l y   s uc h   a s   e - t ra n s a c t i o n.   H ow e v e r ,   i n t e rn e t   n e e ds   e X t e n s i b l e   M a r ku L a n gu a ge   (X M L )   fo r   da t a   r e pr e s e nt a t i o n   b e c a us e   i t   h a s   t h e   a b i l i t y   of   f l e xi b l e   s t r u c t u r e   o n   c o m m u n i c a t i o n   o ve r   W o r l W i de   W e b   (W W W ).   O n   t h e   o t h e r   h a n d ,   R e l a t i o n a l   D a t a b a s e   (R D B pl a y s   a n   i m po r t a n t   r o l e   i n   s t o r i ng  da t a   f o r   t h e   b a c k - e n da t a b a s e   a t   m o s t   o f   t h e   o r ga n i z a t i o n .   U n f o r t u na t e l y ,   t h e   R D B   h a s   d r a w b a c of   pr o c e s s i n da t a   i n de pe n de n t l y   o n   i t s   c o nt e xt .   I n   t ha t   c a s e ,   m a ppi ng  a nd  que ry i n X M L   t hr o ug h   R D B   i s   c r uc i a l   e s pe c i a l l y   o n   r e s o l v i n g   t h e   c o n f l i c t   b e t w e e n   t h e   hi e ra r c h i c a l   s t ruc t u r e   o f   X M L   a n d   t h e   f l a t   s t r uc t u r e   o f   R D B   [1,   2].     T h e   t w o   m a i n   m a ppi ng  a pp r o a c h e s   a r e   s t r uc t u ra l - b a s e m a pp i n g   (s c h e m a - b a s e m a ppi ng)  a nd  m o de l - b a s e m a ppi n (s c h e m a - l e s s   m a pp i n g)  [3] .   T h e   s t r uc t u ra l - b a s e m a ppi ng  i s   go o d   e s p e c i a l l y   f o r     da t a - c e n t ri c   t y p e   of   da t a ,   i . e . ,   da t a   w h i c h   i s   s t r uc t u r e a n c a n   b e   b i n de i n t o   c e r t a i n   s c h e m a .   T h us ,   i n   t h e   s t ruc t u r a l - b a s e d   m a ppi ng  a pp r o a c h ,   t h e   r e l a t i o na l   s c h e m a   de s i gn   i n v o l v e s   t h e   s uppo r t s   of   D a t a   T y p e   D e f i n i t i o n   (D T D o r   X M L   s c h e m a   (X S D t o   de t e r m i n e   t h e   n u m b e r   o f   r e l a t i o n s   r e qu i r e a f t e r   t h e   s hr e ddi n g   pr o c e s s .   H ow e ve r ,   s t ruc t u r a l - b a s e m a p pi n g   i s   n o t   s ui t a b l e   t o   s t o r e   d y n a m i c   a n d   u n s t r uc t u ra l   v a r i a n t   o f   X M L   do c um e n t s .   T h i s   i s   b e c a us e   fo r   a n y   n e w   upda t e s   i n   t h e   X M L   doc um e n t ,   i t   r e qui r e s   r e - l o a di n o f   da t a   i n   t h e   r e l a t i o n s   c r e a t e d.   N e v e r t h e l e s s ,   i n   s t r uc t u ra l - b a s e m a ppi n g,   t h e   a pp r o a c h e s   c a n   s uppo r t   t h e   r e l a t i o n s hi a m o ng  n o de s   (P a r e n t - C h i l (P - C),   A n c e s t o r - D e s c e n da n t   (A - D ),   s i b l i ng  a n d   l e v e l e ff e c t i v e l y   [4].     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1 5 3 9   -   1 5 5 0   1540   O n   t h e   o t h e r   h a nd,   m o de l - b a s e m a ppi ng  a pp r o a c h   i n v o l ve s   i n   a   f i xe r e l a t i o n a l   s c h e m a   w h i c h   i s   b ui l t   t o   s t o r e   X M L   do c um e n t   w i t h o ut   a n y   s uppo r t   o f   D T D   o r   X S D   [5] .   I t hi s   a pp r o a c h,   t h e y   s upp o r t   e v e r y   X M L   a ppl i c a t i o n s   e i t h e i s t a t i c   a n d   dy n a m i c .   T h i s   i s   t h e   a dv a n t a ge   o f   m o de l - b a s e m a ppi ng  w hi c c a s uppo r t   a n y   v a r i e t y   of   X M L   do c um e n t s   i W W W .     T h e   f oc us   o f   t h i s   pa pe r   i s   o n   t h e   s t r uc t u ra l - b a s e m a ppi ng  a ppr o a c h   s i n c e   o ur   f o c us   i s   o n   t h e   da t a - c e n t r i c   X M L   do c um e n t ,   w h e r e by   t h e   s t r uc t u ra l   s c h e m a   o f   t h e   X M L   i s   n o t   a f f e c t e e v e n   i f   t h e r e   i s   a   c ha n ge   i n   t h e   da t a .   T h e   r e s t   of   t h e   pa pe r   i s   o r ga ni z e a s   fo l l ow s .   S e c t i o n   r e v i e w   o n   t h e   t hr e e   s e l e c t e s t a t e - of - a r t   s t ruc t u r a l - ba s e m a p pi n a pp r o a c h e s .   S e c t i o n   di s c us s e s   on   t h e   e xpe ri m e n t a l   s e t up ,   r e s ul t s   a n d   a na l y s i s   o n   t h e   c o m pa r i s o b e t w e e n   t h e   s e l e c t e a pp r o a c h e s .   L a s t l y ,   S e c t i o s u m m a r i z e s   t h e   p a pe r   a nd  s ugge s t e s o m e   f ut ur e   w o r ks .       2.   LI TER A TU R R EV I EW   F i gu r e   1   s h o w s   t h e   i l l us t ra t i o s a m pl e   o f   X M L   w h i c w i l l   b e   us e t hr o ug h o ut   t h e   p a pe r .           F i gu r e   1 .   X M L   i l l us t r a t i v e   e xa m pl e       2 . 1 .       D O M - b as e d   M ap p i n g   A p p r o ac h   T h e   f i r s t   a pp r o a c h   f o r   s t r uc t u ra l - b a s e m a ppi ng  c h o i c e s   i s   b a s e o n   D o c um e n t   O b j e c t   M o d e l   (D O M ).   A t a y   e t .   a l .   p r o po s e t h e   O r de r e X M L   I n s e rt   ( O X In s e r t )   [6] ,   w hi c i s   b a s e o t h e   i de a   t ha t   i n l i na b l e   e l e m e nt s   w i l l   ha v e   e xa c t l y   o n e   pa r e n t   n o de   du ri n t h e   s c h e m a   m a ppi ng  s t e p.   H ow e v e r ,   t h e   i n l i na b l e   of   X M L   e l e m e n t   i s   un k n o w n   f r o m   t h e   D O M   t r e e ;   t h i s   i n f o r m a t i o n   i s   r e f e rr e o n   t h e   D T D .   T h e   O X In s e r t   a l go ri t hm   i n s e rt s   X M L   do c um e nt   i nt o   R D B ,   w h i c h   s c h e m a   i s   ge n e r a t e f r o m   t h e   D T D   i n pu t   i t h e   p r i o s t e p.   O X In s e r t   i s   a e nha n c e m e n t   o f   t h e i r   p r e v i o us   w o r k,   X I n s e r t   [ 7]  w i t h   t a k i n g   o r de r e n a t u r e   i nt o   a c c o un t .     T h e   s c h e m a   m a pp i ng  f u n c t i o n s   a r e   a s   f o l l o w s .   a)   U s e   σ   (e t h a t   m a ps   t h e   e l e m e nt s   i n t o   r e l a t i o n a l   t a b l e .     b)   U s e   θ  (e t ha t   m a ps   t h e   X M L   a t t r i b ut e s   t o   r e l a t i o n a l   a t t r i b ut e .   c)   U s e   δ   (e t h a t   m a ps   l e a f   e l e m e n t   t o   r e l a t i o n a l   a t t r i b ut e .   In  t h e   D O M   a pp r o a c h,   A t a y   e t   a l .   [7 m o de l s   t h e   X M L   do c um e n t   a s   a n   o r de r e e l e m e n t   t r e e .     T h e   t r e e   c o n s i s t s   o f   n o de   w h i c h   r e pr e s e nt s   e l e m e nt   a n e d ge   t ha t   r e p r e s e n t   a s   P - r e l a t i o n s h i p.   B a s i c a l l y ,   e a c h   n o de   ha s   a t t ri b ut e s   a n v a l ue s .   T h e   e l e m e n t   o f   t h e   t r e e   ha s   a   f e w   n o t a t i o n s   w h i c h   a r e   e . n a m e   r e p r e s e n t s   a s   X M L   e l e m e n t ’s   na m e ,   e . E ID   r e p r e s e nt s   a s   gl o b a l   ID   o f   X M L   b a s e o n   pr e   o rde r   t r e e   t ra v e r s a l ,   e . e n dID   r e p r e s e n t s   a s   i t s   l a r ge s t   de s c e n de n t ,   e . a t t ri b ut e   r e p r e s e n t s   a s   s e t   of   X M L   a t t ri b ut e s ,   e . v a l ue   r e p r e s e n t s   a s   t h e   e l e m e n t   v a l ue ,   e . pa r e n t   r e p r e s e n t s   a s   t h e   pa r e nt   n o de   o f   t h e   e l e m e n t   a n d   e . c h i l d r e r e p r e s e n t s   a s   t h e   o r de r e s e que n c e   of   t h e   c hi l d   n o de .   T h e   e . v a l ue   o n l y   e xi s t s   w h e e   i s   a   l e a f   n o de .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       P e r f or m anc e   e v a l uat i on   on   s t r uc t ur al   m app i ng   c h oi c e s   f or   d at a - c e n t r i c   X ML   do c um e nt s   ( Su - Ch e ng   H aw )   1541   A t a y   e t   a l .   [7]  s o l v e t h e   pr o b l e m   of   v a r y i n do c um e n t   s t r u c t ur e .   H e n c e ,   t h e   v a l ue   of  m i s s i n n o de   w i l l   ha v e   a ppe a r e a s   n u l l   i n   t h e   c o l um n s .   I n   s o m e   c a s e s ,   fo r   t h e   e l e m e n t s   t ha t   h a v e   s a m e   t y p e   a n t h e   t r e e   s t ruc t u r e s   a r e   v a r i e d,   O X I n s e r t   p r o c e s s e s   t h e   de s c e n da n t s   us i n σ   m a pp i n g .   T h e y   h a v e   a l s o   c o n duc t e a e xpe r i m e nt a l   e v a l ua t i o n   t o   c o m pa r e   D O M - b a s e t o   S i m pl e   A P fo r   X M L   (S A X b a s e a ppr o a c h.   T h e   r e s ul t   r e v e a l e t h a t   t h e   D O M - b a s e a pp r o a c h   ha s   b e t t e r   pe r f o r m a n c e   t h a t h e   S A X - b a s e a pp r o a c h   u t o   75  M s i z e   do c um e nt .       2 . 2 .       SAX - b as e d   M ap p i n A p p r o ac h   T h e   s e c o n a pp r o a c h   i s   a c c o r di n t o   S A X - b a s e a ppr o a c h   w h i c h   s o l v e s   a   l i n e a r   s c h e m a   m a ppi ng  pr o b l e m .   A t a y   e t   a l .   [7]  p r o po s e t h e   S A X - b a s e D a t a   M a pp i n a l go ri t hm ,   c a l l e S D M   f o r   s h o r t .     T h i s   a l go r i t hm   i s   e ve n t   d r i v e n   a n o nl y   m a ke s   o n e   r un   s c a nni n o w h o l e   d o c um e n t .   S D M   de a l s   i n   s e que n t i a l   s c a n   o o ve r a l l   do c um e n t   t h a t   t r i gge r s   f e w   e v e n t s   s uc h   a s   s t a r t E l e m e n t   () ,   c h a ra c t e r s   ()  a n e n dT a ()  w h i c i n di c a t e s   s t a rt   t a g ,   c ha r a c t e da t a   a nd  e n d   t a r e s pe c t i v e l y .   T r i gge ri n t h e   s t a r t   t a u n de r   p r o c e dur e   s t a rt E l e m e n t   ()   ge ne r a t e s   s e que n t i a l   g l o b a l   ID   (c a l l e G ID   fo r   s h o rt t o   e n s ur e   t h e   o r de r   o f   X M L   d o c um e n t   i n   R D i s   m a i nt a i n e fo r   t h e   r e c o n s t r uc t i o n   o f   R D B   i n t o   X M L   i f   a n y .   H ow e v e r ,   t h e r e   a r e   t w o   c o n di t i o n s   f o r   t h e   e l e m e nt   w hi c a r e   i n l i na b l e   a n n o n - i nl i na b l e   t o   t h e   pa r e nt   e l e m e nt .     If   e l e m e n t   e n c o unt e n o n - i n l i n a b l e   e l e m e n t ,   S D M   pr o c e e ds   i n   c r e a t i n n e w   t upl e ,   t   o t a b l e   σ (t y p e   (e ))  a n f i l l s   t h e   f i e l ds   w i t h   t h e   i n f o r m a t i o n   f r o m   t h e   e l e m e nt ,   w hi l e   pus h i ng  e l e m e n t   t y pe   e   a n G ID   o n t o   G S T   k n o w n   a s   gl o b a l   s t a c k,   t u pl e   t   w i l l   b e   pus h e o n t o   s t a c S T   σ (t y pe   ( e )).   T h i s   p r o c e dur e   a pp l i e s   t o   a l l   n o n i nl i na b l e   e l e m e nt s   u nt i l   a l l   de s c e n da nt s   a r e   p r o c e s s e d.   If   t h e   e l e m e nt   i s   i nl i na b l e   t o   t h e   p a r e n t   e l e m e n t ,   n o   n e w   t upl e   i s   c r e a t e d.   H ow e ve r ,   G ID   a n d   a t t ri b ut e s   v a l ue s   of   e   a r e   upda t e f o r   t h e   t up l e   w h i c h   i s   o n   t o of   t h e   s t a c S T   σ (t y pe   (e )).   T h e n ,   t h e   e l e m e nt ,   e   a n d   G ID   a r e   pus h e o n t o   s t a c G S T .     2 . 3     S i m p l e   X M L   (s - X M L )   G oo l a b e l i n i s   e ff i c i e n t   t o   m a ke   s ur e   t h e   l a b e l s   gi v e n   t o   t h e   X M L   n o de s   a r e   un i que l y   i de n t i f i e d.   H e n c e ,   fo r   t h e   t h i rd  a pp r o a c h   o f   s t r uc t ura l - b a s e da t a   m a p pi n g   i s   s - X M L   [8],   w h i c h   i s   b a s e o n   pe r s i s t e nt   l a b e l i n s c h e m e   [9].   S i m pl e   X M L   o r   be t t e r   k n o w n   a s   s - X M L   i n   s h o r t   [8] ,   ut i l i s e t h e   pe r s i s t e n t   l a b e l i n t o   s uppo r t   t h e   upd a t e   l a b e l i n f u n c t i o n   w i t h o ut   r e c o n s t r uc t i n t h e   l a b e l s   i f   a n y   n e w   n o de s   of   i n s e rt i o n   a nd  de l e t i o n   e xi s t   t o   t h e   o ri gi na l   X M L   do c um e nt .     T h e   i de a   b e h i n d   t h e   pe r s i s t e nt   l a b e l i n g   i s   t o   e n c o ur a ge   qui c de t e rm i na t i o o f   r e l a t i o n s hi b e t w e e n   a   pa i r   o f   n o de s   a n s uppo r t   f o ur   b a s i c   s t r uc t u ra l   hi e ra r c h i c a l   r e l a t i o n s h i w hi c h   a r e   A - D ,   P - C,   s i b l i n a n le v e l   r e l a t i o n s h i p .   T h e   pe r s i s t e nt   l a b e l i n l a b e l s   t h e   n o de   a s   (l ,   [ np,   dp],   [ n ,   d])  w hi c h   l   r e p r e s e n t s   a s   l e v e l   of  n o de   i n   t h e   t r e e ,   [ n p ,   dp]   r e p r e s e n t s   a s   t h e   s e l f - l a b e l   of   pa re n t   n o de   a n d   [ n ,   d]  r e p r e s e nt s   a s   t h e   l o c a l   l a b e l .   T h e   l a b e l i n p a i r   [ n,   d w h e r e   t h e   n   de n o t e s   t h e   po s i t i o n   o f   t h e   n o de   a m o n s i b l i n gs   w h i l e   i s   a s s i g n e a s   i n   t h e   i de a   o f   s t a t i c   l a b e l i n g   a n [ n ,   d]   r e p r e s e n t s   t h e   n/ d   r a t i o n a l .   R e fe r i n g   t o   F i gu r e   2 ,   t h e   r o o t   n o de   i s   a l w a y s   a t   l e v e l   n o de   z e r o   a n t h e r e   i s   n o   pa r e nt   n o de   e xi s t e t o   t h e   r o o t   n o de .   T hi s   a ppl i e s   t o   t h e   n o de   a s   t h e   l e v e l   n o de   i s   z e r o   a n d   s i n c e   t h e   n o de   ha s   n o   s i b l i n g ,   t h e   s e l l a b e l   i s   l a b e l e a s   [1,   1] .   A pp l y i n t h e   r ul e   b a s e o n   t h e   X M L   doc um e n t ,   u ni v e r s i t y   i s   l a b e l e a s   (0,   [1,   1])   s i n c e   u n i v e r s i t y   n o de   i s   a   r o o t   n o de .   F o r   t h e   n o n - r o o t   n o de ,   t h e r e   e xi s t s   pa r e n t   n o de   t o   e a c h   e l e m e nt   n o de .   B a s e o n   F i gur e   2,   t h e   n o de   a n n o de   h a v e   t h e   a l l o c a t i o n   of   pa r e nt   l a b e l   n o de   of   [1,   1]  a s   fo r   n o de   1’s   l o c a l   l a b e l .           F i gu r e   2 .   A s s i g ni n g   [ n p ,   d p ]   a n [ n ,   d]   by   s - X M L   a pp r o a c h       s - X M L   s hr e ds   a l l   t h e   n o de s   f r o m   t h e   t r e e   i n t o   t w o   r e s pe c t i v e   t a b l e s   w h i c h   a r e   P ar e n t T abl e   a n Chi l dT a bl e .   T h e   pa r e n t   t a b l e   s t o r e   a l l   i nt e rna l   n o de s   i n f o r m a t i o n   s uc h   a s   IdN o de ,   P N a m e ,   CN a m e ,   L e ve l ,   L P a r e n t   a n S e l f L a b e l   w h i c i de n t i fy   t h e   n o de   u n i que l y ,   s t o r e s   t h e   pa r e n t   n o de ’s   na m e ,   t h e   c h i l d’s   n a m e   w h i c h   i s   t h e   s e l f   n o de ’s   n a m e ,   l e v e l   of   t h e   t r e e   i n f o r m a t i o n,   s t o r e s   t h e   pa r e nt   n o de ’s   l a b e l   a s   r e f e r e n c i ng  t Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1 5 3 9   -   1 5 5 0   1542   t h e   IdN o de   of   t h e   p a r e n t   f r o m   t h e   pa r e nt   t a b l e   a n d   t h e   s e l f   n o de ’s   l a b e l .   I n   a ddi t i o n ,   t h e   v a l ue   a t t r i b ut e   o nl y   a ppl y   o n   c h i l t a b l e   t o   s t o r e   t h e   l e a f   n o de ’s   v a l ue   r e s pe c t i v e l y .     W h i l e   i n   t h e   c h i l n o de s ,   t h e r e   e xi s t s   i n f o r m a t i o n   a s   IdN o de ,   L e v e l ,   P N a m e ,   S e l f L a b e l ,   L P a r e nt   a n d   V a l ue .   F o r   t h e   IdN o de ,   i t   un i que l y   i de n t i f i e s   t h e   c urr e nt   n o de ,   w h i l e   fo r   t h e   l e ve l ,   i t   s t o r e s   t h e   t r e e   l e ve l   o t h e   n o de s .   P N a m e   s t o r e s   t h e   pa r e nt   n o de ’s   na m e ,   t h e   S e l f L a be l   s t o r e s   t h e   l a b e l   of   t h e   c u rr e n t   n o de ,   L P a r e n t   s t o r e s   t h e   p a r e nt   n o de ’s   l a b e l   a s   r e f e r e n c i n t o   t h e   IdN o de   of  t h e   pa r e n t   f r o m   t h e   p a r e n t   t a b l e   a n V a l ue   a s   t o   s t o r e   t h e   v a l ue   o f   t h e   c ur r e n t   n o de   s i n c e   i t   i s   a   l e a f   n o de .   T a b l e   a n T a b l e   de pi c t   t h e   m a ppe r e s ul t   o P ar e nt T abl e   a n d   Ch i l dT ab l e   r e s pe c t i v e l y .       T a b l e   1 .   S a m p l e   D a t a   o f   s - X M L   fo r   P a r e n t T a b l e     T a b l e   2 .   S a m p l e   D a t a   o f   s - X M L   fo r   C h i l dT a b l e         S ub r a m a ni a m   e t   a l .   [8]  f o un t h a t   s - X M L   ha s   go o pe r fo r m a n c e   b e c a us e   of   t h e   s i m pl e   m a pp i n g   a pp r o a c h   us a ge   a n a l l   da t a   a r e   di s t ri b ut e f a i rl y   a m o n s uff i c i e n t   n um b e r   o f   t a b l e s .   In   a ddi t i o n ,   t h e   num b e of   t a b l e s   a n fo r m a t   o f   t h e   t a b l e s   a r e   f i xe r e ga r dl e s s   of   t h e   X M L   doc um e n t   c o m pl e xi t y .   O t h e r   t ha n   t ha t ,   w i t h   pe r s i s t e nt   l a b e l i n u t i l i z e a s   t h e   l a b e l i n s c h e m e ,   t hi s   da t a   m a ppi ng  a pp r o a c s uppo rt s   s t r uc t u r a l   que r i e s   r e t ri e v a l   e f f i c i e n t l y   a n d   ha v e   gr e a t   s up po r t   f o r   dy n a m i c   upd a t e s .     2 . 4     S u m m ar o R e v i e w   A p p r o ac h e s   T a b l e   s h o w s   t h e   c o m pa ri s o n   o n   t h e   t hr e e   s e l e c t e m a ppi ng  s c h e m e s .   T h e   D O M - b a s e r e p r e s e n t s   t h e   X M L   do c um e n t   a s   a   D O M   t r e e .   T h e   m a i i de a   o f   t h e   O X In s e r t   a l go r i t hm   i s   t h e   a l go r i t hm   t a ke s   o r de r e e n c o di n w hi l e   m a ppi ng  t h e   X M L   do c um e n t   i nt o   R D B   w i t h   t h e   pr e s e n c e   o f   D T D .   H ow e v e r ,   D O M - b a s e d   a pp r o a c n e e ds   t w o   r un s   t o   c o m pl e t e   t h e   do c um e nt   s c a nni ng:   t h e   f i r s t   ru n   o f   t h e   s c a nni n i s   f o r   c o n s t r uc t i ng  t h e   D O M   t r e e   w h i l e   t h e   s e c o n r u n   i s   a c c e s s i n t h e   D O M   t r e e   t pr o c e s s .   L a s t l y ,   t h e   D O M - b a s e a ppr o a c h   i s   a   s p a c e   c o n c e r ni n g   s i n c e   t h e   a pp r o a c h   n e e ds   s pa c e s   i t h e   m a i m e m o r y   t o   f i t   i n   t h e   D O M   t r e e .   SAX - b a s e a ppr o a c n e e ds   t h e   D T D   f o r   t h e   s c h e m a   m a p p i n p r o c e s s .   T h e   S A X - b a s e a ppr o a c h   us e s   S D M   a l go ri t hm   t o   m a p   t h e   X M L   do c um e n t   i n t o   R D B   e ff i c i e n t l y .   S D M   r e qui r e s   o n l y   o n e   s c a t o   pr o c e s s   a l l   t h e   i n f o r m a t i o n .   S A X - b a s e do e s   n o t   s uf fe r   t o   a n y   s pa c e   c o n c e r ni n a s   i t   do e s   n o t   n e e t o   c o n s t r uc t   a n y   t r e e   f o r   t h e   d a t a   m a ppi ng.     s - X M L   t a ke s   a dv a n t a ge   o t h e   pe r s i s t e n t   l a b e l i ng  i n   l a b e l i n t h e   t r e e   n o de s   fo r   da t a   m a pp i n g .     s - XM L   n e e ds   o n l y   o n e   r u n   t o   c o n s t r uc t   t h e   t r e e   n o de s   w i t h   i n f o r m a t i o n .   T h i s   a pp r o a c h   do e s   n o t   r e qu i r e   a   D T D   fo r   t h e   da t a   m a pp i n g .   T h e   s - X M L   a l s o   d o e s   n o t   s uff e r   i n   a n y   s pa c e   l i m i t a t i o n   b e c a us e   t h e   t r e e   c o n s t r uc t i o i s   s i m p l e .       T a b l e   3 .   Co m p a r i s o b e t w e e n   A pp r o a c h e s   F e a t u r e s   DOM - b a s e d   S A X - b a s e d   s - X M L   Re q u i r e   D T D   Y e s   Y e s   No   S c a n n i n g   ru n   T w o   ru n s   O n e   ru n   O n e   ru n   U p d a t i n g   l a b e l l i n g   No   No   Y e s   S p e e d   c o n c e rn i n g   Y e s   No   No   Re q u i r e   t r e e   Y e s   No   Y e s   O rd e r e d   m a p p i n g   Y e s   Y e s   No   A l g o ri t h m   O X I n s e rt   S D M   M a p p i n g   &   Q u e ry   R e t ri e v a l   A l g o ri t h m s       2 . 5     O th e r   R e c e n A p p r o ac h e s   L i m   e t   a l .   [ 10]  e v a l ua t e o n   S A X   a nd  D O M   a pp r o a c h e s   i n   t h e i r   s t udi e s .   T h e y   c o n c l ude t ha t   D O M   i s   m o r e   e f f i c i e n t   w h e n   i t   c o ul f i t   t h e   D O M   t r e e   i n   t h e   m a i n   m e m o r y ,   w h i l e   t h e   S A X   i s   b e t t e r   i n   pe r f o r m a n c e   w h e n   de a l i ng  w i t h uge   X M L   do c um e n t .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       P e r f or m anc e   e v a l uat i on   on   s t r uc t ur al   m app i ng   c h oi c e s   f or   d at a - c e n t r i c   X ML   do c um e nt s   ( Su - Ch e ng   H aw )   1543   Q t a i s h   e t   a l .   [1 1]  pe r f o r m e a   c o m p r e h e n s i v e   r e v i e w   o n   s o m e   m a ppi n a pp r o a c h e s .   F r o m   t h e i r   r e v i e w ,   i t   w a s   po i n t e o ut   t ha t   t h e   n um b e r   o f   j o i n   o pe r a t i o n s   i n   t h e   t r a n s l a t e S Q L   do e s   a ff e c t   t h e   que r y   pr o c e s s i n g.   O a n o t h e r   s t udy ,   G a m a l   e t   a l .   [12]  d i s c ov e r e t h a t   s - X M L   i s   m o s t   e ff i c i e n t   i n   t e rm   o f   s t o r a ge   s pa c e   a n d a t a   r e t ri e v a l   a s   c o m pa r e t o   r e l a t i o n a l   D T D ,   E dge   a nd  A t t r i b ut e   a pp r o a c h e s .   T h e   a pp r o a c h   pe r f o r m e b e t t e r   i n   p r o c e s s i n c o m pl e c ha i n   q ue r y   dur i n d a t a   m a pp i n i n t o   R D B   a n da t a   r e t ri e v a l   r e ga rdl e s s   t h e   da t a s e t   s i z e s .   Co n v e r s e l y ,   M a c h ko ur  e t   a l .   [ 13]  p r o po s e a   m e t h o t o   c o n v e r t   a   D T D   i nt o   ob j e c t - r e l a t i o na l   m o de l   by   pr e s e r v i ng  s t r uc t u ra l   a n s e m a n t i c   c o n s t r a i n t s .   T h e i a pp r o a c h   s uppo r t s   r e v e r s i b l e   c o n v e r s i o n   f r o m   o b j e c t - r e l a t i o na l   m o de l   i n t o   X M L .   A hm a a n S a m a [1 4]  p r o po s e us i n n o r m a l i z a t i o n   b a s e o n   f un c t i o n a l   de pe n de n c i e s   t o   m a X M L   i nt o   R D B .   T h e y   pr o po s e X t o R   a l go r i t hm ,   w h i c h   c o ns i s t s   o f   t hr e e   m a i n   c o m po n e n t s :   (1)   de f i n i ng  t h e   f un c t i o na l   de pe n c i e s   fo r   X M L ,   (2)  c o n s t r uc t u r i ng  i n f e r e n c e   r ul e s ,   a n (3)  t h e   m a p p i n f un c t i o n.   In   t h e i r   pa pe r,   a l t h o ug h   t h e r e   i s   n o   e xpe ri m e n t a l   p r o of ,   t h e y   h a v e   prov i de t w o   m o t i v a t i n g   e xa m pl e s   t o   de m o n s t r a t e   t h e i r   p r o po s e m e t h o d.     M a o   a n Y e   [ 15]  p r o po s e a   b i di r e c t i o n a l   m a p pi n g   a l go ri t hm   b e t w e e n   r e l a t i o n a l   s c h e m a   a n d   X M L   s c h e m a .   T h e y   b ui l a n   i n t e r m e d i a t e   obj e c t   t r e e   t o   t r a n s f e r   t h e   da t a   i n f o r m a t i o n   w h i l e   pr e s e r v i n t h e   da t a   s t ruc t u r e ,   r e f e r e n t i a l   i nt e g r i t y   a n s e m a nt i c   c o n s t r a i n t s .   O n   a n o t h e r   s e pa r a t e   r e s e a r c h ,   M o l n a r   e t   a l .   [16]   pr o po s e ut i l i z i n Co n c e pt ua l   G ra p h s   t o   pr o v i de   a   gr a p hi c a l   r e pr e s e nt a t i o n   fo r   l o gi c   w h i c h   i s   a b l e   t s uppo r t   h u m a r e a s o ni n a n d   c o m put e t ra c t a b l e .   I n   a ddi t i o n ,   t h e i p r o po s e s y s t e m   i s   a b l e   t o   ge n e ra t e   X M L   que r i e s   fo r   us e r s   w i t h   l i t t l e   k n o w l e dge   a bo ut   X M L   a n d   X Q ue r y .   H a m a [17]  p r o po s e a   m i ddl e w a r e   r e l a t i o n a l   s t o r a ge   fo r   c on v e r t i n b e t w e e n   X M L   a n R D B   b a s e d   o n   pa t h - b a s e r e l a t i o n a l   s t o r a ge   a pp r o a c h   a n D O M   M o de l .   In   a ddi t i o n ,   t h e   p r o po s e d   t e c h n i que   a ppl i e s   1 - i n de m e t h o t o   r e duc e   t h e   s t o r a ge   s i z e .   L y a m i n   a n C h e r e po s v s ka y a   [18]  p r o po s e r u l e s - dri v e n   m e t h o t o   m a X M L   i n t o   R D B   b a s e o n   pr o duc t i o n   r u l e   s y s t e m .   S om e   of   t h e i r   de f i n e r u l e s   a r e   o n   t h e   r e l a t i ons ,   at t r i b ut e ,   anc e s t or s ,   de s c e nd ant s ,   c onv e r t   ( v a l ue ,   t y p e ) ,   ge t R e l at i on   a n s o   o n.   T h e i r   p r o po s e s y s t e m   ha s   b e e n   i m pl e m e n t e i n   a   U n i v e r s i t y   f o r   i m po rt i ng  a nd  e xpo r t i n d a t a   p r e s e nt e i n   X M L   f i l e s   i n t o   R D B   t ha t   c o n t a i n s   m a n y   e duc a t i o n a l   m a t e r i a l s .   M o r e   r e c e n t l y ,   Co m b i   e t   a l .   [19]  p r o po s e X H y b ,   w h i c r e p r e s e nt   s i m pl e   l o gi c   f o r   s pe c i fy i n f e a t ur e s   of   X M L   d oc um e n t s   w i t h   r e s pe c t   t o   c o m m o n   i nt e g ri t y   a n r e f e r e n c e   c o n s t r a i n t s   o f   D T D .   S i m i l a rl y ,   M a r t e n s   e t   a l .   [ 20]  p r o po s e Bo n X a i ,   a n   a l t e rna t i v e   X M L   s pe c i f i c a t i o n   l a ngua ge ,   w h i c h   i s   a s   e a s y   t o   us e   a s   D T D ,   a n d   y e t   c o n t a i n s   t h e   e xpr e s s i v e n e s s   a n d   f e a t u r e s   o X M L   S c h e m a   s uc h   a s   us e   o f   t y pe s ,   a n d   ke y   c o n s t ra i nt s .     O n   t h e   o t h e r   ha n d ,   Y a g hm a z a de h   e t   a l .   [21]  p r o po s e us i n i n s t a n c e s   of  t h e   i nput   X M L   do c um e n t   t m a i nt o   R D B   i n s t e a o b a s e o n   s t ruc t u r a l   o r   m o de l   m a ppi n g .   T h e y   de s i gn e t h e   t oo l   n a m e M IT R A ,   w h i c i s   a   n o v e l   t r e e - to - t a b l e   t ra n s f o r m a t i o n   D o m a i n - S pe c i fi c   L a n gua ge   (D S L t ha t   c a e xp r e s s   a   ri c h   c l a s s   of   m a ppi n p r o g r a m s .   O n   t o of   t h a t ,   t h e y   a l s o   pr e s e n t e t h e   D e t e r m i ni s t i c   F i ni t e   A ut o m a t a   (D F A a pp r o a c h   fo r   l e a rni n c o l um t ra n s f o r m a t i o n,   a n s ub s e que n t l y ,   pr e di c a t e   l e a rn i ng  t o   f i l t e r   o ut   i rr e l e v a n t   t up l e s   i n   t h e   i n t e r m e di a t e   t a b l e .       3.   TH E   A R C H I TER C TU R E   O F   EV A LU A TI O N   EN G I N E   F i gu r e   3   s h o w s   t h e   a r c h i t e c t u r e   o f   t h e   s i m u l a t i o e n gi n e ,   w hi c h   ha v e   t h e   f o l l ow i n p r o c e dur e s :   a.   Co nn e c t i n g   t o   t h e   da t a b a s e .   b.   In s e r t i n D T D   f i l e   t o   b ui l d   t h e   da t a b a s e   s c h e m a .   b)   In s e r t i n X M L   f i l e   f o r   da t a   m a pp i n g   p r o c e s s   a n d   s t o ri n g   i nt o   da t a b a s e .   c)   E xe c ut i n g   us e que r i e s   f o r   r e t ri e v e   da t a   f r o m   t h e   d a t a b a s e .   d)   Ca l c ul a t i n g   t i m e   t a ke n   f o r   s t o r i ng  d a t a   a n d   que r y i n e v a l u a t i o n .   T h e   m a i n   i nt e r f a c e   i s   de pi c t e i n   F i gu r e   4,   w hi c h   c o n s i s t s   of   t hr e e   m a i n   p a rt s :   (1)  D a t a b a s e   Co n f i gu r a t i o n     t o   s e t up  da t a b a s e   c o n n e c t i o n ,   (2)  S t o ri n a nd  Re t r i e v a l   s c r e e n     t o   s e l e c t   t h e   i nput   f i l e s   a n d   s t o r a ge   m e t h o ds ,   a n d   (3)   Q ue r y   P r o c e s s i n   t o   e v a l ua t e   t h e   que r y   a nd  d i s pl a y i n t h e   e v a l ua t i o r e s ul t s .   F i gu r e   de pi c t s   t h e   t w o   a l go r i t h m s   o f   o ur   s i m u l a t i o n   e ngi n e .   T h e   f i r s t   a l go r i t hm   de s c r i b e s   t h e   s t o r i n p r o c e dur e   of   da t a   m a p pi n f r o m   X M L   i nt o   R D B   w hi l e   t h e   s e c o n a l go ri t hm   e xpl a i n s   t h e   que r y i n g   pr o c e s s   of   X M L   da t a   f r o m   R D B .   T h e   s t o r i n g   a l go ri t hm   b e gi n s   w i t m a pp i n g   f un c t i o n   w hi c s e r v e s   di f f e r e n t   t y p e s   of   s t o r i ng  b a s e o t w o   da t a   m a ppi ngs   w hi c a r e   S A X   a n d   s - X M L .   L i n e   t o   2   de s c r i b e s   t h e   i nput   a n d   t h e   e xpe c t e o ut put   of   t h e   a l go ri t hm .   L i n e   4,   a nd  a r e   f o r   t i m e   c a l c ul a t i ng  pu r po s e ,   t ha t   i s ,   t o   e v a l ua t e   t h e   e ff i c i e n c y   of   t h e   d a t a   m a p pi n g .   L i n e   a n a r e   c a l l i n g   f un c t i o n s   b a s e o n   r e s pe c t i v e   da t a   m a pp i n gs .   L i n e   11   t o   19  de pi c t s   t h e   f u n c t i o n   f o r   S A X   a pp r o a c h,   w hi l e   L i n e   20 - 28  de pi c t s   t h e   s - X M L   a pp r o a c h.   S A X   m a pp i n g   n e e ds   D T D   f i l e   t o   g e n e ra t e   t h e   da t a b a s e   s c h e m a s   i n   R D be fo r e   da t a   m a p pi n p r o c e s s i n b e gi n s   (s e e   L i n e   12,   w h i c h   s ub s e que n t l y   c a l l   t h e   P a r s e D T D   f un c t i o n   i n   L i n e   29  t o   34).   s - X M L   m a pp i n do e s   n o t   n e e D T D   f i l e   fo r   s c h e m a   m a pp i n g   w h i c h   i t   di r e c t l y   c r e a t e s   t h e   da t a b a s e   s c h e m a   i nt o   t w o   t a b l e s .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1 5 3 9   -   1 5 5 0   1544   O n   t h e   o t h e r   h a nd,   t h e   s e c o n a l go ri t hm   de s c ri b e s   o n   que ry i n pa r t   o f   t h e   X M L   da t a   f r o m   R D B .   T h e   t i m e   t a ke n   t o   a n s w e r   t h e   que r y   i s   di s pl a y e o n   t h e   s c r e e n   w i n do w .   L i n e   4,   a nd  a r e   f o r   c a l c ul a t i ng  t h e   t i m e   t o   e v a l ua t e   t h e   e f f i c i e n c y   of   que r y i n b a s e o n   que r i e s   c o m pl e xi t y .   S i n c e   e a c h   d a t a   m a p pi n g   h a s   v a ri e w a y s   of   s t o r i n g ,   t h e n   e a c h   da t a   m a pp i n r e s ul t e i n   v a ri e w a y   o f   que r y i n g   f r o m   d a t a b a s e .           F i gu r e   3 .   T h e   a r c hi t e c t u r e   d i a g ra m           F i gu r e   4 .   U s e r   i n t e r f a c e   fo r   pe r f o r m a n c e   e v a l ua t i o n           Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       P e r f or m anc e   e v a l uat i on   on   s t r uc t ur al   m app i ng   c h oi c e s   f or   d at a - c e n t r i c   X ML   do c um e nt s   ( Su - Ch e ng   H aw )   1545         F i gu r e   5 .   P s e udo c o de   of   t h e   p r o po s e a pp r o a c h   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1 5 3 9   -   1 5 5 0   1546   4.   P ER F O R M A N C EV A LU A TI O N R ES U L TS   A N D   D I S C U S S I O N   F i gu r e   1   s h o w s   t h e   i l l us t ra t i o s a m pl e   o f   X M L   w h i c w i l l   b e   us e t hr o ug h o ut   t h e   p a pe r .     4 . 1     Ex p e r i m e n tal   S e tu p   T h e   X M L   da t a s e t s   w e r e   ob t a i n e f r o m   U ni v e r s i t y   of   W a s h i ngt o n   w e bs i t e   [22]   a s   t h i s   i s   t h e   s t a nda rd  da t a s e t s   fo r   be n c hm a rki n g .   T h e   s e l e c t e da t a s e t s   fo r   t h e   e xpe r i m e nt a l   e v a l ua t i o n   i s   b a s e o n   t w o   f i l e   s i z e s   a s   de pi c t e i n   T a b l e   4.   A l l   t h e   t e s t i n g   a c t i v i t i e s   w e r e   pe r f o r m e o n   i 5 - 3 630Q M   2 . 40G H z   p r o c e s s o r   w i t h   16G of   R A M   r u nni n g   o n   W i n do w s   7.       T a b l e   4 .   X M L   D a t a s e t s   f o r   E v a l u a t i o n   D a t a s e t   F i l e   na m e   F i l e   s i z e   C a t e g o r y   D B L P   D bl p   130. 73 M B   M e d i um   s i z e   P r o t e i n   P s d70 03   722. 59 M B   L a r g e   s i z e       4 . 2     P e r fo r m an c e   Ev al u ati o n   4 . 2 . 1     S to r i n Ev al u ati o n   T a b l e   s h o w s   t h e   d a t a b a s e   c r e a t i o a nd   s t o ri n t i m e   f o r   t h e   t w o   s t r uc t u ra l   m a ppi ng  a p p r o a c h e s .   F r o m   t h e   r e s ul t ,   s - X M L   a pp r o a c h   ha s   b e t t e r   pe r f o rm a n c e   e v a l ua t i o n   o n   i n s e rt i o n   o f   da t a   c o m pa r e   t o   S A X   a pp r o a c h.       T a b l e   5 .   D a t a b a s e   C r e a t i o n   a n d   S t o ri n T i m e   A p p r o a c h e s   D a t a b a s e   S t o ri n g   T i m e   ( m s )   D BL P   P ro t e i n   S A X   4 6 5 4 8 3 3   (1 . 3   H r)   2 3 5 8 1 1 7 0   (6 . 6   H r)   s - X M L   1 5 9 5 3 8 7   (0 . 4   H r)   1 3 2 0 2 2 5 8   (3 . 7   H r)       4 . 2 . 2     R e t r i e v al   Ev al u ati o n   Q ue r y   e v a l ua t i o n   pl a y s   a   c r uc i a l   c r i t e ri o n   t o   de t e r m i n e   i f   o n e   s t o r a ge   m e t h o i s   be t t e r   t h a n   t h e   o t h e [23,   24 ,   25 ] .   I n   e v a l ua t i n t h e   r e t r i e v a l ,   s i que ri e s   w e r e   p r e pa r e a n s e t   i n   t h e   s i m ul a t i o n   e ngi n e .     T h e   s i m ul a t i o n   e n g i n e   pr o v i de s   s i f un c t i o n   b ut t o n s   t o   r e p r e s e n t   s i di f f e r e n t   t y pe s   of  que r i e s   fo r   t h e   r e t ri e v a l   e v a l ua t i o n.   T hr o ug h   c l i c k i n o n   t h e   r e s pe c t i v e   qu e r y   b ut t o n ,   t h e   s i m ul a t i o n   e n g i n e   pr o c e s s e s   t h e   que r y   f r o m   t h e   R D B .   T a b l e   de pi c t s   t h e   que r y   pa t t e rn   us e i n   e va l u a t i o n   p r o c e s s .   Q t Q a r e   pa t que ri e s     (s i m p l e   que ri e s   w i t P - C,   A - D   a nd  m i xe d)  w hi l e   Q t o   Q a r e   t w i que r i e s   (c o m pl e o b r a n c hi n q ue r i e s   w i t P - C,   A - D   a n d   m i xe d).       T a b l e   6 .   Q ue r y   P a t t e rn  T a b l e   Q ue r y   Q ue r y   P a t t e r n   Q ue r y 1   P a t h   qu e r y   w i t P - C   r e l a t i o ns hi p   Q ue r y 2   P a t h   qu e r y   w i t A - D   r e l a t i o ns h i p   Q ue r y 3   P a t h   qu e r y   w i t m i xe d   r e l a t i o ns h i p   Q ue r y 4   T w i g   que r y   w i t h   P - C   r e l a t i o ns h i p   Q ue r y 5   T w i g   que r y   w i t h   A - D   r e l a t i o ns hi p   Q ue r y 6   T w i g   que r y   w i t h   m i x e d   r e l a t i o ns hi p       T h e   pe r f o r m a n c e   e v a l ua t i o n   o n   r e t ri e v a l   i s   b a s e o n   t hr e e   c o n s e c ut i v e   t e s t i n t i m e s   a nd  t h e   a v e r a ge   r e s ul t   o f   t hr e e   i s   t h e   f i n a l   r e s ul t   f o r   t h e   que r y   r e t ri e v a l .   T h e   r e a s o n   b e i n g   t o   e n s u r e   t h e   c a c h e   m e m o r y   doe s   n o t   c o n t a i n   a n y   unn e c e s s a r y   da t a   t h a t   c a n   a f f e c t   t h e   r e s po n s e   t i m e .   T h e   t o t a l   n u m b e r   of   r ow s   r e t urn e f r o m   e a c h   que r y   i s   r e c o r de t o   c h e c f o r   t h e   c o r r e c t n e s s .   It   c a n   b e   ob s e r v e t h a t   t h e   r e s po n s e   t i m e s   fo r   e a c h   que r y   a r e   v a r i e b e c a us e   of   t h e   que r i e s   c o m pl e xi t i e s   a n d   n u m b e r   o f   r e t u rn e r e s ul t s .   A.   D B L P   D a t a s e t   T a b l e   de p i c t s   t h e   s i q ue ri e s   r e t r i e v a l   e v a l ua t i o n ,   f o c u s i ng  o n   t h e   que r y   de s c r i pt i o n s   a nd  q ue r y   n o de   r e p r e s e n t a t i o n s ,   t h e   num b e r   o r e t u rn   r e s ul t s ,   a nd  t h e   a v e r a ge   t i m e   fo r   e a c h   que r y   t r e t ri e v e   da t a   f r o m   R D B   o n   S A X   a n d   s - X M L   a pp r o a c h e s .     Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       P e r f or m anc e   e v a l uat i on   on   s t r uc t ur al   m app i ng   c h oi c e s   f or   d at a - c e n t r i c   X ML   do c um e nt s   ( Su - Ch e ng   H aw )   1547   F r o m   Q ue r y t o   Q u e r y 3,   t h e   que r y   r e t ri e v a l   t i m e   f o r   S A X   h a s   l o n ge r   t i m e   a s   c o m pa r e t o   t h e   s - X M L   a pp r o a c h.   s - X M L   h a s   f a s t e r   r e s po n s e   t i m e   b e c a us e   i t   do e s   n o t   i n v o l v e   a n y   e xpe n s i v e   j o i n   o f   t a b l e s   a s   S A X   a ppr o a c h .   Q ue r y   o n   S A X   a ppr o a c h   t a ke s   a   l o t   of   m ul t i pl e   j o i n s   o t a b l e s   s i n c e   e ve r y   e l e m e n t   n o de   ha s   i t s   ow n   t a b l e .   T h us ,   t o   t r a c t h e   r e l a t i o n s hi o t h e   n o de   t o   t h e   a s c e n da n t   i n v o l v e s   i n   j o i n i n f e w   t a b l e s .   H ow e ve r ,   i n   s - X M L ,   a l l   t h e   n o n l e a f   e l e m e n t s   a r e   s t o r e i n   p a r e nt   t a b l e   w h i l e   t h e   l e a f   n o de s   a r e   s t o r e i c h i l t a b l e .       T a b l e   7 .   S u m m a r y   of   t h e   Q ue r y   Re t r i e v a l   R e s ul t s   o n   D B L P   D a t a s e t   Q u e ry   No   D e s c ri p t i o n   Q u e ry   N o d e   N u m b e r   o Re t u r n   Re s u l t s   Re t r i e v a l   T i m e   (m s )   S A X   s - X M L   Q u e ry 1   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o p h d t h e s i s   w i t h   a n y   a u t h o n o d e .     72   91   7 2 . 3 3   Q u e ry 2   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o d b l p   w i t h   a n y   a u t h o n o d e .     7 1 6 , 4 8 8   6 5 0 . 3 3     2 1 0 . 6 6   Q u e ry 3   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o w w w   w i t h   i t s   re s p e c t i v e   i m m e d i a t e   u rl   n o d e .     38   2 3 2 . 3 3     72   Q u e ry 4   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o d b l p   w i t h   i t s   i m m e d i a t e   n o d e   m a s t h e rt h e s i s ,   w h i c h   h a s   i m m e d i a t e   b ra n c h i n g   n o d e   o y e a a n d   s c h o o l.     10   1 5 1 . 6 6     139   Q u e ry 5   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o d b l p   w i t h   a n y   t i t l e   o y e a n o d e .     6 5 7 , 6 9 0       9 8 0 . 6 6     263   Q u e ry 6   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o d b l p   w i t h   i t s   re s p e c t i v e   i m m e d i a t e   n o d e   w w w   a n d   a n y   n o d e   w h i c h   h a s   a u t h o r.     7 1 6 , 5 2 6       1 1 8 3 . 3 3     2 7 2 . 6 6       F o r   Q ue r y 4,   t h e   que r y   h a s   o n l y   10  r e t u rn e r o w s .   H ow e ve r ,   s - X M L   i s   s t i l l   a   b e t t e r   a pp r o a c h   i r e t ri e v i n t h e   da t a   t h a S A X .   T h i s   i s   due   t o   t h e   r e a s o n   o t h e   n um b e r   o f   j o i n s   i n v o l v e d.   S A X   us e t hr e e   t a b l e s   t o   pr o c e s s   t h e   que r y   i n   o r de r   t o   t ra c t h e   t a r ge t e d   n o de   w i t h   i t s   a s c e n da nt   n o de .   T h us ,   S A X   n e e ds   t m a t c s e l f ID   a n p a r e n t   ID   w i t h i t hr e e   t a b l e s .   F r o m   Q ue ry 5,   t h e   r e s po n s e   r e t ri e v a l   t i m e   o f   s - X M L   i s   a l s o   f a s t e r   t ha S A X   b a s e o n   t h e   s i m i l a r   r e a s o n   t ha t   ha s   b e e n   di s c us s e e a rl i e r   w hi c i s   due   t o   t h e   l e f t   j o i n   i n v o l ve m e n t .   T h e   n u m b e r   of   r e t urn e r o w s   i s   657, 690.   F o Q ue r y 6,   t h e   que r y   i s   t h e   l o n ge s t   a n t h e   m o s t   c o m pl e a m o n t h e   s i que r i e s   o n   D B L P   da t a s e t .   H ow e v e r ,   s - X M L   i s   s t i l l   b e t t e r   t ha n   S A X   a pp r o a c h   w i t h   716528  r e t u rn e r o w s   b e c a us e   i n   S A X   que r y ,   t h e r e   i s   e l e v e n   l e f t   j o i n   f un c t i o n s   i n   t w o   s e l e c t   s t a t e m e n t s   i n v o l ve d.   B.   P r o t e i n   D a t a s e t   T a b l e   de pi c t s   t h e   s u m m a r y   o f   t h e   s i que r i e s   r e t r i e v a l   e v a l ua t i o n   r e s ul t s   o f   t h e   s i que r i e s   o P S D 7003  da t a s e t .   F r o m   T a b l e   8,   i t   c a n   b e   o bs e r v e t h a t   t h e   s - X M L   a ppr o a c h   o ut pe r f o r m   t h e   S A X   a pp r o a c h   fo r   a l l   t h e   c a s e s .   I Q ue r y 2,   i t   i n v o l v e s   fo ur   l e f t   j o i n s   a s   c o m pa r e t o   Q ue r y 1,   w h i c h   ha s   o n l y   t w o   l e f t   j o i n s .     F o r   Q ue r y 3,   t h e   n um b e r   o f   r e t u rn e r o w s   i s   314, 7 89  r o w s   w h i c a r e   s l i g h t l y   m o r e   t ha n   r e t u rn e r o w s   i n   Q ue r y by   26  r ow s .   H ow e v e r ,   t h e   r e s po n s e   r e t ri e v a l   t i m e   f r o m   b o t h   t a b l e s   di ff e r   qui t e   a   l o t .     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   18 ,   N o .   3 J u n e   20 2 :     1 5 3 9   -   1 5 5 0   1548   T h e   que r y   d e s i gn   f o r   bo t h   t a b l e s   i s   n e a rl y   t h e   s a m e .   T h e   di f fe r e n c e   a r e   i t   i n v o l ve s   r i ght   j o i n s   a n t h e   n u m b e r   of   t a b l e s   i n vo l v e d   i n   t h e   j o i n s ,   w h i c h   i n   Q ue r y h a s   f i ve   t a bl e s   i n v o l ve m e n t   w h i l e   i n   Q ue r y h a s   f o ur   t a b l e s   i n v o l ve m e n t .         T a b l e   8 .   S u m m a r y   of   t h e   Q ue r y   Re t r i e v a l   R e s ul t s   o n   P S D 70 03  D a t a s e t   Q u e ry   No   D e s c ri p t i o n   Q u e ry   N o d e   N u m b e r   o Re t u r n   Re s u l t s   Re t r i e v a l   T i m e   ( m s )   S A X   s - X M L   Q u e ry 1   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o P ro t e i n E n t ry   w i t h   i t s   r e s p e c t i v e   i m m e d i a t e   o rg a n i s m   n o d e     2 6 2 , 5 2 5   335   1 7 3 . 3 3   Q u e ry 2   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o P ro t e i n E n t ry   w i t h   i t s   r e s p e c t i v e   i m m e d i a t e   re f i n fo   n o d e .     3 1 4 , 7 6 3   5 7 4 . 3 3   233   Q u e ry 3   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o P ro t e i n E n t ry   w i t h   i t s   r e s p e c t i v e   i m m e d i a t e   re fe r e n c e   n o d e ,   w h i c h   c o n s i s t s   o f   a n y   c i t a t i o n   n o d e .     3 1 4 , 7 8 9   9 2 0 . 3 3   314   Q u e ry 4   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o P ro t e i n E n t ry   w i t h   b o t h   i t s   i m m e d i a t e   h e a d e r   n o d e ,   a n d   r e fe r e n c e   n o d e ,   w h i c h   c o n s i s t s   o f   re f i n o   w i t h   i t s   i m m e d i a t e   c i t a t i o n   n o d e     6 2 7 , 2 9 5   1 , 1 3 2 . 6 6   2 7 7 . 3 3   Q u e ry 5   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o P ro t e i n D a t a b a s e   w i t h   b o t h   n o d e s   n a m e d   a c c i n fo   a n d   r e f i n fo ,   w h i c h   h a s   t h e i i m m e d i a t e   c h i l d   n a m e d   a c c e s s i o n   a n d   v o l u m e   n o d e   re s p e c t i v e l y .     3 6 5 , 4 1 6   1 , 2 9 3 . 3 3   367   Q u e ry 6   L i s t   o u t   a l l   t h e   i n f o rm a t i o n   t h a t   c o n s i s t s   o P ro t e i n D a t a b a s e   w i t h   b o t h   n o d e s   n a m e d   a c c i n fo   a n d   r e f i n fo ,   w h i c h   h a s   t h e i i m m e d i a t e   c h i l d   n a m e d   x r e fs   a n d   a u t h o r s   n o d e ,   w h e r e b y   X r e fs   h a s   i m m e i d a t e   x r e f   n o d e   w i t h   i t s   i m m e i d a t e   u i d   a n d   d b   n o d e s ,   w h i c h   a u t h o r s   h a s   i m m e d i a t e   a u t h o n o d e .       80 6 , 8 2 4   9 , 1 3 6 . 3 3   4 3 0 . 6 6       In  Q ue r y a n d   Q ue r y 5,   b o t h   o f   t h e s e   t a b l e s   i n v o l ve   r i g ht   j o i n s   i t h e   que r y   de s i gn .   T h e   r e t u rn e r o w s   f o r   Q ue r y a r e   365 , 416   r o w s   w h i l e   f o r   Q ue r y a r e   62 7, 295   r o w s .   Q ue r y h a s   l e s s e r   r e t u rn e r o w s   b ut   ha s   hi g h e r   r e s po n s e   r e t ri e v a l   t i m e   t ha n   Q ue r y 4.   W e   ob s e r v e t h e   S A X   que r y   i n   Q ue r y 5   i n v o l ve s   i n   t w r i g ht   j o i n s   a n d   f o ur   l e f t   j o i n s   w h i l e   i Q ue r y i n v o l v e s   o n l y   o n e   ri ght   j o i n   a n d   f i v e   l e f t   j o i n s .     F o r   Q ue r y 6,   s - X M L   a ppr o a c h   h a s   a   b e t t e r   r e s ul t   t ha n   S A X   a ppr o a c h   i n   que r y   r e t ri e v a l   w i t h   806 , 82 r e t u rn e r o w s .   T h e   que r y   de s i gn   i n   S A X   t h a t   i n v o l ve s   i n   e xpe n s i v e   j o i n s   w i t h i n   t hr e e   s e l e c t   s t a t e m e n t s   w h i l e   i n   s - X M L   doe s   n o t   i n v o l v e   i n   a n y   e xpe n s i v e   j o i n s   o f   t a b l e s .   H ow e ve r ,   b o t h   o f   t h e   r e t r i e v a l   t i m e   h a v e   t h e   hi g h e s t   r e s ul t   d ue   t o   t h e   c o m pl e que r y   a m o n g   a l l   que r i e s   o P S D 7003  a n d   n e e m o r e   t i m e   t o   f e t c h   r o w s .   Evaluation Warning : The document was created with Spire.PDF for Python.