I nte rna t io na l J o urna l o f   E lect rica l a nd   Co m p ute E ng in ee ring   ( I J E CE )   Vo l.   9 ,   No .   6 Dec em b er   201 9 ,   p p .   4 9 7 0 ~ 4 9 7 8   I SS N:  2088 - 8708 DOI : 1 0 . 1 1 5 9 1 / i j ec e . v 9 i 6 . p p 4 9 7 0 - 4978           4970       J o ur na l ho m ep a g e h ttp : //ia e s co r e . co m/ jo u r n a ls /in d ex . p h p / I JE C E   p ro po sed  a rchi tect u re of  b ig   e du ca tiona d a ta  u sin g   h a do o p at  the  U niv ersity o K uf a       Ah m ed  Ya s ee n M j ho o l 1 ,   Ah m e d H a zi m   Alhil a li 2 ,   Sa la m   Al - a ug by 3   1 ,2 In f o rm a ti o n   T e c h n o lo g y   Re se a r c h   a n d   De v e lo p m e n Ce n tre,  Un i v e rsit y   o f   Ku f a ,   Ira q   3 De p a rtme n o f   Co m p u ter S c ien c e ,   F a c u lt y   o f   Co m p u ter S c ien c e   a n d   M a th e m a ti c s Un iv e rsit y   o f   Ku f a Ira q       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   Feb   26 ,   2 0 1 9   R ev i s ed   Ma y   2 ,   2 0 1 9   A cc ep ted   J u n   26 ,   2 0 1 9       No w a d a y s,  e d u c a ti o n a d a ta  h a v e   b e e n   in c re a se d   ra p i d ly   b e c a u se   o f   th e   o n li n e   se rv ice p ro v id e d   f o b o th   stu d e n ts  a n d   sta f f .   Un iv e rsit y   o f   Ku f a   (Uo K)  g e n e ra tes   a   m a ss iv e   a m o u n o f   d a ta  a n n u a ll y   d u e   to   t h e   u se   o f   e - lea rn in g   we b - b a se d   s y ste m s,  n e tw o rk   se rv e rs,  W in d o w a p p li c a ti o n s,  a n d   S tu d e n ts  In f o rm a ti o n   S y ste m   ( S IS ).   T h is  d a ta  is   w a ste d   a trad it io n a l   m a n a g e m e n so f t w a r e   a r e   n o c a p a b le  to   a n a ly sis   it .   As   a   re su lt ,   th e   Big   Ed u c a ti o n a Da ta  c o n c e p rise to   h e lp   e d u c a ti o n   se c to rs  b y   p ro v id in g   n e e - lea rn in g   m e th o d s,  a ll o w in g   to   m e e in d iv id u a d e m a n d a n d   re a c h   th e   lea rn e rs'   g o a ls,  a n d   su p p o rti n g   th e   stu d e n ts  a n d   tea c h e r’s  in tera c ti o n .   T h is  p a p e f o c u se o n   d e sig n in g   Big   Da t a   a n a l y sis  a r c h it e c tu re ,   b a se d   o n   th e   Ha d o o p   in   th e   U o a n d   t h e   sa m e   c a se   f o o th e Ira q i   u n iv e r siti e s.   T h e   i m p a c o f   th is  w o rk ,   h e lp   t h e   stu d e n ts  lea rn ,   e m p h a siz in g   t h e   n e e d   o a c a d e m ic  r e se a rc h e rs  a n d   d a ta  sc ien c e   sp e c ialist  f o lea rn in g   a n d   p ra c ti c in g   Big   Da ta  a n a l y ti c a n d   su p p o rt  th e   a n a ly sis  o f   th e   e - lea rn in g   m a n a g e m e n s y ste m   a n d   se th e   f irst  ste p   to w a rd   d e v e lo p in g   d a ta  re p o sit o ry   a n d   d a ta   p o li c y   in   Uo K.   K ey w o r d s :   B ig   d ata  a r ch itectu r e   Dis tr ib u ted   s y s te m s   E d u ca tio n al  d ata   Had o o p   Un i v er s it y   o f   K u f a   Co p y rig h ©   2 0 1 9   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts re se rv e d .   C o r r e s p o nd ing   A uth o r :   Ah m ed   Haz i m   A l h ila li,    I n f o r m a tio n   T ec h n o lo g y   R e s e ar ch   an d   Dev elo p m en C en tr e,   Un i v er s it y   o f   K u f a,   Ku f a,   Naj af   Go v er n o r ate,   I r aq .   E m ail:  a h m ed . al h ilali @ u o k u f a. ed u . iq       1.   I NT RO D UCT I O N   R ec en t l y ,   I n f o r m at io n   T ec h n o lo g y   S y s te m s   r ated   as  o n o f   th s i g n i f ican k e y s   to   i m p r o v an d   s u s tai n   th o r g an izatio n s '   b u s in es s es.  T h ed u ca tio n al  s ec t o r   h as  b ec o m o r ien ted   co n s id er ab le  ex ten b y   th tech n o lo g y   [ 1 ] .   Mo s o f   th E d u ca tio n al  i n s tit u tio n s   p r o v id f o r   th eir   s tu d en t s   th a b ilit y   to   u p lo ad   an d   d o w n lo ad   an y   r eq u ir ed   r eso u r ce s   th at  h elp   t h e m   to   co m p lete  an d   s u b m it  as s ig n m e n ts   th r o u g h   a n   o n li n e   p latf o r m   i n s tead   o f   t h tr ad iti o n al  m et h o d s   [ 1 ] .   A ls o ,   th e y   u s d ig ital  s y s te m s   to   co n tr o s ev er al  s er v ices  i n   v ar io u s   ca m p u s   f ac ilit ies  s u c h   as  l ib r ar y   r e g is tr atio n ,   m o n i to r in g   s tu d e n ts   atte n d an ce   a n d   s o   o n .   Ho w e v er ,   d u to   th e   v a s n u m b er s   o f   s er v ices  t h at  th in ter n et  o f f er s   f o r   u s er s ,   I T   in f r astr u ctu r is   h a v i n g   p r o b le m s   d ea lin g   w it h   t h is   m ass iv d a ta.   A s   r esu lt,  th B ig   Dat co n ce p h as  b ee n   u s ed   to   d escr ib th lar g q u an tit ies  o f   s tr u ct u r ed   o r   u n s tr u ctu r ed   d ata,   p r o d u ce d   b y   o r g a n izat io n s ,   co m p a n ies,  an d   in s t itu tio n s   [ 2 ] .   Mo r eo v er ,   th g r ad u at es '   s tu d en ts   ar r esp o n s ib le  f o r   b r in g i n g   m o r d ata  ev er y   y ea r .   Hen ce ,   ed u ca tio n a l   in s t itu tio n s   n ee d   to   u s t h at  d a ta  as a n   as s et  an d   b ec o m d r iv en   b y   it.    B ig   Data   an al y tic s   ca n   i m p r o v m a n y   a s p ec ts   r elate d   to   th ed u ca tio n   p r o ce s s   an d   p r o v id b etter   un d er s ta n d in g   o f   s t u d en t s   [ 3 ,   4 ] .   A l s o ,   n e w   lear n i n g   m e th o d s   ca n   b d i s co v er ed   t h r o u g h   t h ad o p tio n   o f   co n v e n ien B ig   Data   a n al y tic s   to o ls   an d   tech n iq u e s .   T ill  n o w ,   th e   i m p ac t   o f   th e   B ig   Data   o n   t h ed u ca tio n al   in s t itu tio n s   is   l i m ited   w it h   n o   h ig h   s u cc e s s   r a te  [ 2 ] .   A s   w e ll,   th p r o ce s s   o f   ap p l y i n g   a n al y t ics i n   th e   ac ad e m ic   en v ir o n m e n f ac i n g   s o m et h i ca an d   f in a n cial   ch al len g es.  Ho w e v er ,   w it h   p r o p er   m a n a g e m en o f   d ata  an d   a n   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2088 - 8708       A   p r o p o s ed   a r ch itectu r o f b ig   ed u ca tio n a l d a ta   u s in g   h a d o o p   a t th e   . . .   ( A h med   Ya s ee n   Mjh o o l)   4971   ac cr ed ited   g u id elin e,   ed u ca t i o n   in s tit u tes  ca n   tak co n tr o o f   th o s c h alle n g e s .   L ea r n i n g   An al y tic s   in   a n   ed u ca tio n al  i n s tit u tio n   i s   b as ed   o n   th r ee   m o d els,  B e h a v io r al  Mo d el,   C o g n it iv Mo d el  w h ic h   is   e n tire l y   d ep en d en t o n   th e   teac h er ”,   an d   C o n s tr u cti v i s t M o d el  t h at   is   d ep en d en t o n   th e   s t u d en t to   g e t th e   k n o w led g e   b y   th eir   o w n .   T h is   p ap er   p r o p o s ed   th ar ch itect u r o f   b ig   ed u ca tio n a d ata  u n d er   th Had o o p   o p en   s o u r ce   f r a m e w o r k   i n   t h U n iv er s it y   o f   K u f a.   T h ai m   o f   t h r esear c h   is   to   ap p l y   t h co n ce p o f   B ig   Data   a n al y tics   i n   o r d er   to   m an a g t h co llecte d   d ata  th at  ca n n o b h a n d led   w it h   t h tr ad itio n al  m a n ag e m en m e th o d s   a n d   en h a n ce d   th lear n in g   a n d   teac h in g   e x p er ien ce s .   A l s o ,   to   p r o v id r esear ch er s ,   s tu d en ts ,   an d   o th er   b ig   d ata  f an s   p h y s ical  p o w er f u l to o l th at  s u p p o r ts   th eir   p r o j ec ts .     T h p ap er   is   o r g an ized   as  f o llo w s .   Sectio n   2   d is c u s s e s   th r el ated   w o r k s   o f   u s in g   b ig   d ata   in   th ed u ca t io n   s ec to r .   Sectio n   3   d escr ib es  th Uo p er s p e ctiv o f   b ig   ed u ca tio n al   d ata.   Sectio n   4   e x p lain s   th Had o o p   2 . f r am e w o r k .   T h p r o p o s ed   a r ch itectu r h ar d w ar an d   s o f t w a r co m p o n e n ts   ar ex p lai n ed   in   S ec tio n   5 .   Fi n all y ,   t h co n c l u s io n   s ec t io n   s u m m ar ized   th k e y   f in d i n g   o f   th p ap er   a n d   d is cu s s ed   f u tu r e   w o r k s .       2.   RE L AT E WO RK S   C u r r en tl y ,   th o n li n e - lear n i n g   to o ls   s u c h   as   o n li n c h ats,  d is cu s s io n   f o r u m s ,   te x m es s ag es,  d ig ita l   n o tes,  an d   v ar io u s   L ea r n i n g   Ma n ag e m e n S y s te m s   ( L MS)   lik Mo o d le  an d   B lack b o ar d   h as  b ec o m m o r d esira b le  b y   t h u s er s   as t h ese  to o ls   i m p r o v th tr ad itio n al  l ea r n in g   p r o ce s s   b y   m ak i n g   th e   lear n in g   r eso u r ce s   av ailab le  a n y ti m a n d   an y w h e r th r o u g h   t h i n ter n e t.  Us in g   th ese   o n li n s er v ice s   p r o d u ce d   m ass iv e   a m o u n t   o f   d ata  an n u all y .   R e s ea r ch   b y   [ 5 ]   n o ted   t h at  i n   2 0 0 5   th d ata  s ize  w a s   ap p r o x i m ate l y   1 3 0   E x ab y te   an d   i s   s u p p o s ed   to   r ea ch   4 0 , 0 0 0   E x ab y te   ac co r d in g   to   s tati s tics   m a d b y   th d i g ital   u n i v er s e.   T h s ize  o f   d ata  m ad e   ap p licab le  in   th e   ab o v s ce n ar io s   is   s o   tr e m e n d o u s   th a tr ad itio n al  p r o ce s s i n g   tech n iq u es  c an n o b d ep lo y ed   to   p r o ce s s   th e m .   D u to   th lack   o f   co n v e n tio n a d ata  p r o ce s s i n g   ap p licatio n s ,   th ac ad e m ic  in s tit u tio n s   h a v e   s tar ted   r esear ch in g   B ig   Data   t ec h n o lo g ies  to   p r o ce s s   e d u ca tio n al  d ata.   B ig   Data   to o ls   ca n   p lay   v i tal  r o le  in   ed u ca tio n al  i n s t itu t io n s   b ec a u s it f ac ilit ate s   t h p r o ce s s   o f   s t o r in g   an d   r etr iev in g   i n f o r m ati o n   [ 2 ] .   A cc o r d in g   to   [ 6 ] ,   in   th s u cc ess f u ac ad e m ic  in s tit u tio n s ,   B i g   d ata  ca n   b a p p lied   to   cr ea te   th e   co m p letio n   a n d   o u tp lace m en cu lt u r e,   r ed u ce   u n p r o d u cti v cr ed its ,   r ed esig n   t h in s tr u ctio n s   d eliv er y ,   co r s er v ices  th at  i n cl u d h u m an   r eso u r ce s ,   ac ad e m ic  s er v ices,  an d   f i n an ce ,   a n d   o p tim iz th o p er atio n s   an d   o th er   f u n ctio n s .   F u r t h er m o r e,   th is   ar ticle  [ 6 ]   s ta ted   th a ap p ly in g   d ata  m in i n g   co n ce p ts   o n   th s to r ed   d ata  ar b ases   f o r   f u tu r ac ti v it ies  a s s o ciate d   w ith   h i g h er   ed u ca ti o n   o r g an iza tio n s .   Als o ,   D u e   to   th i n cr ea s i n g   d em a n d s   o n   th b ig   a n d   co m p lex   d ata  an al y s i s ,   m an y   r esear ch er s   b ec o m in ter este d   in   t h f ield   o f   d ata   m i n in g   [ 5 ] .   Ho w e v er ,   th Mc Kin s e y   r ep o r s h o w s   th at  th h ig h er   ed u ca tio n   s ec to r   r ep r es en ted   th p o w er - less   lin k   a m o n g   all  t h ar ea s   o f   i n d u s tr y   in   ca p t u r in g   d ata  [ 6 ] .     Had o o p   tech n iq u e   co n s id er ed   as  o n e   o f   th e   s o l u tio n s   th at   ca n   o v er co m p r o b le m s   r elate d   t o   b ig   d at a   in   m a n y   ac ad e m ic  in s tit u tio n s .   Fo r   in s tan ce ,   in   P h o en ix   Un i v er s it y   ( P U)   th er is   an   i s s u o f   th m a s s i v e   v o lu m o f   d ata  s u ch   a s   t h d ata  g e n er ated   b y   d is cu s s io n   f o r u m s ,   t h e y   u s ed   Had o o p   to   d ea w it h   t h at  i s s u e.   T o   p o in o u t   t h p r o b le m s   in   P U,   Had o o p   m ai n l y   s o l v ed   t h e m   w er e   as  f o llo w s f ir s t l y ,   th d ig es tio n   o f   lar g e   d atasets   s u ch   as  ( d is cu s s io n   f o r m   d ata,   w eb   u s ag lo g s ) .   Seco n d l y ,   d ata  an al y s is   f o r   u n s tr u ct u r ed   d ata  b r u n n i n g   s er ie s   o f   s cr ip ts   [ 7 ].   Fu r t h er m o r e,   No ttin g h a m   T r en U n i v er s it y   u s ed   b ig   d ata   co n ce p to   m ea s u r f o u r   as p ec ts   th a t   in d icate   s tu d e n e n g ag e m e n w h ic h   i n cl u d es  s w ip i n g   I c ar d   in to   b u i ld in g s ,   u s in g   th e   lib r ar y ,   a n d   v ir t u al   lear n in g   e n v ir o n m e n u s i n g   el ec tr o n ic  s u b m i s s io n   o f   as s i g n m en ts .   T h e y   f o u n d   th at  q u a r ter   o f   th s t u d en ts   h av lo w   e n g a g e m en t le v el s   d ep en d in g   o n   th r es u lt s   o f   ap p l y i n g   t h m ea s u r e m e n t [ 7 ].       3.   P E RSP E CT I V E   B I G   E DUC AT I O NA L   DA T I Uo K   I n   t h ed u ca tio n al   s ec to r ,   m as s i v a m o u n o f   d ata   is   g en er a ted   ev er y   d a y   d u e   to   t h u s e   o f   th m o d er n   lear n in g   tech n o l o g ies  s u ch   a s   m o b ile  ap p licatio n s ,   s o cial  m ed ia,   o n lin m an ag e m e n s y s te m ,   w eb   r eso u r ce s ,   L MS  s t u d en t   en g a g e m en t s ,   etc.   T h is   s ec t io n   w ill  f o cu s   o n   ap p licatio n s   t h at  o f f er ed   b y   th Uo f o r   t h eir   s t u d en ts ,   e m p lo y ee s ,   a n d   lectu r er s .   U s in g   th f o llo w in g   ap p licatio n s   w il g e n er ate  s ig n i f ica n t a m o u n t o f   d ata  th at   ca n n o t b h a n d led   w it h   tr ad iti o n al  m a n ag e m e n t so f t w ar i n   th n ea r   f u t u r e.         3 . 1 .   E - l ea rning s   d a t a     Mo s o f   th e - lear n i n g   d ata   ar g en er ated   f r o m   th o n l in le ar n i n g   r eso u r ce s   an d   t h u s e   of   th v ir tu a lear n in g   e n v ir o n m en t.  T h Uo p r o v id es  a n   e - lear n in g   p lat f o r m   b a s ed   o n   Mo o d le  f o r   t h eir   s tu d e n ts .   No t   o n l y   t h at  b u al s o   Uo la u n c h ed   n e w   d is ta n ce   lear n i n g   p r o j ec u n d er   Mo o d le  co r to   s er v e   co m m u n it y   lear n in g   d e m a n d s ,   th e   p r o j ec ca lled   Ku f a   Op e n   O n li n C o u r s es  KOO C ,   it   i s   m o s tl y   d ep en d i n g   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   6 Dec em b er   201 9   :   4 9 7 0   -   4 9 7 8   4972   o n   s tr ea m i n g   s h o r v id eo s   to   t h p u b lic   i n   v ar io u s   to p ics  in   o r d er   to   s u p p o r s elf - lear n in g   an d   en r ic h   A r ab ic   lear n in g   r eso u r ce s   o n   th i n ter n et.   A cc o r d in g   to   e - lear n i n g   s er v er   s tatis tic s   as  s ee n   in   F i g u r 1   [ 8 ] ,   th n u m b er   o f   co u r s e s   an d   r eso u r ce s   g en er ated   o n   t h at  p latf o r m   in cr ea s i n g   e v er y   y ea r   d u to   u n i v er s it y   v ie w   a n d   m is s io n .   T h is   v ir t u al   en v ir o n m e n t   en ab le s   b o th   s t u d en ts   a n d   lect u r er s   to   ex c h a n g in f o r m at io n ,   a s k   q u e s tio n s ,   u s i n g   t h d i s cu s s io n   b o ar d   an d   u p lo ad   f iles .   A n al y zin g   t h i s   d ata  w i ll  h elp   t h o r g an iza tio n 's  ad m i n is tr ato r   to   u n d er s ta n d   h o w   to   en r ich   t h p u b lics   an d   s tu d en ts   lear n i n g   ex p er ien ce   as   w ell  as  ac u p o n   th u n e x p ec ted   s itu atio n   a n d   i m p r o v it.           Fig u r 1 .   E - lear n i n g   s er v er   s ta tis tics   [ 8 ]       3 . 2 .   Net w o rk   s er v er s   d a t a     T h n et w o r k   a n d   i n ter n et  s er v ices  s er v e   m o r e   th a n   3 5 0 0   e m p lo y ee   an d   6 5 0 0 0   s t u d en ts ,   u s er   in ter ac tio n s   w it h   th ese  s er v ice s   w i ll  d r a m atica ll y   g e n er ate  lo g s ,   f i les,  r ep o r ts ,   etc.   o n   a   d ail y   b as is .   T h er ef o r e,   h u g a m o u n o f   d ata  w i ll  b e   r ea d y   eit h er   q u ic k l y   m an a g e d ,   p r o ce s s ed   an d   s to r ed   o r   d el eted   d u to   lack   o f   k n o w led g o f   d ea li n g   w it h   r a w   B i g   Data .   I n   s u m m er   2 0 1 8 ,   Uo is   co n s id er ed   n e w   n e t w o r k   s y s te m   w i th   th m o r f le x ib le  s etti n g   to   co n n ec t   an d   m o n ito r   u s er s   to   t h e   s er v ice s ,   th er e f o r e,   m a n y   lo g s ,   r ep o r ts ,   an d   f ile s   w il b g en er ated ,   an d   th en   t h m o r n et w o r k s   f iles   ar g en er ated ,   th d ee p er   k n o w le d g is   d r iv en   ab o u t   Uo K’ s   n et w o r k .     3 . 3 .   Web  s er v er s   da t a   T h u n i v er s it y   p r o v id e s   m a n y   w eb s ites   co v er s   its   ac ti v it ie s ,   n e w s ,   a n d   ev en ts .   A ls o ,   ea ch   f ac u lt y   m e m b er   h as  it s   o w n   w eb s ite  w h er s / h p u b lis h es  e v er y t h i n g   r elate d   s u ch   a s   ev e n ts   a n d   o th er   d ir ec tio n s   to   h is   s t u d en t s .   W ith   m o r th a n   1 6 0 0 0   w eb s ites   f o r   t h teac h i n g   s ta f f   th a co n tai n s   i m p o r ta n i n f o r m atio n   s u ch   as  C u r r icu l u m   Vitae,   co n tact  in f o r m atio n ,   lectu r es ,   a n d   p u b lis h ed   r esear c h es.  As  r es u lt,   h u g a m o u n o f   d ata  r elate d   to   th o s w eb s ite s   ac tiv ate s   ar cr ea ted .       3 . 4 .   Wind o w s   a pp lica t io ns   da t a   A ll   ad m i n i s tr atio n   a n d   m a n a g e m e n s o f t w ar ar d ev elo p ed   b y   t h u n iv er s it y s   p r o g r am m er s   a n d   th at  s o f t w ar b asicall y   w o r k   in   t w o   w a y s   ei th er   lo ca ll y   o n   u s er   co m p u ter   o r   o n   a   s er v e r   th at   co n n ec ted   to   th u n i v er s i t y   in tr a n et.   T h is   o l d - f a s h io n   tec h n iq u p r ev e n ts   d ata  to   g et  b ig g er   b ec au s s i m p ly   th er is   n o   h ar d   d is k   s p ac f o r   it  an d   th er i s   n o   p er s p ec tiv v ie w   s tr ate g y   o n   d ata.   Data   s h o u ld   b lev er ag ed   in   t h r ig h w a y   in   o r d er   to   g et  m ea n i n g f u l i n f o r m at io n   o u t o f   i t a n d   th is   is   w h at  f u l l B ig   Data   s y s te m   d o es.     3 . 5 .   Stude nts i nfo r m a t io n sy s t e m’s da t a     T h SIS  is   lo ca ap p licatio n   s er v er   u s ed   to   r eg i s ter   an d   m a n ag e   s t u d en t s   d ata  d u r i n g   t h eir   li f e   s tu d y   at  Uo K.   SIS’ s   d ata  ac cu m u late  all  p o s s ib le  s t u d en ts   d ata  s u c h   as  p er s o n al  in f o r m at io n ,   i m a g es,   u p lo ad ed   f iles ,   I ca r d ,   o f f ici al  d o cu m e n ts ,   a n d   ac ad e m ic  r ec o r d s .   C u r r en tl y ,   a th ti m o f   w r i tin g   t h is   p ap er   an d   ac co r d in g   to   U o m a in   w eb s i te,   m o r th a n   6 5 2 5 0   s tu d en ts   ar r eg i s ter ed   in   t h s y s te m   a n d   th i s   n u m b er   in cr ea s i n g   ar o u n d   6 0 0 0   s tu d en ts   y ea r l y .   He n ce ,   t h Uo n ee d s   an   i n tel lig e n t   s o lu tio n   a n d   to   b r ea d y   f o r   d ea lin g   w i th   B i g   Data   co m i n g   u p   in   th n ea r   f u t u r e.   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2088 - 8708       A   p r o p o s ed   a r ch itectu r o f b ig   ed u ca tio n a l d a ta   u s in g   h a d o o p   a t th e   . . .   ( A h med   Ya s ee n   Mjh o o l)   4973   3 . 6 .   Da t a s et s   re p o s it o ry   f o r   re s ea rc hers   I n   Uo K,   d ata  g ettin g   b ig g er   e v er y   d a y   a n d   th er is   n o   clea r   v is io n   o n   t h d ata.   A ca d e m ic  r esear ch er   an d   s ch o lar   m u s g et  s a f an d   ea s y   ac ce s s   p lace   f o r   th e ir   B ig   Data   s et s   to   d o   th eir   r esear ch   w o r k   an d   s a v e   b ac k   th r es u lt s ,   th u s ,   a   r eliab l s to r ag p lace   w ill b b en e f ic ial  to   o th er   s ch o lar s   to   k ee p   wo r k in g   o n   t h s a m e   d atasets   w it h i n   d ef er e n r ese ar ch   ap p r o ac h .   A l s o ,   g r o u p i n g   B i g   Data   s ets  o n   t h s a m d is k   s p ac w i ll   en co u r ag r esear c h er s   to   p r o p o s s o lu tio n s   b ased   o n   g iv e n   p r o b lem s .   A s   r esu l t,  o u r   p r o p o s ed   w o r k   w il b th b est p lace   f o r   th o s w h o   ar d ea lin g   w it h   B ig   Da ta  s ets.       4.   H ADO O P   2 . X   Had o o p   is   an   o p en - s o u r ce   f r a m e w o r k   f o u n d ed   b y   A p ac h f o u n d atio n ,   a n d   i i s   u s ed   f o r   s to r in g   a   m as s i v a m o u n o f   d ata  [ 4 ]   a n d   r u n n in g   an al y s is   ap p licatio n s   ac r o s s   s et  o f   n o d es  w h ic h   b u il d   o n   ch ea p l y   p r iced   h ar d w ar [ 9 ] .   I o f f er s   m as s i v tech n iq u o f   s to r a g f o r   an y   t y p o f   d ata,   tr e m en d o u s   p r o ce s s in g   ca p ab ilit y ,   an d   t h co m p e ten ce   to   h a n d le  v ir t u all y   u n li m it ed   co n cu r r en j o b s   o r   task s .   T h n e w   v er s io n   o f   Had o o p   2 . x   m a in l y   ca m u p   with   t h r ee   p ar ts   [ 10 ]:   a.   HDFS is   d is tr ib u ted   f i le  s y s t e m   th a t h a n d les lar g d ata  s et s   r u n n in g   o n   co m m o d it y   h ar d war e.   b.   Ma p R ed u ce   is   t h h ea r o f   Ha d o o p   an d   p r o g r am m i n g   p ar ad ig m   t h at  e n ab les  m as s i v s ca lab ilit y   ac r o s h u n d r ed s   o r   th o u s a n d s   o f   s er v er s   in   clu s ter .   c.   YARN  i s   o n e   o f   t h co r c o m p o n en t s   a n d   r eso u r ce   m a n ag e m e n a n d   j o b   s ch ed u li n g   tec h n o lo g y   in   Had o o p .   I is   r esp o n s ib le  f o r   allo ca tin g   s y s te m   r eso u r ce s   to   th v ar io u s   ap p licatio n s   r u n n i n g   in   Had o o p   clu s ter   a n d   s ch ed u li n g   ta s k s   to   b ex ec u ted   o n   d if f er en t c l u s t er   n o d es.      4 . 1 .   Why   is   h a do o p i m po rt a nt?     Du to   th e   r ap id   in cr ea s e   o f   d ata  s ize  in   s o cial  m ed ia  a n d   th i n ter n et  o f   t h i n g s   ( I o T ) ,   Had o o p   co n s id er s   as  s o lu t io n   t h at  ca n   s to r v ast  a m o u n o f   d if f e r en t y p o f   d ata  an d   p r o ce s s   it  q u ick l y .   Mo r e,   d is tr ib u ted   co m p u ti n g   m o d el  g iv e s   Had o o p   th ab ilit y   to   p r o ce s s   B ig   Data   in   f a s m a n n er   [ 11 ] .   A s   r esu lt,   u s i n g   d is tr ib u ted   m o d el  lea d s   to   m o r p o w er f u p r o ce s s .   Fu r t h er m o r e,   Had o o p   h an d les  n o d f ail u r i n   t h clu s ter   ef f icie n tl y   b y   r ed ir ec tin g   th d ata  to   th o th e r   w o r k i n g   n o d an d   r ep licate  th d ata  x - ti m e s   au to m at icall y   ac co r d in g   to   t h s y s te m   s ett in g .   Mo r eo v er ,   f l ex ib ilit y ,   s ca lab ili t y ,   a n d   lo w   co s m a k Had o o p   o n o f   th b est o p en - s o u r ce   f r a m e w o r k   u s ed   t o   an al y ze   B ig   Data   [ 12 ].     4 . 2 .   Da t a   t ra ns po rt a t io n   T h is   s ec tio n   co v er s   th e   m ai n   s o f t w ar th at   ca n   p u s h   w h at ev er   d ata  w h av e   to   t h Ha d o o p   Fil S y s te m   ( HDFS)  f o r   f u t u r p r o ce s s in g .   I n   th i s   p r o p o s ed   m o d el,   w g a v t h s y s te m   ad m i n is tr ato r s   m u ltip l e   w a y s   to   h a n d le  d ata  b et w ee n   l o ca l sto r ag an d   HDFS  s u c h   a s   b elo w   [ 11 ] .     4 . 2 . 1 .   Apa che  f lu m e   A p ac h Flu m is   s er v ice  f o r   ef f icie n tl y   co llecti n g ,   ag g r eg atin g ,   an d   m o v i n g   lar g a m o u n ts   o f   d ata   to   HDFS.  I is   r eliab le  an d   d is tr ib u ted   f r a m e w o r k   t h at  h a s   s i m p le  an d   f lex ib le  s tr u ct u r b ased   o n   s tr ea m in g   d ata  f lo w s .   I t is r o b u s t a n d   f au lts   to ler an w it h   t u n ab le  r eliab i lit y ,   m an y   f ailo v er s ,   a n d   r ec o v er y   m ec h an is m s .     4 . 2 . 2 .   Apa che  s qo o p   A p ac h Sq o o p   u s ed   to   m o v s tr u ct u r ed   d ata  f r o m   lo ca ll y   s t o r ed   SQL   d atab ases   in to   HDF in   o r d er   to   b in g ested   b y   A p ac h HB a s f o r   f u r th er   p r o ce s s i n g   [ 1 3 ] .   T h u s ,   all  th ac ad e m ic s   d atab ases   ca n   b li n k ed   to   Sq o o p ,   w h ic h   ca n   also   b s ch ed u led   to   in g est d ata  r eg u lar l y ,   to   g et  an y   d ata  u p d ates.     4 . 3 .   Sa v ing   a nd   pro ce s s ing   da t a   Flu m e,   Sq o o p   o r   o th er   f r a m e w o r k s   th at  tr a n s p o r lo ca d ata,   is   ch o p p in g   an d   s to r i n g   d ata  o n   th HDF S.  Data   in   HDFS  i s   s ca tter ed   o v er   clu s ter   n o d es  f o r   b u ilt - in   f au lt  to ler an ce .   HDFS  h a s   o n m as ter   n o d ( n a m n o d e)   an d   m a n y   s lav n o d es  ( d ata  n o d es)  an d   th at  n o d es  r esid o n   co m m o d it y   co m p u ter s   an d   ea ch   n o d o f f er s   lo ca s to r ag an d   co m p u tat io n   [ 11 ] .   T h n a m n o d s to r es  m etad ata  w h er ea s   d ata  n o d es  s to r es d ata  b lo ck s .   Fig u r 2   [ 4 ,   1 4 ]   s h o w s   t h b asic H ad o o p   p r in cip les f o r   s to r in g   an d   q u er y in g   B ig   Da ta.       Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   6 Dec em b er   201 9   :   4 9 7 0   -   4 9 7 8   4974       Fig u r 2 .   B asic H ad o o p   p r in ci p les f o r   s to r i n g   an d   q u er y in g   B ig   Data   [ 4 ,   1 4 ]       4 . 3 . 1 .   Apa che  H B a s e   I is   co lu m n - o r ien ted   d atab ase  m an a g e m e n s y s te m   t h at  r u n s   o n   to p   o f   HDFS.  I is   g o o d   f o r   s p ar s d ata  s ets,  w h ic h   ar co m m o n   i n   m a n y   B ig   Data   u s ca s e s .   H B ase   is   n o t li k r elatio n al  d a tab ase  an d   d o es n o s u p p o r SQL   la n g u a g e.   HB as ap p licatio n s   ar w r itte n   in   J av an d   s u p p o r w r iti n g   ap p licatio n s   i n   Av r o ,   R E ST ,   an d   T h r if t.  HB ase   h a s   s et  o f   tab les.  E ac h   tab le   co n tain s   r o w s   a n d   co lu m n s   a n d   m u s h a v p r i m ar y   k e y .   T h is   k e y   u s ed   to   ac ce s s   HB ase  tab les [ 1 4 ].     4 . 3 . 2 .   Apa che  zo o k ee per   Z o o k ee p er   is   an   o p en   s o u r c s o f t w ar th at  p r o v id es  ce n tr alize d   in f r as tr u ct u r an d   s e r v ices  t h at   en ab le  s y n c h r o n izat io n   ac r o s s   Had o o p   clu s ter .   I m ai n tai n s   s h ar ed   o b j ec ts   r eq u ir ed   in   lar g e   clu s ter   en v ir o n m e n t s .   I n   s i m p le  w o r d s ,   th e   zo o k ee p er   is   d ev e lo p ed   f o r   co o r d in atin g   a n d   m a n a g i n g   s er v ices   b et w ee n   clu s ter   f o r   th i s   ca s zo o k ee p er   n ee d   to   b in s talled   in   d is tr ib u ted   m o d e,   it  is   r esp o n s ib le  f o r   tr ac k in g   an d   r ec o r d in g   f ail u r es o f   j o b s   ass i g n ed   f o r   s p ec if ic  tas k   [ 1 4 ].     4 . 4 .   Da t a   a na ly t ics a nd   v is ua liza t io n   An al y zin g   d ata  is   n o e n o u g h   u n less   it   is   s h o w n   i n   a n   e as y   w a y   to   u n d er s tan d   s i m p l g r ap h   to   th o r d in ar y   u s er s   a n d   th i s   ca n   b d o n u s in g   cu t tin g - ed g te ch n o lo g ies s u c h   as t h to o ls   li s ted   b elo w :     4 . 4 . 1 .   Apa che  pig   A p ac h P ig   r ep r esen t s   B i g   Data   an al y s is   p lat f o r m   th at   ca n   ex p r es s   a n d   ev al u ate  d at an al y s i s   p r o g r am s   d u to   its   h ig h - lev el - la n g u a g an d   in f r astr u ct u r e.   T h a m en ab le  p ar alleliza ti o n   s tr u ct u r o f   P i g   p r o g r am s   co n s id er ed   ess e n tial   f ea t u r es  t h at  e n ab le  t h e m   to   d ea w i th   m a s s i v d atase ts   p r ec is el y .   C u r r en tl y P ig s   i n f r astr u ctu r la y er   in cl u d es  co m p iler   w h ic h   g en er ates  s eq u e n ce s   o f   Ma p - R ed u ce   p r o g r am s   an d   it   u s e s   P ig   L ati n   a s   s cr ip tin g   la n g u a g e.   T h L a tin   s cr ip t in g   la n g u a g h a s   t h f o llo win g   ch ar ac ter i s tics :   p r o g r am m i n g   ea s il y ,   o p ti m iza tio n   o p p o r tu n ities   a n d   ex te n s i b ilit y .     4 . 4 . 2 .   Apa che  hiv e   A p ac h Hi v is   d ata  w ar eh o u s p lat f o r m   t h at  f ac ili tates   th p r o ce s s e s   o f   r ea d i n g ,   w r itin g ,   an d   m an a g i n g   h u g d ataset s   h o s t ed   in   d is tr ib u ted   s to r ag s y s te m .   W it h   co m m a n d   li n i n ter f ac a n d   J DB C   d r iv er   h iv ca n   co n n ec t u s er s   t o   its   f r a m e w o r k .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2088 - 8708       A   p r o p o s ed   a r ch itectu r o f b ig   ed u ca tio n a l d a ta   u s in g   h a d o o p   a t th e   . . .   ( A h med   Ya s ee n   Mjh o o l)   4975   4 . 4 . 3 .   Apa che  ze pp eli n   I is   w eb - b ased   n o teb o o k   th at  en ab les  in ter ac ti v d ata  an a l y tic s .   Z ep p elin   is   n e w   a n d   in cu b ati n g   m u lti - p u r p o s ed   w eb - b ased   n o t eb o o k   w h ic h   b r in g s   d ata  i n g e s tio n ,   d ata   ex p lo r atio n ,   v i s u al i za tio n ,   s h ar i n g   an d   co ll ab o r atio n   f ea tu r e s   to   Had o o p   [ 1 5 ] .   I is   n ee d ed   to   s h o w   g r ap h s   an d   c h ar ts   o f   b i g   e d u ca tio n al  d ata  to   th u s er .     4 . 5 .   I nfo r m a t io n a nd   kn o w ledg e   A ll   d ata  a n al y tics   f r o m   t h f ir s s tep   o f   m i n i n g   to   v is u alizi n g   ai m   to   s h o w   t h p o w er   o f   h i d d en   d ata.   T h is   led   u s   to   g et  n e w   k n o w l ed g ab o u w h at  w k n o w   r el ated   to   th b u s i n es s   m o d el,   th u s   t h at  k n o w led g e   w o u ld   e m p o w er   d ec is io n   m a k er   to   tak cr itical  d ec is io n   f o r   im p r o v i n g   t h eir   b u s i n es s .   Au to m a ted   d ec is io n   m ak in g   ca n   h ap p en   w it h   t h h elp   o f   m ac h in lear n in g   a l g o r ith m s   [ 11 ] .     4 . 6 .   M a chine le a rning   I n   th is   f ield   w co n s id er ed   w e k s o f t w ar e,   it  is   co llectio n   o f   m ac h in lear n in g   alg o r it h m s   f o r   d ata  m i n in g   tas k s   [ 1 3 ] .   W ek s u p p o r d is tr ib u tio n   task s   w it h   t w o   p ac k ag es  ass ig n   to   th is   p u r p o s e,   th f ir s o n is   tied   to   Had o o p   p latf o r m   ca ll ed   Dis tr ib u ted W ek aHa d o o p 2   an d   th s ec o n d   o n i s   tied   to   SP A R p lat f o r m   ca lled   Dis tr ib u ted   W ek aSp ar k .     4 . 6 . 1 .   Apa che  m a ho ut   I ai m s   to   tr an s f o r m   B ig   D ata  in to   b i g   i n f o r m atio n   b y   p r o v id in g   s ca lab le  m ac h in e   lear n i n g   alg o r ith m s   lib r ar y   t h at  ca n   b u s ed   o n   to p   o f   A p ac h Had o o p   an d   th Ma p R ed u ce   m o d el.   A s   w el as,   Ma h o u o f f er s   d ata  s cien ce   t o o ls   u s ed   to   ex p lo r m ea n i n g f u p atter n s   in   B ig   Data   s et s .   E q u all y   i m p o r tan t,   Ma h o u t   s u p p o r ts   f o u r   m aj o r   d ata  s cie n ce   u s e   ca s e s   w h i ch   i n cl u d e:  C o llab o r ativ f il ter in g ,   C l u s ter in g ,   C las s i f icatio n ,   a n d   Fre q u en t i t e m s et  m i n i n g .       5.   RE S E ARCH   M E T H O DO L O G   I n   th i s   s ec tio n ,   w w i ll  b r ief l y   d escr ib t h h ar d w ar e,   s o f t w ar co m p o n en ts   an d   t h e   tech n ica l   s tr u ct u r o f   th e m .   I n   t h p r o p o s ed   s y s te m ,   ei g h tee n   ac co m m o d ate  co m p u ter s   w er u s ed   an d   th o s m a y   co m e   u p   w i th   d i f f er e n h ar d w ar s p ec if icatio n s   ( s p ec )   an d   at  leas ac co r d in g   to   th m i n i m u m   c o m p u ter   s p ec   th at   ca n   r u n   t h b asic  s o f t w ar m o s en d   u s er s   o p er ate,   w h ich   is   ( Du al  co r 2 . 4   GHz   P r o ce s s o r ,   8   GB   R A M,   3 2 0   GB   5 4 0 0   R P h ar d   d r iv e)   [ 1 6 ] ,   h o w e v er   w w ill  co n s id er   T ab le  1   [ 1 7 ]   s p ec   as  s ee n   b elo w   f o r   th p r o p o s ed   w o r k .       T ab le  1 .   C lu s ter   r eq u ir e m e n t s   I t e m   D e scr i p t i o n   M a s t e r   D e sk t o p ,   l a p t o p ,   o r   a c c o mm o d a t e   se r v e r   N o d e s   D e sk t o p   o r   l a p t o p   S w i t c h   N e t g e a r   P r o S a f e   2 4   N e t w o r k   C a b l i n g   C A T 6   Et h e r n e t   p a t c h   c a b l e   R A M   A t   l e a st   8   G B   p e r   n o d e   H a r d   d i s k   A t   l e a st   5 0 0   G B   p e r   n o d e   En c l o su r e   ( sh e l f   o r   r a c k )   A   4 2 U   1 9 "   r a c k   o r   c h e a p   I K E A   sh e l v e   S o c k e t   m u l t i p l i e r   A n y   t y p e     P o w e r   S u p p l y   ( U P S )   Ex .   1 0   n o d e s o f   A c e r   X 1 7 0 0   a t   2 2 0   W a t t s e a c h   a mo u n t   t o   2 2 0 0 / 1 2 0   =   1 8 . 4   A mp e r e s,       As  s ee n   i n   F ig u r 3 ,   o n co m p u ter   ass ig n ed   as  m a s ter   ( Na m eNo d e )   th at   o n l y   s to r es  th e   m etad ata  o f   HDFS,  tr ee   d ir ec to r y   o f   al f iles   in   t h f ile  s y s te m   a n d   tr ac k s   f iles   ac r o s s   t h cl u s ter ,   ac co m m o d ate  Dell   s er v er   as s i g n ed   a s   m a s ter   m ac h in e   w it h .   An o th er   co m p u ter   s u p p o r ted   as  s ec o n d ar y   Na m eNo d as   r ec o v er y   i m a g t o   th m aster   Na m eNo d in   ca s it  f ail s .   T h r est  1 6   co m p u ter   tr ea ted   as  s lav e s   ( Data No d e)   to   th m as ter   in   o r d er   to   r u n   m ap - r ed u ce   j o b s   in   th p ar allel  task .   W ca n   d ep lo y   Data No d w i th i n   Na m eNo d e’ s   co m p u ter   j u s f o r   u s in g   m o r r eso u r ce s ,   s am th i n g s   w i t h   s ec o n d ar y   N a m eNo d co m p u ter .   As  r esu lt,  w w ill  g et  cl u s t er   w it h   at  least  th f o llo w in g   s p ec   ( 1 8   x   Du al  co r 2 . 4   GHz   P r o ce s s o r ,   1 4 4   GB   R A M,   5 . 7 5   T B   5 4 0 0   R P h a r d   d r iv e) .   T h o p er atin g   s y s te m   o f   t h co m p u ter s   is   L in u x   C en to s   6 . 5   an d   b y   u s i n g   Net g ea r   s w i tc h ,   t h ese  co m p u ter s   ar g i v en   s tatic  I P s   a n d   co n n ec ted   a s   lo ca l n et w o r k   to   b attac h ed   to   th in tr an et  n et w o r k   o f   Uo K .   B r ief l y ,   o th er   h ar d w ar r eq u ir e m e n t s   f o r   b u ild in g   a n d   in s tal lin g   Had o o p   clu s ter   f r o m   co m m o d it y   co m p o n en ts   ca n   b f o u n d   i n   T ab le  1 .   Mo r tech n ical   d etails  i n   t h is   r ep o r [ 1 7 ].   A ll t h m en tio n ed   co m p o n e n t s   ab o v w i ll b co n n ec ted   as a   s t ar   n et w o r k   to p o lo g y   a s   s ee n   in   F i g u r 3 .     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   6 Dec em b er   201 9   :   4 9 7 0   -   4 9 7 8   4976       Fig u r 3 .   T h p r o p o s ed   s tr u ctu r e       T h p r o p o s ed   a r ch itectu r is   d iv id ed   in t o   f o u r   m aj o r   lay er s   as  s ee n   in   F ig u r 4 ( 1 )   L o ca Data   L a y er ,   ( 2 )   T r an s p o r tatio n   Data   L a y er ,   ( 3 )   Pro ce s s in g   an d   S to r in g   Data ,   ( 4 )   Data   A n a l y tic s   an d   Vis u aliza tio n   L a y er .   T h f ir s la y er   i s   t h m ain   d ata  g e n er ato r   w h ic h   in cl u d es  m a n y   s y s te m s ,   ap p licatio n s   a n d   d ev ices  lik e   s er v er s ,   co m p u ter s ,   d ig ital  l i b r ar ies,  w eb s ites ,   etc.   T h s ec o n d   la y er   co n s i s ts   o f   m a n y   h i g h l y   r eliab le  m ec h a n i s m   f r a m e w o r k s   t h at  r esp o n s ib le  to   m o v d ata  ea s il y   an d   s af el y   o n   to p   o f   th d is tr i b u ted   s y s te m ,   t h u s ,   s elec ti n g   a   s p e ci f ic  f r a m e w o r k   d ep en d s   o n   s p ee d   an d   t y p o f   d ata  t h r o w n   f r o m   m ac h i n e s .   L a y er   2   h as  t w o   m et h o d s   f o r   tr an s p o r tatio n   d ata,   f ir s o n is   ca l led   s e m i - a u t o m a ted   m et h o d   th at  a llo w s   u s er s   an d   s y s te m s   to   u p lo ad   d ata  in to   lo ca s h ar ed   s p o o lin g   d ir ec to r y   o n   r eg u l a r   b asis   to   let  Flu m an d   Sq o o p   g ettin g   d ata  in to   HDFS;  s ec o n d   o n is   ca lled   f u ll y - a u to m ated   m et h o d   w h ich   is   cu s to m izin g   Fl u m o r   Sq o o p   w it h   s p ec ial   s cr ip to   b co n n ec ted   w it h   lo ca m ac h in e s .   T h th ir d   la y er   h as  t h m a in   co r es  o f   Had o o p   ( Ma p R ed u ce   an d   HD FS )   an d   o th er   s o f t w ar t h at  m an a g es  ta s k s   an d   j o b s f o r   in - m e m o r y   a n d   r ea l - ti m p r o ce s s in g ,   A p ac h e   Sp ar k   is   t h b est ch o ice  f o r   th at  m atter .   T h last   f o u r th   la y er ,   it h as a ll a p p licatio n   t h at  ca n   clea n ,   s o r t,  an al y ze   an d   v i s u al ize  d ata  in   o r d er   to   d ev elo p   s m ar m o d el  w i th   t h ab ilit y   to   tak d ec is io n   f o r   s o lv in g   ce r tai n   p r o b lem   u n d er   Ma h o u Fra m e w o r k .           Fig u r 4 .   P r o p o s ed   a r ch itectu r e   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g     I SS N:  2088 - 8708       A   p r o p o s ed   a r ch itectu r o f b ig   ed u ca tio n a l d a ta   u s in g   h a d o o p   a t th e   . . .   ( A h med   Ya s ee n   Mjh o o l)   4977   6.   CO NCLU SI O   T h p r o p o s ed   B ig   Data   ar ch i tectu r is   o b s o lete,   a n d   n e w   d ata  m o d el  th at  in te g r ates  Had o o p   to   th e x is tin g   s y s te m s   is   s tr u ct u r ed   o n   I n f o r m atio n   T ec h n o lo g y   S y s te m s '   w o r ld   o f   Uo K.   T h er ef o r e,   th d es ig n   is   o f f er ed   o n   p r iv ate  n et w o r k ,   an d   it  i s   d esi g n ed   to   b u s e d   as  B ig   Data   L ab   f o r   s tu d e n ts   a n d   r esear ch er s   an d   as   s o lu tio n   f o r   g r o w i n g   B i g   E d u ca t io n al  Data   i n   U o K.   W r ec o m m e n d   co n s id er in g   Had o o p   o p en - s o u r ce   s o f t w ar a n d   it s   e n v ir o n m e n s o f t w ar o n   a   p r iv ate   n et w o r k   an d   m a n a g in g   b y   U o K’ s   e n g i n ee r s ,   a n d   n o u s i n g   p u b lic  c lo u d   s o l u tio n s   th at   o f f er ed   b y   b i g   s o f t w ar co m p an ie s   li k Go o g le  o r   Am az o n ,   b ec a u s th e   last   o n is   e x p en s i v esp ec ial l y   f o r   u n i v er s it y   i n   d ev el o p in g   co u n tr y   l ik I r aq .     T h u s ,   th e v o lu tio n   o f   o p en - s o u r ce   p r o d u cts  f o r   m a n ag i n g   a n d   a n al y zin g   ed u ca ti o n al  d ata  w i ll  al lo w   I r aq u n i v er s itie s   to   b e n e f it   f r o m   th is   n e w   tr e n d   th at  e m p o w er s   to d a y s   ed u ca tio n .   I n   o u r   f u t u r r esear ch ,   w i n te n d   to   im p le m e n t h p r o p o s ed   d esig n   i n   m u ltip le  n o d Had o o p   clu s ter s   an d   ev al u ate  its   p er f o r m an ce   w o r k in g   w it h   s tr u ct u r ed   d ata  f r o m   o u r   u n i v er s it y   L MS  a n d   u n s tr u ct u r ed   d ata  f r o m   So cial  m ed ia.       RE F E R E NC E S   [1 ]   V .   V a tsa la,  e a l . ,   A   Re v ie w   o f   Big   Da ta  A n a l y ti c in   S e c to o f   Hig h e Ed u c a ti o n ,   I n t.   J .   E n g .   R e s.  Ap p l . ,   v o l.   7 ,   p p .   2 5 - 3 2 ,   2 0 1 7 .   [2 ]   B.   L o g ica   a n d   R.   M a g d a len a ,   U sin g   Big   Da ta  in   th e   A c a d e m ic  En v iro n m e n t,   Pro c e d i a   Eco n .   F in a n c . ,   v o l.   3 3 ,   p p .   2 7 7 - 2 8 6 ,   2 0 1 5 .   [3 ]   B.   M a n ju lath a ,   e a l . ,   Im p le m e n tatio n   o f   Ha d o o p   Op e ra ti o n f o Big   Da ta   P ro c e ss in g   in   Ed u c a ti o n a In stit u ti o n s,”   In t.   J .   I n n o v .   Res .   C o mp u t.   C o mm u n .   En g . ,   v o l.   4 ,   2 0 1 6 .   [4 ]   P.   S.   G .   A .   S ri  a n d   M .   A n u sh a ,   Big   d a ta  su rv e y ,   In d o n e sia n   J o u rn a o El e c trica E n g i n e e rin g   a n d   In fo rm a t ics v o l.   4 ,   2 0 1 8 .   [5 ]   H.  F a tl a w i,   e a l . ,   A n   e ff icie n h y b rid   m o d e f o re li a b le  c las si f i c a ti o n   o f   h ig h   d im e n sio n a d a ta  u sin g   k - m e a n s   c lu ste rin g   a n d   b a g g in g   e n se m b le cla ss i f ier,”  J .   T h e o r.  A p p l .   In f .   T e c h n o l . ,   v o l .   9 6 ,   p p .   8 3 7 9 - 8 3 9 8 ,   2 0 1 8 .   [6 ]   J.  M u r u m b a   a n d   E.   M ich e n i,   Big   Da ta  A n a l y ti c in   Hig h e Ed u c a ti o n A   Re v ie w ,   In t.   J .   En g .   S c i . ,   v o l.   6 ,   p p .   1 4 - 2 1 ,   2 0 1 7 .   [7 ]   N.  Ba k e r,   3   Un iv e rsiti e s   T h a Ar e   Us in g   Bi g   Da t a   -   QS,   2 0 1 7 .   Av a il a b le:  h tt p s:// w ww . q s.c o m /3 - u n iv e rsiti e s - th a t - a re - u sin g - b ig - d a ta/? f b c li d = Iw AR 2 e H_ 8 S t o p g X HIln G n 5 IQv n w IKm DQ V M _ x T W Zc5 o q 6 F Dp 4 _ v w Nk Uz G 4 x ZOQ.    [8 ]   In f o rm a ti o n   T e c h n o lo g y   R e se a r c h   a n d   De v e lo p m e n Ce n tre  Un iv e rsit y   o f   Ku f a ,   E - lea rn in g   se rv e st a ti stics ,   2 0 1 8 .   A v a il a b le:  h tt p :/ /ele a rn i n g . u o k u f a . e d u . i q /?p a g e _ id = 1 0 0 .   [9 ]   J.  P a rso la,  e a l . ,   P o st   Ev e n I n v e stig a ti o n   o f   M u lt i - stre a m   V id e o   Da ta  Util izin g   Ha d o o p   Cl u ste r,   In t.   J .   El e c tr.  Co mp u t .   E n g . ,   v o l.   8 ,   p p .   5 0 8 9 ,   2 0 1 8 .   [1 0 ]   A p a c h e   Ha d o o p ,   Ha d o o p     A p a c h e   Ha d o o p   2 . 9 . 2 ,   2 0 1 8 .   A v a il a b le:  h t tp s:// h a d o o p . a p a c h e . o rg / d o c s/r2 . 9 . 2 /.     [1 1 ]   W .   T o m ,   Ha d o o p T h e   De f in it i v e   G u id e ,”   F o u rth   Ed it io n   T h e   De fi n it ive   Gu i d e   S t o ra g e   a n d   A n a lys is  a I n ter n e S c a le,   2 0 1 5 .   [1 2 ]   In sig h ts S A S ,   W h a is Ha d o o p ?   A v a il a b le:  h tt p s: // ww w . sa s.c o m / e n _ u s/i n sig h ts/b ig - d a ta/h a d o o p . h t m l.     [1 3 ]   W a ik a to   Un iv e rsit y ,   M a c h in e   L e a rn in g   a t   W a i k a to   Un iv e rsit y .   A v a il a b le:  h tt p s:/ /www . c s. w a i k a to . a c . n z /m l/ in d e x . h tm l.     [1 4 ]   K.  S in   a n d   L .   M u t h u ,   A p p li c a ti o n   o f   Big   Da ta  in   Ed u c a ti o n   Da t a   M in i n g   a n d   L e a rn in g   A n a ly ti c s     a   L it e ra tu re   Re v ie w ,   ICT ACT   J .   S o f Co m p u t . ,   v o l.   5 ,   p p .   1 0 3 5 - 1 0 4 9 ,   2 0 1 5 .   [1 5 ]   Ho rto n w o rk s In c . ,   A p a c h e   Zep p e li n .   A v a il a b le:  h tt p s:// h o rt o n w o rk s.c o m /ap a c h e /ze p p e li n /.     [1 6 ]   Clark   Un iv e rsit y ,   O u Re c o m m e n d e d   Co m p u ter  S p e c if ica ti o n s.”   A v a il a b le:   h tt p s:/ /www 2 . c lark u . e d u /o f f ice s/it s/p u rc h a si n g /rec o m m e n d a ti o n s.c fm .   [1 7 ]   J.  L .   L e id n e a n d   G .   B e ro sik ,   Bu il d in g   a n d   In sta ll i n g   a   Ha d o o p /M a p Re d u c e   Clu ste f r o m   Co m m o d it y   Co m p o n e n ts,”  L OG IN ,   v o l.   3 5 ,   2 0 1 0 .       B I O G RAP H I E S   O F   AUTH O RS       Ahm e d   M jh o o l   g o h is BS c .   De g re e   in   c o m p u ter en g in e e rin g   f o r m   Un iv e rsit y   o f   T e c h n o lo g y /Iraq   in   2 0 0 9   a n d   m a ste r’s  d e g re e   in   c o m p u ter  e n g in e e rin g   f o r m   F lo rid a   In stit u te  o f   T e c h n o lo g y US A   in   2 0 1 7 .   Du r in g   h is  m a ste r   stu d y ,   M jh o o h a d   a n   in d u strial  e x p e rien c e   w it h   b ig   c o m p a n ies   su c h   a G E   a n d   A lsto m   a F lo rid a   site.  Af ter   th a t,   h e   j o in e d   IT   re se a rc h   c e n t e a a   re s e a rc h e a n d   c o ll e g e   o e n g in e e rin g   a a   l e c tu re a th e   Un iv e rsit y   o f   Ku fa .   His  re se a r c h   to p ics   in tere st  a re   Big   Da ta   A n a l y ti c s,  M a c h in e   L e a rn in g   A l g o rit h m s,  A p a c h e   Ha d o o p ,   S p a r k ,   Co m p lex   E m b e d d e d   S y ste m s,   In tern e o f   T h in g s,  a n d   W irele ss   S e n so Ne tw o rk s.       Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  9 ,   No .   6 Dec em b er   201 9   :   4 9 7 0   -   4 9 7 8   4978       Ahm e d   H a z i m   Al h il a li   re c e iv e d   th e   BS c .   De g re e   in   c o m p u ter  sc i e n c e   f ro m   I m a m   Ja ' a f a r   A l - S a d iq   Un iv e rsit y   in   Co m p u ter  S c ien c e   i n   2 0 0 9   a n d   t h e   M a ste d e g re e   in   In f o rm a ti o n   T e c h n o l o g y   f ro m   th e   Un iv e rsit y   o Tec h n o lo g y   S y d n e y ,   S y d n e y ,   A u stra li a ,   in   2 0 1 6 .   M y   p ro jec re se a r c h   f o c u se s   o n   th e   c lo u d   c o m p u ti n g   p rici n g   m o d e ls  to   p r o v id e   a   c o m p a ra ti v e   s tu d y   t h a h e lp t h e   e d u c a ti o n a in stit u ti o n to   c h o o se   th e   su it a b le   o n e   d e p e n d in g   o n   a   g ro u p   o f   f a c to rs.  Oth e re se a rc h   in tere sts  a r e   He a lt h c a re   M o n it o rin g   S y ste m s,  I n tern e o f   T h in g s (Io T ),   A tt e n d a n c e   M o n it o rin g   S y ste m s.     S a la m   Al - a u g b y   re c e i v e d   h is  BS c .   De g re e   in   El e c tro n ic  a n d   El e c tri c a En g in e e rin g   f ro m   M EC  in   1 9 9 7   a n d   t h e   M a ste d e g re e   in   Co m p u ter  S c ien c e   f ro m   th e   Un iv e r sity   o Tec h n o lo g y ,   Ira q   in   2 0 0 5 .   He   g o h is  P h d e g re e   in   I T   in   M a n a g e m e n f ro m   Un iv e rsit y   o S z c z e c in ,   S z c z e c in ,   P o lan d   in   2 0 1 5 .   T h e   a re a   o f   in tere sts  a re   Da t a   M in in g ,   T e x M in in g ,   Be h a v io ra F i n a n c e ,   S e n ti m e n A n a l y si s,  IT   in   M a n a g e m e n t,   Big   Da ta an a l y sis,  S o c ial  m e d ia an a l y sis,  a n d   Na tu ra L a n g u a g e   P ro c e ss in g .     Evaluation Warning : The document was created with Spire.PDF for Python.