I nte r na t io na l J o urna l o f   E lect rica l a nd   Co m pu t er   E ng ineering   ( I J E CE )   Vo l.   11 ,   No .   2 A p r il   2 0 2 1 ,   p p .   1 6 6 6 ~ 1 6 7 4   I SS N:  2 0 8 8 - 8 7 0 8 DOI : 1 0 . 1 1 5 9 1 / ijece . v 1 1 i 2 . pp 1 6 6 6 - 1 6 7 4          1666       J o ur na l ho m ep a g e h ttp : //ij ec e. ia esco r e. co m   A hybrid m ethod  o g enetic   a lg o rithm and s uppo r v ector  ma chine f o DNS   t unneling   d etec tio n       F uq da n A.   Al - I bra heem i 1 Sa t t a A l - I bra heem i 2 H a leh A m into o s i 3   1 Co ll e g e   o f   De n ti str y ,   Un iv e rsity   o Al - Am e e d ,   Ira q   2 Ed u c a ti o n   M in istr y ,   Ira q   3 F a c u lt y   o E n g i n e e rin g ,   F e rd o ws Un iv e rsit y   o M a sh h a d ,   Ira n       Art icle  I nfo     AB S T RAC T     A r ticle  his to r y:   R ec eiv ed   J an   2 ,   2 0 20   R ev is ed   J u n   2 9 ,   20 20   Acc ep ted   No v   1 5 ,   2 0 20       Wi th   t h e   e x p a n si o n   o th e   b u si n e ss   o v e th e   in ter n e t,   c o r p o ra ti o n n o wa d a y s   a re   in v e stin g   n u m e ro u a m o u n ts o m o n e y   in   th e   we b   a p p li c a ti o n s.   Ho we v e r,   th e re   a re   d iffere n th re a ts  c o u l d   m a k e   th e   c o rp o ra ti o n v u l n e ra b le  fo p o ten ti a a tt a c k s.  On e   o th e se   th r e a ts  is  h a rn e ss in g   th e   d o m a in   n a m e   p ro t o c o f o p a ss in g   h a rm fu i n f o rm a ti o n ,   th is  k i n d   o t h re a ts  is   k n o wn   a DN S   tu n n e li n g As   a   re su lt ,   c o n f id e n ti a l   in f o rm a ti o n   w o u l d   b e   e x p o se d   a n d   v io late d S e v e ra l   st u d ies   h a v e   in v e stig a ted   t h e   m a c h in e   lea rn i n g   i n   o r d e to   p ro p o se   a   d e tec ti o n   a p p ro a c h .   In   th e ir   a p p r o a c h e s,  a u t h o rs   h a v e   u se d   d iffere n a n d   n u m e ro u t y p e o fe a tu re su c h   a d o m a in   len g th ,   n u m b e o f   b y tes ,   c o n ten t ,   v o lu m e   o DN S   traffic,  n u m b e o h o st n a m e p e d o m a in ,   g e o g ra p h ic  l o c a ti o n   a n d   d o m a in   h isto r y .   A p p a re n tl y ,   th e re   is  a   v it a d e m a n d   to   a c c o m m o d a te  fe a tu re   se lec ti o n   tas k   i n   o r d e to   id e n t ify   t h e   b e st  fe a tu re s.  Th is  p a p e p r o p o se s   a   h y b r id   m e th o d   o g e n e ti c   a lg o rit h m   fe a tu re   se lec ti o n   a p p ro a c h   wit h   th e   su p p o rt  v e c to m a c h in e   c las sifier  fo th e   sa k e   o id e n ti f y in g   th e   b e st  fe a tu re th a h a v e   th e   a b il it y   to   o p t imiz e   th e   d e tec ti o n   o f   DN S   tu n n e li n g .   T o   e v a lu a te  t h e   p ro p o se d   m e th o d ,   a   b e n c h m a rk   d a tas e o f   DN S   tu n n e li n g   h a b e e n   u se d .   R e su lt sh o we d   t h a t h e   p ro p o se d   m e th o d   h a o u t p e rfo rm e d   t h e   c o n v e n ti o n a S VM  b y   a c h iev i n g   0 . 9 4 6   o f   F - m e a su re .   K ey w o r d s :   DNS  t u n n elin g   Featu r s elec tio n     Gen etic  a lg o r ith m   Su p p o r v ec to r   m ac h in e   T h is i a n   o p e n   a c c e ss   a rticle   u n d e r th e   CC B Y - SA   li c e n se .     C o r r e s p o nd ing   A uth o r :   Fu q d an   A.   Al - I b r ah ee m i   C o lleg o f   Den tis tr y     Un iv er s ity   o f   Al - Am ee d   Kar b ala  PO Bo x   1 9 8 ,   I r aq   E m ail:  f u q d a n @ alam ee d . ed u . i q       1.   I NT RO D UCT I O N     No wad ay s ,   th n ee d   f o r   web   to   p er f o r m   wid r a n g o f   tr a n s ac tio n s   is   g ettin g   im p e r ativ f o r   lar g e   o r g an izatio n s   an d   e n d - u s er s .   T h is   ca n   b r ep r esen ted   b y   th s ea r ch ,   ex p lo r an d   r ea ch   o p er atio n s   co n d u cted   to   ac ce s s   v alu ab le   in f o r m atio n   r elate d   to   m ed ical,   f in an ci al  an d   ed u ca tio n   p u r p o s es.  P ar ticu lar ly ,   v ar io u s   b u s in ess es  r ec en tly   ar co n s id er ab ly   d ep e n d in g   o n   th in ter n et  f o r   co n d u ctin g   th eir   d aily - b asis   tr an s ac tio n s .   W ith   s u ch   d ep en d en cy   o f   in ter n et,   wid e   r an g e   o f   ch allen g es  wo u ld   b p o s ed .   A   s ig n if ic an asp ec o f   s u ch   ch allen g es  is   th in f o r m atio n   s ec u r ity   wh er co n f id en tial  d ata  b elo n g   to   c r itical  p ar ties   s u ch   as  m ed ical  an d   m ilit ar y   wo u ld   b e x p o s ed .   Secu r ity   th r ea ts   tak e   d if f e r e n f o r m s ,   b u t   o n e   o f   th ese  f o r m   is   tak i n g   t h ad v an tag o f   d o m ain   n am s y s t em   ( DNS)   p r o to c o f o r   p a s s in g   d an g er o u s   an d   m alicio u s   p r o ce d u r es,  th is   attac k   attem p t is k n o wn   as D NS tu n n elin g   [ 1 ] .   DNS  is   ch ar ac ter iz ed   b y   its   s im p licity   wh e r it in ten d s   to   o f f er   s tr aig h tf o r war d   way   f o r   ac ce s s in g   p ar ticu lar   s er v er   th r o u g h   th d o m ain   n am in s tead   o f   th I ad d r ess     [2 - 5] B ec au s o f   its   s im p licity ,   attac k er s   attem p to   u s it  f o r   cr ea tin g   tu n n el  to   e x ec u t m alicio u s   s cr ip ts   th at  in ten d ed   t o   ca p tu r co n f id en tial in f o r m atio n ,   g ain i n g   s u p er   ac ce s s ,   o r   attem p tin g   to   h ar m   th s er v er   [ 6 ]   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8 7 0 8       A   h yb r id   meth o d   o f g e n etic  a l g o r ith a n d   s u p p o r t v ec to r   m a c h in fo r   DN S   ...   ( F u q d a n   A .   A l - I b r a h ee mi)   1667   R eg ar d less ,   DN is   s ti ll  an   im p er ativ co m p o n en with in   th wo r ld   wid web   f o r   co n d u ctin g   n ec ess ar y   o p er atio n s   s u ch   as  t h s u r f in g   an d   co m m u n icatio n s   [ 7 ] I ts   k e y   s u cc ess   is   r ep r esen ted   b y   p r o v id in g   f lex ib le  way   f o r   r ea ch i n g   o u t   s p ec if i s er v e r   th r o u g h   a   s tr aig h tf o r war d   n a m in s tead   o f   th e   co m p licated   f o r m   o f   I ad d r ess   [8 - 12] .   Fo r   in s tan ce r ath er   th an   ty p i n g   lo n g   an d   c o m p licated   co m b in atio n s   o f   I P   ad d r ess es  s u ch   as  1 2 0 . 9 0 . 1 0 . 1 ,   it  is   m o r co n v en ien t   to   ty p th Ser v er Do m ain Nam e . c o m .   Ho we v er ,   s u c h   s im p licity   co m es  with   co s wh er th DNS  is   ex p o s ed   to   wid r an g o f   th r e ats  th r o u g h   tu n n els T h er e f o r e ,   p o wer f u s er v er s   o f   well  k n o wn   o r g a n izatio n s   ar v u ln er a b le  to   s u ch   th r ea ts   th r o u g h   th e   DNS  tu n n elin g   [ 1 3 ] T h is   is   d u to   th e   m ajo r   co n s id er atio n   o f   o th e r   n etwo r k   s e cu r ity   asp ec ts   wh ich   m ig h y i eld   g r ea ter   t h r ea ts   co m p a r ed   to   th DNS  tu n n elin g .     W id r an g o f   m et h o d s   wer e   d ep icted   in   th liter atu r f o r   t h id en tific atio n   o f   DNS  tu n n elin g   [ 1 4 ] On th t r ad itio n al  tec h n iq u es  is   th Fire wall   wh er e   it  h as  t h ab ilit y   to   r ejec t   s p ec if ic  D NS  q u er ies  b ased   o n   s o m in s tr u ctio n s .   T h ese  in s tr u ctio n s   ar s im p ly   co m p ar in g   th I ad d r ess   o f   s p ec if ic  DN q u er y   in   o r d e r   to   m atch   it  with   p r eo r d ain ed   lis o f   allo wed   I P   ad d r ess es  wh i ch   m ig h f ac ilit ate  av o id in g   u n k n o wn   DNS  th at  y ield s   h ar m f u co n te n ts .   Ad d itio n ally ,   an y   in tr u s io n   d etec tio n   s y s tem   wo u ld   also   h av th ca p ab ilit y   to   d etec DNS  tu n n elin g   th r o u g h   th in v esti g atio n   o f   r eq u ests Fu r th er m o r e an aly zin g   th n etwo r k   tr af f ic  is   an o th er   way   o f   id en tify in g   DNS  tu n n elin g   wh er ex tr f ea tu r es  ar e   b ein g   co n s id er ed   alo n g   with   th d o m ain   n am e.   L astl y ,   th p ass iv r ep licatio n   tech n iq u h as  also   th ab ilit y   to   av o id   DNS  tu n n elin g   t h r o u g h   r ep licatin g   ea c h   DNS  q u er y   f o r   d e n y in g   th f u r th er   u s o f   th em .     Yet all  th ab o v e - m e n tio n ed   t ec h n iq u es  ar e   s till   h av in g   v ar i o u s   d r awb ac k s .   T h is   is   b ec a u s th ey   a r ab le  to   r ec o g n ize  f ew  ty p es  o f   DNS  tu n n elin g .   I n   ad d itio n ,   i is   o b v io u s   th at  ad d itio n al  in f o r m atio n   is   n ee d e d   to   d etec s o p h is ticated   DNS   tu n n elin g .   Ap p ar en t ly ,   d is tin g u is h in g   th r eg u lar   DNS  q u e r ies  f r o m   th DNS   tu n n elin g   is   ch allen g in g   task .     Acc o r d in g   to   th e   in s u f f icien t   p er f o r m a n ce   o f   t h tr a d itio n al  m eth o d s   in   ter m s   o f   d etec tin g   DNS  tu n n elin g ,   r ec en t   s tu d ies  h av e   r ec o m m e n d ed   th u s o f   m a ch in lear n i n g   tech n iq u es  in   ter m s   o f   d etec tin g   DNS  tu n n elin g   [ 1 5 - 17] .   Ma c h in lear n in g   tech n iq u es  h av th ab ilit y   to   tr ain   an d   lear n   f r o m   p r ev io u s   ex p er ien ce s   o f   DNS  tu n n elin g .   Su ch   lear n in g   p ar ad ig m   h a s   th ab ilit y   to   m ak th m ac h in ab le  to   d etec n ew  ty p es  o f   DNS  tu n n elin g .   Yet,   th er ar s o m c h allen g in g   is s u es  th at  ar f ac in g   t h m ac h in lear n i n g   tech n iq u es in   th p r o ce s s   o f   i d en tify in g   DNS  tu n n elin g .   On o f   th ch allen g in g   task s   b eh in d   u s in g   th m ac h i n lear n in g   ( ML )   tech n iq u es  f o r   t h s ak o f   DNS  tu n n elin g   d etec tio n   is   th h ig h   d im e n s io n ality   o f   th f e atu r es th at  co u ld   b u s ed   to   d i f f er en tiate  th DNS   q u er ies  f r o m   th tu n n elin g   o n es.  B asical ly ,   f ea tu r es  p lay   a n   ess en tial  r o le  in   th m ac h in e   lear n in g   in   wh ich   th s ig n if ican f ea tu r es  lead   i m p r o v e   th p e r f o r m an ce   o f   th class if icatio n   an d   v ice  v er s a   [ 1 8 ] .   Selectin g   th e   m o s ap p r o p r iate  f ea t u r es  was  o n o f   th m aj o r   co n ce r n s   with in   th co m m u n ity   o f   m ac h in lear n in g   r esear ch er s .     T h f ea tu r es  th at  h av b ee n   e x p lo ited   to   id en tify   th tu n n el in g   ar e   ca teg o r ized   in   two   m a in   class e s   p ay lo ad   an aly s is   o r   tr af f ic   an a ly s is   [ 1 7 ] .   Pay l o ad   an aly s is   ca n   b e   u s ed   t o   d etec t   DNS  tu n n elin g   b y   an al y zin g   th r eq u est  an d   its   f ea tu r es  in clu d in g   d o m ain   len g th ,   n u m b er   o f   b y tes  an d   co n ten t.  Su ch   f ea tu r es  co u ld   b e   ex p lo ited   to   g e n er ate  r u les  th at  in ten d ed   to   p r e v en DNS  tu n n elin g .   W h er ea s ,   tr af f ic  an a ly s is   ca n   b u s ed   to   d etec th DNS  tu n n elin g   b y   ex am in in g   t h tr af f ic   an d   its   f ea tu r es  in clu d in g   v o lu m o f   DNS  tr af f ic,   n u m b er   o f   h o s tn am es  p e r   d o m ain ,   g e o g r ap h ic  lo ca tio n   a n d   d o m ai n   h is to r y .   Ap p ar en tly ,   th e r i s   wid r an g e   o f   f ea tu r es  ca n   b e   ex p l o ited   f o r   th i d en tific atio n   o f   tu n n elin g   th r o u g h   ML .   T h er ef o r e,   t h is   p ap er   in ten d s   to   p r o p o s f ea tu r s elec tio n   ap p r o ac h   b ased   o n   g e n etic  alg o r ith m   f o r   DNS  tu n n elin g   d etec tio n .   T h p r o p o s ed   f ea tu r s elec tio n   ap p r o ac h   will  b co m b i n ed   with   s u p p o r v ec to r   m ac h i n class if ier .       2.   RE L AT E WO RK   T h n ewly   r esear ch es  in   DNS  tu n n elin g   f o cu s es  o n   M L   f o r   th id en tific atio n   p r o c ess .   T h is   i s   b ec au s ML   wo u ld   h av th e   ab ilit y   to   lear n   f r o m   p r ev io u s   ca s es  an d   g en er ate  s tatis ti ca r u les  f o r   f u tu r e   attem p ts .   As  an   ex am p le  o f   s u ch   s tu d ies  is   th o n p r o p o s ed   b y   Du s et  a l [ 1 9 ]   in   wh ich   s y s tem   was  d esig n ed   to   lear n   f r o m   p r ev i o u s ly   k n o w n   DNS  tu n n elin g   attem p ts .   T h s y s tem   was  a n aly zin g   s ig n if ican t   ch ar ac ter is tics   s u ch   as  n etwo r k   tr af f ic.   B ased   o n   s u ch   f ea tu r es,  th s y s t em   will  g e n er a te  s et  o f   r u les  to   p r ed ict  th o cc u r r e n ce   o f   DNS  tu n n elin g .     I n   th e   s am r e g ar d ,   Du s et  a l [ 1 4 ]   p r ese n ted   a n   ML   m eth o d   aim ed   at  d etec tin g   th e   tu n n els  with in   th ap p licatio n   lay er .   Su ch   m eth o d   was  in ten d ed   t o   tak e   th ad v an ta g o f   s ig n if ican t   f ea t u r es  to   d i f f er en tiate  th n o r m al  an d   s u s p icio u s   p atter n s .   T h f ea tu r es  co n s is ted   o f   n etwo r k   tr af f ic  ch ar a cter is tics   in clu d in g   co n n ec tio n   d u r atio n   an d   s en d in g   an d   r ec eiv in g   s izes.  L astl y ,   an   alg o r ith m   o f   d ec is io n   t r ee   ( DT )   h as  b ee n   tr ain ed   o n   s u c h   f ea tu r es  to   d etec th p o ten tial  DNS  tu n n elin g .   R esu lts   o f   class if icatio n   d em o n s tr ated   an   o u tp er f o r m an ce   o v e r   th co n v en tio n al  m eth o d s .     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8 7 0 8   I n t J E lec  &   C o m p   E n g ,   Vo l.   11 ,   No .   2 Ap r il 2 0 2 1   :   1 6 6 6   -   1674   1668   B esid th DT ,   Allar d   et  a l [ 2 0 ]   p r esen ted   an   alg o r ith m   o f   r an d o m   f o r r est  ( R F)  f o r   p r ev e n tin g   DNS  tu n n elin g .   I n   s im ilar   way   to   th p r ev io u s   s tu d y ,   th is   s tu d y   h as  also   tak in g   th ad v an tag e   o f   n etwo r k   tr af f ic  f lo f ea tu r es.  L astl y ,   th p r o p o s ed   class if ier s   h av b ee n   tr ain ed   o n   th f ea tu r s p ac o f   f lo ch ar ac ter is tics   an d   test ed   o n   a   s et  o f   DNS  q u er y   [ 2 0 ]   Aiello   et  a l [ 2 1 ]   is   an o th er   s tu d y   wh er SVM  alg o r ith m   h as  b ee n   u s ed   f o r   th e   i d en ti f icatio n   o f   tu n n elin g .   T h a u th o r s   h av u tili ze d   s et  o f   DNS  q u er ies  an d   a n s wer s   in   o r d er   to   tr ai n   th eir   m o d el  [ 2 1 ] Du r in g   th e   m o d el  b u ild in g ,   q u er ies’  co n ten ts   h a v b ee n   ex a m in ed   in   ter m s   o f   n o r m al  an d   s u s p icio u s   p atter n s .   Ad d itio n ally ,   Aiello   et  a l [ 1 6 ]   p r o p o s ed   s tatis tical  f in g er p r in f o r   th id e n tific atio n   o f   DNS  tu n n elin g   b ased   on  m ac h in lear n i n g   m et h o d .   T h p r o p o s ed   m eth o d   h as  tak en   th a d v an tag e   o f   co n n ec tio n   f ea tu r es  s u ch   as  d u r atio n   a n d   s ize  o f   p ac k ets.   Usi n g   R F   alg o r ith m ,   B u cz ak   et  a l [ 2 2 ]   p r esen ted   m o d el  f o r   p r ev en tin g   DNS  tu n n elin g .   T h e   p r o p o s ed   m o d el  h as  u tili ze d   th d u r atio n   a n d   s ize  o f   th c o n n ec tio n s   in   o r d er   to   in itiate  th f ea tu r s p ac e.   L astl y ,   th p r o p o s ed   R F h as b ee n   u s ed   to   p r ed ict  th o cc u r r e n ce   o f   th e   DNS  tu n n elin g .     T o   ex am in n ew  f o r m   o f   f ea tu r es,  Aiello   et  a l [ 2 3 ]   u ti lized   two   f ea tu r ex tr ac tio n   t ec h n iq u es  in clu d in g   p r i n cip le  co m p o n en an al y s is   an d   m u tu al  in f o r m atio n .   Su ch   tech n iq u es  aim   at  f in d in g   co r r elatio n s   an d   av er a g in g   th s tatis tical  f ea tu r es  o f   n etwo r k   f lo w.   L a s tly ,   u s in g   K - n ea r est  n eig h b o r   alg o r ith m ,   th e   au th o r s   h av s u cc ess f u lly   m an ag ed   to   tr ain   m o d el  f o r   p r e d ictin g   th DNS  tu n n elin g .     Ho m em   et  a l [ 2 4 ]   ex a m in ed   th ca p ab ilit y   o f   m a x im u m   e n tr o p y   alg o r ith m   in   te r m s   o f   i d en tify in g   DNS  tu n n elin g .   T h e   alg o r ith m   h as  b ee n   tr ain ed   o n   tr a d itio n al  f ea tu r es  s u ch   as  co n n ec tio n   d u r atio n   an d   s ize.   L astl y ,   p r ed ictio n   m o d el  h as b ee n   b u ilt to   an ticip ate  th o c cu r r en ce   o f   DNS  tu n n elin g .     Fin ally Van   T h u an   Do   et  a l [ 1 5 ]   h av ex te n d ed   t h f ea t u r s p ac f o r   p r e d ictin g   DNS  tu n n elin g   with in   m o b ile  n etwo r k s .   T h au th o r s   h a v u tili ze d   d u r a tio n   o f   c o n n ec tio n ,   le n g th   o f   DNS  q u er y   an d   d esti n atio n .   L astl y ,   an   SVM  alg o r ith m   h as  b ee n   tr ain ed   o n   s u ch   f ea tu r es.  Fro m   t h liter atu r e,   th at  th er ar a   wid r an g o f   f ea tu r es th at  h a v b ee n   a d d r ess ed   f o r   th t ask   o f   d etec tin g   DNS  tu n n elin g .   I n   th is   m an n er ,   th er e   is   v ital  d em an d   to   d eter m in e   th m o s ap p r o p r iate  f ea tu r s et.   T h is   is   d u to   th im p er ativ n ee d   o f   i d en tify   th b est f ea tu r es.       3.   P RO P O SE M E T H O D   I n   o r d e r   to   id en tif y   th b est  f ea tu r s et  f o r   d etec tin g   DNS  tu n n ellin g ,   th is   p ap e r   p r o p o s e s   h y b r id   m eth o d   o f   g e n etic  alg o r ith m   ( GA)   f ea tu r e   s elec tio n   ap p r o ac h   with   th e   s u p p o r v ec to r   m ac h in e   ( SVM)   class if ier .   T o   d escr ib e   th a p p licatio n   o f   t h p r o p o s ed   s o lu tio n ,   Fig u r e   1   s h o ws  th e   wo r k f l o o f   th e   im p lem en tatio n .             Fig u r 1 .   W o r k f lo o f   th p r o p o s ed   m eth o d       Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8 7 0 8       A   h yb r id   meth o d   o f g e n etic  a l g o r ith a n d   s u p p o r t v ec to r   m a c h in fo r   DN S   ...   ( F u q d a n   A .   A l - I b r a h ee mi)   1669   As  s h o wn   in   Fig u r e   1 ,   t h im p lem en tatio n   s tag b eg in s   wit h   d ataset  o f   DNS  q u er ies  th at  co n s is ts   o f   leg itima te  an d   tu n n el lin g   q u er ies.  I n   o r d er   to   estab lis h   th f ea tu r s p ac e,   f ea tu r ex tr ac tio n   task   will  tak e   p lace   in   o r d er   to   r ep r esen t t wo   ty p es o f   f ea t u r es in clu d in g   p ay lo ad   a n d   tr a f f ic  f ea tu r es .   C o n s eq u en tially ,   GA  will  b u s ed   to   s ea r ch   f o r   th e   b est  s o lu tio n s   o r   in   o th er   wo r d   id e n tify in g   th b est  f ea tu r e s .   T h en ,   SVM  will  ac co m m o d ate  th class if icatio n   task   in   wh ich   th q u e r ies  will  b d iv id ed   in to   leg itim ate  an d   tu n n ellin g   q u er ies.  Ho wev er ,   th latter   p h ases   will b tack led   in   th n e x t sectio n s   in d ep en d en tly .       3 . 1 .     DNS  t un nelin g   da t a s et     I n   o r d er   to   cr ea te  th e   DNS  tu n n elled   tr af f ic  d ataset,   [ 2 4 ]   h av s im u lated   t h u s o f   d if f er e n p r o to co ls   r e g ar d i n g   t o   th eir   o wn   DNS  tu n n el.   T h a u th o r s   h av d e v elo p e d   s cr ip t   in   p y th o n   p r o g r am m in g   lan g u ag e   in   o r d er   to   g e n er ate  an d   co llect  p ac k et  ca p t u r es  o f   n etwo r k   tr af f ic  b y   s im u latin g   th n o r m al  u s o f   an o th er   two   n etwo r k   p r o to co l s   r u n n in g   o v er   DNS  tu n n els  in clu d in g   HT T PS   an d   POP3 .   Fo r   b o th   HT T an d   HT T PS ,   th d ata   was  g e n er at ed   b y   v is itin g   f iv e   r a n d o m   w eb s ite.   FTP  was  s im u lated   th r o u g h   th e   d ir ec to r y   tr av er s al  an d   d o wn lo a d in g   f i v r an d o m   f iles   f r o m   an   FTP  s er v er .   Fin ally ,   POP3   p r o to c o was  s im u lated   b y   r eq u esti n g   an d   d o wn lo ad i n g   f iv r an d o m   em ails   f r o m   a   m a il  s er v er   in   wh ic h   s o m o f   th ese  em ail  co n tain s   p lain   tex t   an d   th e   o th er   co n tain s   r an d o m ly   g en er ate d   f iles   as  attac h m en ts .   T ab le   1   d ep ic ts   th d etails  o f   th e   DNS  tu n n elin g   d ataset.         T ab le  1 .   Data s et  d etails   N e t w o r k   P r o t o c o l   N u mb e r   o f   S a m p l e s   O r i g i n a l   S i z e   R e d u c e d   S i z e   H TTP   52   6 3 6 . 7   M B   1 7 9 . 9   M B   H TTPS   53   6 8 6 . 3   1 8 1 . 4   M B   F TP   53   2 6 0 . 2   M B   4 9 . 8   M B   P O P 3   53   1 3 1 . 6   M B   2 8 . 2   M B   To t a l   2 1 1   1 7 1 4 . 8   M B   4 3 6 . 3   M B       3 . 2 .     F e a t ure  ex t r a ct io n   I n   f ac t,  f ea tu r es  p lay   a n   ess en tial  r o le  in   th co n tex o f   s u p er v is ed   m ac h in lear n in g   in   wh ich   th e   s tr o n g   f ea t u r es  wo u ld   s ig n if i ca n tly   im p r o v ed   th p er f o r m an ce   o f   th class if icatio n ,   v ice  v er s a;  th e   wea k   f ea tu r es  wo u ld   n e g ativ ely   af f ec th p er f o r m an ce   o f   th cl ass if icatio n .   I n   th is   m an n er ,   i n   o r d er   t o   g en e r ate  f ea tu r es f o r   th e   n etwo r k   tr af f ic ,   [ 2 4 ]   h av a n aly s ed   d if f e r en f ea tu r es r elate d   to   b o th   n o r m al   an d   tu n n el  tr af f ic.   I n   f ac t,  n u m er o u s   f ea tu r es  ca n   b ex tr ac ted   b y   o b s er v in g   b o th   n o r m al  an d   tu n n el  tr af f ic  s u ch   as  b y te  f r eq u e n cies,  in f o r m atio n   en t r o p y   an d   p ac k et  len g th s .   Ho wev er ,   o n o f   th s ig n i f ic an f ea tu r is   th in f o r m atio n   en tr o p y   d u to   its   d ir ec t c o r r elatio n   with   th ac tu al  d ata  b y tes co m p o s in g   p ac k e ts .   I n v esti g atin g   th n etwo r k   f l o f ea tu r es  wo u ld   in clu d v ar io u s   lev els  s u ch   as   I P - lev el,   tr an s p o r t - lev el  o r   ap p licatio n - le v el.   T h k ey   d if f e r en ce   am o n g   s u ch   lev els  lies   b etwe en   th clien t   r eq u est  an d   s er v er   an s wer .   Fo r   in s tan ce ,   s o m e   p r o to co ls   wo u ld   h av e   s im ilar   o r   ev e n   id en tical  c o n ten r e g ar d in g   t h r eq u est's   co n ten t.  Yet,   th e   k ey   d is tin g u is h   b etwe en   t h em   lies   o n   th s er v er   r esp o n s e.   T h er ef o r e,   c o n ce n tr ain g   o n   th e   co n ten ct  o f   r esp o n s is   co n s id er ed   m u ch   ap p r o p r iate  to   ex a m in th v ar ian ce s .   I n   p ar ticu l ar ,   s o m tech n iq u es  s u ch   as in f o r m atio n   en tr o p y   w o u ld   b g r ea t h elp   in   ter m s   o f   id en tify in g   th v a r iatio n   with in   m ess ag e.   On e   way   to   co m p u t th e   en tr o p y   is   b y   esti m atin g   t h b y tes  with in   p ac k et  [ 2 4 ] .   He n ce ,   th e   p r o b ab ilit y   o f   ce r tain   o cc u r r e n ce s   o f   b y te   ( )   m u ltip lied   b y   its   lo g a r ith m   wo u l d   co n t r ib u te  to war d   id en tify i n g   th en tr o p y   as  in   th f o llo win g   f o r m u la :     ( ) = ( ) ×    ( ) = 1   ( 1 )     T h p r im al  b e n ef it   o f   ac q u ir i n g   en tr o p y   lies   b eh in d   g ain i n g   an   in s ig h r eg ar d i n g   th d is tr ib u tio n   p r o d u ce d   with in   ev er y   p r o to co f lo w.   Hen ce ,   th d is tr ib u tio n s   tr en d   is   ac q u ir e d   th r o u g h   s u ch   en t r o p y   an aly s is .   Alo n g   with   th in f o r m atio n   en tr o p y ,   th e r ar o th e r   f ea tu r es  th at  we r p r o v id e d   f o r   ea ch   co n n ec tio n   s u ch   as  DNS  r e q u est  len g t h ,   I p ac k et  s en d er   len g th ,   I P   p a ck et  r esp o n s len g t h ,   e n co d e d   DNS  q u er y   n am len g th ,   r e q u est ap p licatio n   la y er   en tr o p y ,   I p ac k et  en tr o p y   an d   q u er y   n am en tr o p y .     3 . 3 .     Dis cr et iza t io n   I n   m ath em atics,  d is cr etiza tio n   task   aim s   to   tr an s f er   co n ti n u o u s   f u n ctio n s ,   m o d els  a n d   e q u a tio n s   in to   d is cr ete  v alu es.  Fo r   m ac h in e   lear n in g ,   th e   v alu es  ar e   eith er   n o m in al  o r   n u m er ic.   No m in al  v alu es  ar e   lik e   p r ed ef in e d   r a n g es  s u ch   as  ' lo w,   m ed iu m ,   h ig h '   o r   ' b lack ,   w h ite' .   I n   th is   m an n er ,   t h n o m i n al  v alu es  ten d   to   b e   d is cr ete.   Fo r   th n u m er ic  v alu es,  th er ar s o m e   ca s wh er e   it  ca n   b d is cr ete  s u ch   as  th v alu es  f r o m   0   to   9   wh ich   ca n   b r an g ed   in   ten   d i s cr ete  v alu es  o f   {0 ,   1 ,   2 ,   3 ,   4 ,   5 ,   6 ,   7 ,   8 ,   9 }.   Ho wev e r ,   s o m etim es  th n u m er ic   Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8 7 0 8   I n t J E lec  &   C o m p   E n g ,   Vo l.   11 ,   No .   2 Ap r il 2 0 2 1   :   1 6 6 6   -   1674   1670   v alu es  ca n   b f o r m ed   as  co n tin u o u s   r ath e r   th a n   d is cr ete.   I n   th is   v ein ,   it  is   d if f ic u lt  to   r an g e   o r   lim it  th e   co n tin u o u s   v alu es  d u to   th f lu ctu atio n   o f   n u m b er s .   T h er ef o r e,   it  is   n ec es s ar y   t o   ac co m m o d ate  a   d is cr etiza tio n   task   in   o r d er   to   p u th ese   v alu es  with in   a   r an g e.   T ab le   2   s h o ws  an   ex a m p le  o f   d is cr etiza tio n   o f   co n tin u o u s   v alu es.        T ab le  2 .   E x am p le  o f   d is cr etiza tio n   I n st a n c e   C o n t i n u o u v a l u e   C o n v e r t   r u l e s   I1   5 . 3 0 4 9 8   I F   v a l u e   <   5 . 3 0 5 0 0     A   I 2   5 . 3 0 5 0 0   I F   v a l u e   >   5 . 3 0 5 0 0   v a l u e   <   5 . 3 0 5 1 0     B   I3   5 . 3 0 5 1 5   I F   v a l u e   >   5 . 3 0 5 1 0   & <   5 . 3 0 5 2 0     C   I4   5 . 3 0 5 2 9   I F   v a l u e   >   5 . 3 0 5 2 0   & <   5 . 3 0 5 3 0     D   I5   5 . 3 0 5 3 5   I F   v a l u e   >   5 . 3 0 5 3 0     E       3 . 4 .     F e a t ure  s elec t io n us ing   g enet ic  a lg o rit hm     I n   th is   s ec tio n ,   t h f ea tu r es  o f   th DNS  co n n ec tio n s   will  b e   ex am in ed   in   o r d er   to   i d en tify   th m o s t   ap p r o p r iate  f ea tu r es  th at   h av e   th ab ilit y   to   d is tin g u is h   th o cc u r r en ce   o f   tu n n ellin g .   Fo r   th is   p u r p o s e,   m eta - h eu r is ti ap p r o ac h   o f   g e n etic  alg o r ith m   h as  b ee n   u s ed .   Ge n etic  alg o r ith m   ( GA)   is   o n o f   th lo ca s ea r ch   tech n iq u es  th at  s im u late  th b io lo g y   o f   n at u r al  s elec tio n   [ 2 5 ,   2 6 ] .   T h eo r etica lly ,   it  wo r k s   b y   g en e r atin g   a   p o p u latio n   wh er th p o s s ib le  s o lu tio n s   ca n   b ex am in ed .   C o n s eq u en tially ,   co m b in atio n   p r o ce s s   is   p er f o r m ed   b y   co m b in in g   th b est p o p u latio n   b ased   o n   f itn e s s   f u n ctio n .   I n   f ac t,  g en etic  alg o r ith m   s tar ts   with   p r o d u cin g   a n   in itial p o p u latio n   wh er th p o s s ib le  s o l u tio n s   ca n   b r ep r esen ted .   T h is   p o p u lati o n   co n s is ts   o f   d if f er en g e n e s   ( i.e .   f ea tu r es)  th at  c o m p o s e d   o f   c h r o m o s o m es.  E ac h   ch r o m o s o m is   r ep r esen ted   b y   b in ar y   v alu ( i.e .   0   o r   1 ) .   Fig u r e   2   d e p icts   th r ep r esen tatio n   o f   th ese  g en es  ( f ea tu r es)  wh er C   r ef er s   to   s in g le  DNS  co n n ec tio n ,   r ef er s   to   f ea tu r an d   m   r ef er s   to   th n u m b er   o f   f ea tu r es.           Fig u r 2 .   I n itial p o p u latio n   o f   g en es       On ce   th p r o d u cin g   o f   th i n itial  p o p u latio n   is   b ein g   d o n e,   e ac h   g en e   h a v to   b ass ess ed   in   ter m s   o f   f ea s ib ilit y .   T h is   ass ess m en is   co n d u cted   b ased   o n   f itn ess   f u n ctio n   wh ich   i d en tifie s   th d esire d   e f f ec tiv en ess   u s in g   v alu e.   Fig u r e   3   d ep icts   th ev alu atio n   o f   g en es with   r an d o m   o f   v al u es o f   f itn ess .   As  s h o wn   in   Fig u r e   3 ,   th er e   ar g en es  th at  h a v lo v al u o f   f itn ess   s u ch   as  Gen 3 ,   Gen e   4 ,   Gen 6   an d   Gen 7   w h ich   h av e   0 o f   f itn ess .   Hen ce ,   g en etic  alg o r i th m   will  g et  r id   o f   th ese  g e n e s   r eg ar d in g   t o   th eir   in f ea s ib ilit y .   At  th s am tim e,   Gen 1 ,   Gen 2   a n d   Gen 5   will  b s elec ted   as  th b est  g e n es  r eg ar d in g   th eir   ef f ec tiv en ess   in   ter m s   o f   f itn ess .   No te  th at,   th er ar m u ltip le  s tr ateg ies  to   s elec th b est  g en es  s u ch   as   r o u lette  wh ee l,   r an k   s elec tio n ,   s tead y - s tate  s elec tio n .   Ho we v er ,   in   th is   s tu d y   th e   r an k   s elec tio n   s tr a teg y   h as   b ee n   u tili ze d .   On ce   th b est  g en es  ar b ein g   s elec ted ,   r e - p r o d u cti o n   p r o c ess   i s   p er f o r m ed   wh ich   aim s   to   g en er ate   th n ex p o p u latio n .   T h is   ca n   b co n d u cted   b y   m a n ip u latin g   th ch r o m o s o m es  o f   th cu r r en g en es.  Fo r   t h is   p u r p o s e,   th er e   ar m u ltip l m eth o d s   ca n   b u s ed   to   r e - p r o d u ce   th e   g en es  s u c h   as  cr o s s o v er ,   m u tatio n   an d   elitis m .   I n   th is   s tu d y ,   cr o s s o v e r   m eth o d   h as b ee n   u tili ze d   to   r e - p r o d u ce   th n ex t g e n er atio n .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8 7 0 8       A   h yb r id   meth o d   o f g e n etic  a l g o r ith a n d   s u p p o r t v ec to r   m a c h in fo r   DN S   ...   ( F u q d a n   A .   A l - I b r a h ee mi)   1671   C r o s s o v er   is   an   ex ch an g p r o ce d u r t h at  aim s   to   s wap   t h ch r o m o s o m es  b etwe en   tw o   o r   m o r e   g en es.  T h is   p r o ce s s   aim s   to   c o m b in t h s tr o n g est  ch r o m o s o m es  f r o m   two   g e n es  an d   f o r m u late  it  in   n ew   g en f o r   n ex p o p u latio n .   Fig u r e   4   d ep icts   th m ec h an is m   o f   cr o s s o v er .   T h s p ec if icati o n   o f   ap p ly in g   th e   g en etic  alg o r ith m   ca n   b s ee n   in   T ab le  3 .             Fig u r 3 .   E v alu atin g   g en es b a s ed   o n   th f it n ess   f u n ctio n           Fig u r 4 .   C r o s s o v er   e x ch an g e       T ab le  3 .   Deta ils   o f   ca r r y in g   o u t th g en etic  alg o r ith m   P a r a me t e r   D e scri p t i o n   N u mb e r   o f   i t e r a t i o n o r   g e n e r a t i o n s   50   Re - p r o d u c t i o n   m e c h a n i s m   C r o ss o v e r   C o n d i t i o n   f o r   t e r m i n a t i o n   N o   si g n i f i c a n t   c h a n g e i n   n e x t   g e n e r a t i o n s       3 . 5 .     Cla s s if ica t io n us ing   SVM   I n   th is   s ec tio n ,   th class if ic atio n   o f   th DNS  co n n ec tio n   is   b ein g   p er f o r m ed   in   wh ich   ea ch   co n n ec tio n   w o u ld   b e   class if i ed   in to   its   ac tu al  class   lab el.   Su ch   class if icatio n   p r o ce s s   h as  b ee n   co n d u cte d   u s in g   th s u p p o r v ec to r   m ac h in e.   T h is   class if ier   is   n o n - p r o b ab ilis tic  an d   b in a r y   class if ier   in   wh ich   t h d ata   is   p ar titi o n ed   in t o   two   g r o u p s   ( 0   o r   1 ) .   T h wo r k   m ec h an is m   o f   th is   class if ier   lies   o n   ass ig n in g   a   h y p er p la n e   wh ich   is   m ar g in   th at  p ar titi o n   th d ata  in to   th two   g r o u p s   [ 2 7 ] .   No te  t h at,   SVM  will c las s if y   th co n n ec tio n   in s tan ce s   b ased   o n   th s elec ted   f ea tu r es  b y   th g e n etic  alg o r ith m   in   wh ich   th tr ain in g   p o r tio n   was  8 0 an d   th test in g   p o r tio n   was 2 0 %.  Fig u r e   5   d ep icts   th alg o r ith m   o f   SVM  class if ier .     As  s h o wn   in   Fig u r e   b asically ,   will  id en tify   m a r g in   th at  p ar titi o n   th e   d ata  with   t h f ir s class   ( i.e .   FTT Po v er DNS)   an d   th e   r em a in in g   d ata  ( s h o wn   i n   s tep   2 ) .   Af ter   th at,   id en tify i n g   m a r g in   th at  p ar titi o n   th e   d ata  with   th s ec o n d   class   ( i. e.   HT T Po v er DNS)   an d   th e   r e m ain in g   d ata  ( s h o wn   in   s tep   3 ) .   C o n s eq u e n tially ,   id en tify in g   m ar g in   th at  p ar titi o n   th d ata  with   th th ir d   cla s s   ( i.e .   HT T PS o v er DNS)   an d   th r em ain in g   d ata   ( s h o wn   in   s tep   4 ) .   Af ter   th at,   id en tify in g   a   m ar g in   th a p ar titi o n   t h d ata   with   th f o u r th   class   ( i.e .   POP3 o v er DNS)   an d   th r e m ai n in g   d ata  ( s h o wn   in   s tep   5 ) .     Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8 7 0 8   I n t J E lec  &   C o m p   E n g ,   Vo l.   11 ,   No .   2 Ap r il 2 0 2 1   :   1 6 6 6   -   1674   1672       Fig u r e   5 .   SVM  alg o r ith m       4.   RE SU L T AND   D I SCU SS I O N S   Sin ce   th is   s tu d y   is   co n ce n tr at in g   o n   th s u p er v is ed   m ac h in lear n in g   th u s ,   t h ev alu atio n   m eth o d   th at  h as  b ee n   u s ed   f o r   ass ess in g   th class if icatio n   p er f o r m a n ce   will  b u s ed .   Sev er al  r esear ch   s tu d ies  h av e   ad d r ess ed   th ev alu atio n   o f   class if icatio n   u s in g   th co m m o n   in f o r m atio n   r etr iev al   m etr ics  in clu d in g   p r ec is io n ,   r ec all  an d   F - m ea s u r [ 2 4 ] .   T o   co m p u te  s u ch   m etr ics,  th co n tin g en cy   tab le  will   b u s ed   as  s h o wn   in   T ab le  4 .       T ab le  4 .   C o n tin g en cy   ta b le     P r e d i c t e d   D N S   c o n n e c t i o n   P r e d i c t e d   A c t u a l   N o r mal   Tu n n e l   A c t u a l   D N S   c o n n e c t i o n   N o r mal   T ru e   p o si t i v e   ( T P)   Fa l s e   p o si t i v e   ( F P)   Tu n n e l   Fa l s e   n e g a t i v e   ( FN )   T ru e   n e g a t i v e   ( T N )       F a ls n eg a tive  ( F N ) :   is   th n u m b er   o f   ac tu al  tu n n elin g   c o n n ec tio n s   th at  h av b ee n   p r ed ict ed   as n o r m al.   F a ls p o s itive  (FP) :   is   th n u m b er   o f   ac tu al  n o r m al  co n n ec t io n   th at  h a v b ee n   p r ed icte d   a s   tu n n elin g .     Tr u n eg a tive  ( TN ) :   is   th n u m b er   o f   co r r ec tly   u n - p r e d icted   co n n ec tio n s.   Tr u p o s itive  ( TP) :   is   th n u m b er   o f   co r r ec tly   p r ed icted   co n n ec tio n s .   I n   th is   m an n e r ,   th e   p r ec is io n ,   r ec all  an d   F - m ea s u r ca n   b co m p u ted   b ased   o n   th e   f o llo win g   eq u atio n s .       =     +    ( 2 )       =     +    ( 3 )      =   2 ×   ×    +    ( 4 )     Pre cisi o n   is   th r atio   b etwe en   th n u m b er   o f   co r r ec tly   class if ied   co n n ec tio n s   o v er   t h to t al  n u m b er   o f   co n n ec tio n s .   W h ile  R ec all   is   th r atio   b etwe en   th n u m b er   o f   c o r r ec tly   class if ied   tu n n elin g   co n n ec tio n s   an d   th to tal  n u m b er   o f   tu n n elin g   co n n ec tio n s .   Fin ally ,   F - m ea s u r is   co n s id er ed   to   b th to tal  ac cu r ac y .   B asically ,   th ev alu atio n   will  b h el d   b ased   o n   t h h y b r id   o f   SVM  an d   GA  co m p ar ed   to   th co n v en tio n al   SVM.   T ab le  5   s h o ws s u ch   co m p ar is o n .       Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J E lec  &   C o m p   E n g     I SS N:  2 0 8 8 - 8 7 0 8       A   h yb r id   meth o d   o f g e n etic  a l g o r ith a n d   s u p p o r t v ec to r   m a c h in fo r   DN S   ...   ( F u q d a n   A .   A l - I b r a h ee mi)   1673   T ab le  5 .   R esu lts   o f   th p r o p o s ed   m eth o d   co m p ar ed   to   th co n v en tio n al  SVM   C l a s s   F - mea su r e   S V M   S V M   & G A   F TP   0 . 8 2 4 9 6   0 . 9 0 9 8 9   H TTP   0 . 7 8 9 8 1   0 . 9 8 9 8 9   H TTPS   0 . 8 3 7 4 2   0 . 9 1 4 3 1   P O P 3   1 . 0   0 . 9 7   A v e r a g e   0 . 8 6 3 0 5   0 . 9 4 6 0 2       As  s h o wn   in   T ab le   5 ,   t h u s o f   g e n etic  alg o r ith m   with   th e   s u p p o r t v ec to r   m ac h in e   class if icatio n   h as  s ig n if ican tly   im p r o v ed   th e   F - m ea s u r v alu es f o r   all  m o s o f   th class   lab els.  First,  th FT h as  b ee n   en h a n ce d   f r o m   8 2 o f   F - m ea s u r e   in to   9 0 %.  Seco n d ,   HT T P   class   lab el  h as  b ee n   im p r o v e d   f r o m   7 8 in t o   9 8 o f     F - m ea s u r e;  th is   is   th e   d r am atic  en h a n ce m en t   th at  o cc u r r ed   u p o n   a   class   lab el  co m p ar ed   t o   th e   o th e r s .   Fo r   th e   HT T PS   class   lab el  th en h an c em en was  s lig h in   wh ich   th F - m ea s u r h as  b ee n   in cr ea s ed   f r o m   8 3 to   9 1 %.   Ho wev er ,   f o r   t h POP3   class   lab el,   th r esu lt  o f   F - m ea s u r h as  b ee n   d ec r ea s ed   f r o m   1 0 0 i n to   9 7 %.   Alth o u g h   th u s o f   GA  h as  n o en h an ce d   th class if icatio n   o f   POP3   h o wev er ,   th av er a g p er f o r m a n ce   was  s ig n if ican tly   im p r o v ed   f r o m   8 6 to   9 4 o f   F - m ea s u r e .   Gen er ally ,   th u s o f   g en etic  alg o r ith m   h as   s ig n if ican tly   im p r o v ed   th c lass if icatio n   p er f o r m a n ce   o f   DNS  co n n ec tio n s   c o m p ar e d   to   th e   tr ad itio n a l   class if icatio n   with o u t a p p ly in g   GA.   T h is   ca n   im p ly   th u s ef u ln ess   o f   GA  wh er th ca p ab ilit ies o f   id en tify in g   th m o s a p p r o p r iate   f ea tu r e   s et  h as  led   to   en h an ce   th e   class if icatio n   ac cu r ac y .   Fig u r 6   c o m p ar es   th e   p er f o r m an ce s   o f   SVM  an d   SVM  with   GA.         Fig u r 6 .   Per f o r m an c es o f   SVM  an d   SVM  with   GA       On   th o th er   h an d ,   it  is   n ec es s ar y   to   co m p ar th r esu lts   o f   th p r o p o s ed   s o lu tio n   with   t h s tate  o f   th ar t.  Ou r   b aselin s tu d y   wa s   th o n th at  p r o p o s ed   b y   Ho m em   an d   Pap a p etr o u   [ 2 8 ]   wh o   ap p lied   t h SVM  class if icatio n   o n   th s am b en ch m ar k   d ataset  th at  h as  b ee n   u s ed   in   th is   s tu d y   an d   ac h i ev an   F - m ea s u r o f   9 1 %,  it  is   o b v io u s   th at  o u r   p r o p o s ed   m eth o d   h as  o u t p er f o r m ed   th r esu lts   o f   th s tate  o f   th ar b y   ac h iev i n g   9 4 o f   F - m ea s u r e.   T h is   ca n   d em o n s tr ate  th h y p o th esis   o f   o u r   s tu d y   in   wh ich   th u s o f   th g en etic  alg o r ith m   in   o r d e r   to   id e n tify   t h b est f ea tu r es will le ad   to   en h an ce   th ef f ec tiv en ess   o f   th class if icatio n .       5.   CO NCLU SI O N     T h is   p ap er   h as  p r o p o s ed   h y b r id   m et h o d   o f   g en etic  al g o r it h m   an d   s u p p o r v ec to r   m ac h i n f o r   th e   p r o ce s s   o f   d etec tin g   DNS  tu n n elin g .   T h p r o p o s ed   GA  h as  d em o n s tr ated   s u b s tan tial  p er f o r m an ce   in   ter m s   o f   s elec tin g   th b est  f ea tu r es  wh ich   let  to   im p r o v th class if icatio n   ac cu r ac y .   Ad d r ess in g   d if f er e n f ea tu r e   s elec tio n   ap p r o ac h es  in   f u t u r r esear ch es  is   k ey   c h allen g in g   is s u in   wh ich   an co lo n y ,   p a r ticle  s war m   o p tim izatio n   an d   s im u lated   an n ea lin g   ar c o m p etitiv f ea tu r s elec tio n   m eth o d s   co m p ar ed   to   GA.       RE F E R E NC E S     [1 ]   T.   v a n   Leijen h o rst ,   e a l. ,   On   th e   v iab il i ty   a n d   p e rfo rm a n c e   o DN S   t u n n e li n g ,   U n iv e rsit y   o W o ll o n g o n g   Re se a rc h   On li n e ,   2 0 0 8 .   0 0.2 0.4 0.6 0.8 1 F T P H T T P H T T PS PO P3 A ve rag e S V M w i th  G A S V M Evaluation Warning : The document was created with Spire.PDF for Python.
                      I SS N :   2 0 8 8 - 8 7 0 8   I n t J E lec  &   C o m p   E n g ,   Vo l.   11 ,   No .   2 Ap r il 2 0 2 1   :   1 6 6 6   -   1674   1674   [2 ]   A.  S a n i   a n d   M .   S e ti a wa n ,   DN S   tu n n e li n g   De tec ti o n   Us i n g   E las ti c se a rc h ,   in   IOP  Co n fer e n c e   S e rie s:  M a ter ia ls   S c ien c e   a n d   E n g i n e e rin g v o l.   7 2 2 ,   2 0 2 0 ,   p p .   1 - 9 .   [3 ]   N.  Ish ik u ra ,   e t   a l. ,   Ca c h e - P ro p e rty - Aw a re   F e a tu re fo DN S   Tu n n e li n g   De tec ti o n ,   in   2 0 2 0   2 3 rd   Co n fer e n c e   o n   In n o v a ti o n   i n   Cl o u d s,  I n ter n e a n d   Ne two rk s a n d   W o rk sh o p s (ICIN ) ,   2 0 2 0 ,   p p .   2 1 6 - 2 2 0 .   [4 ]   H.   Ba i,   e t   a l. ,   Re fin e d   id e n t ifi c a ti o n   o f   h y b ri d   traffic  in   DN S   tu n n e ls  b a se d   o n   re g re ss io n   a n a ly sis,”   ET RI   J o u r n a l p p .   1 - 1 3 ,   2 0 2 0 .   [5 ]   H.  Ic h ise ,   e a l. ,   NS  re c o r d   Histo ry   Ba se d   A b n o rm a DN S   traffic  De tec ti o n   C o n si d e rin g   Ad a p ti v e   B o t n e Co m m u n ica ti o n   Bl o c k in g ,   J o u rn a o In f o rm a ti o n   Pro c e ss in g ,   v o l.   2 8 ,   p p .   1 1 2 - 1 2 2 ,   2 0 2 0 .   [6 ]   K.  Bo rn   a n d   D.  G u sta fso n ,   Ng v iz:  d e tec ti n g   d n t u n n e ls  th r o u g h   n - g ra m   v isu a li z a ti o n   a n d   q u a n t it a ti v e   a n a ly sis,”   in   Pro c e e d in g o f   th e   S ixt h   An n u a l   W o rk sh o p   o n   Cy b e r   S e c u rit y   a n d   In f o rm a ti o n   I n telli g e n c e   Res e a rc h ,   p .   4 7 2 0 1 0 .   [7 ]   K.  Bo r n   a n d   D .   G u sta fso n ,   De tec ti n g   d n tu n n e ls  u sin g   c h a ra c ter  fre q u e n c y   a n a ly sis,”   a rXiv  p re p ri n t     a rXiv:   1 0 0 4 . 4 3 5 8 ,   2 0 1 0 .   [8 ]   K.  Bu m a n g lag   a n d   H.  Ke tt a n i,   On   th e   Im p a c o DN S   Ov e HT TP S   P a ra d i g m   o n   C y b e S y ste m s,”   in   2 0 2 0   3 rd   In ter n a t io n a C o n fer e n c e   o n   I n fo r ma ti o n   a n d   Co mp u ter   T e c h n o l o g i e s (ICICT ) ,   2 0 2 0 ,   p p .   4 9 4 - 4 9 9 .   [9 ]   G .   Ya n ,   e a l. ,   Disc o v e rin g   S u s p icio u APT   Be h a v io rs  b y   An a l y z in g   DN S   Ac ti v it ies ,   S e n so rs ,   v o l .   2 0 ,   n o .   3 ,     p .   7 3 1 ,   2 0 2 0 .   [1 0 ]   F .   P a lau ,   e a l. ,   De tec ti n g   DN S   Th re a ts:  De e p   Lea rn in g   M o d e l   to   Ru le  Th e m   All,   i n   X S im p o s io   Arg e n ti n o   d e   In telig e n c i a   Arti fi c ia ( AS AI   2 0 1 9 ) - J AII O 4 8 ,   S a lt a ,   2 0 1 9 .   [1 1 ]   A.  Alm u sa wi  a n d   H.  Am in t o o si,  DN S   Tu n n e li n g   De tec ti o n   M e th o d   Ba se d   o n   M u lt il a b e S u p p o rt   Ve c to r   M a c h in e ,   S e c u rity  a n d   C o mm u n i c a ti o n   Ne two rk s (Hin d a wi) ,   v o l.   2 0 1 8 ,   p .   9 ,   2 0 1 8 .   [1 2 ]   M .   S a m m o u r,   e a l. ,   DN S   T u n n e l in g a   Re v iew   o n   F e a t u re s,”   In ter n a ti o n a l   J o u rn a o f   E n g i n e e rin g   a n d   T e c h n o l ogy ,   v o l.   7 ,   n o .   2 0 ,   p p .   1 - 5 ,   2 0 1 8 .   [1 3 ]   R.   Ra sm u ss e n ,   Do   y o u   k n o w   wh a y o u r   d n re so lv e is  d o i n g   ri g h t   n o w,”  S e c u rity  W e e k ,   2 0 1 2 .   [O n li n e ].   Av a il a b le:   h tt p :/ /www . se c u rit y we e k . c o m /d o - y o u - k n o w - wh a t - y o u r - d n sre so l v e r - d o i n g - r ig h t - n o w.   [1 4 ]   M .   Du si,  e a l. ,   Tu n n e h u n ter:  De tec ti n g   a p p li c a ti o n - la y e tu n n e ls  with   sta ti stica fin g e rp ri n t in g ,   Co m p u ter   Ne two rk s,   v o l .   5 3 ,   n o .   1 ,   p p .   8 1 - 9 7 ,   2 0 0 9 .   [1 5 ]   P .   E.   Va n   Th u a n   Do ,   e a l. ,   De t e c ti o n   o DN S   Tu n n e li n g   i n   M o b il e   Ne two r k Us in g   M a c h in e   Lea rn in g ,   In fo rm a t io n   S c ien c e   a n d   A p p li c a t io n 2 0 1 7   ( ICI S 2 0 1 7 ) ,   v o l.   4 2 4 ,   2 0 1 7 ,   p .   2 2 1 .   [1 6 ]   M .   Aie ll o ,   e a l. ,   DN S   tu n n e li n g   d e tec ti o n   th r o u g h   sta ti stica fin g e rp r in ts   o f   p r o t o c o l   m e ss a g e a n d   m a c h in lea rn in g ,   In ter n a ti o n a J o u rn a o Co mm u n ica ti o n   S y ste ms ,   v o l.   2 8 ,   n o .   1 4 ,   p p .   1 9 8 7 - 2 0 0 2 ,   2 0 1 5 .   [1 7 ]   G .   F a rn h a m   a n d   A.  Atlas is,  De te c ti n g   DN S   tu n n e li n g ,   I n f o S e c   Re a d i n g   Ro o m ,   2 0 1 3 .   [1 8 ]   S .   B.   Ko tsian ti s,   e a l. S u p e r v ise d   m a c h i n e   lea rn i n g :   re v i e o c las sif ica ti o n   tec h n i q u e s ,   In f o rm a ti c a   p p .   2 4 9 - 2 6 8 ,   2 0 0 7 .   [1 9 ]   M .   Du si,   e a l. ,   De tec ti o n   o e n c ry p ted   tu n n e ls  a c ro ss   n e tw o rk   b o u n d a ries ,   i n   IEE In ter n a ti o n a Co n fer e n c e   o n   Co mm u n ica ti o n ( ICC'0 8 ) 2 0 0 8 p p .   1 7 3 8 - 1 7 4 4 .   [2 0 ]   F .   Allard ,   e a l. ,   T u n n e li n g   a c ti v i ti e s d e tec ti o n   u sin g   m a c h in e   lea rn in g   tec h n i q u e s,   DTIC  Do c u m e n t ,   2 0 1 0 .   [2 1 ]   M .   Aie ll o ,   e t   a l. ,   Ba sic   c las sifiers   fo DN S   tu n n e li n g   d e tec ti o n ,   in   2 0 1 3   IE EE   S y mp o si u o n   Co mp u ter a n d   Co mm u n ica ti o n s (IS CC) ,   2 0 1 3 ,   p p .   0 0 0 8 8 0 - 0 0 0 8 8 5 .   [2 2 ]   A.  L.   B u c z a k ,   e a l. ,   De tec ti o n   o f   Tu n n e ls  i n   P CAP  Da ta  b y   Ra n d o m   F o re sts,”   i n   Pr o c e e d in g o f   t h e   1 1 t h   A n n u a Cy b e r a n d   In f o rm a ti o n   S e c u rity R e se a rc h   Co n fer e n c e 2 0 1 6 p .   1 6 .   [2 3 ]   M .   Aie ll o ,   e t   a l. ,   P ro fil in g   DN S   tu n n e li n g   a tt a c k wit h   P CA  a n d   m u tu a l   in f o rm a ti o n ,   L o g ic   J o u rn a o f   IGPL   v o l.   2 4 ,   n o .   6 ,   p p .   9 5 7 - 9 7 0 ,   2 0 1 6 .   [2 4 ]   I .   Ho m e m ,   e t   a l. ,   En tr o p y - b a se d   P re d ictio n   o f   Ne two rk   P r o to c o ls  i n   th e   F o re n sic   An a ly sis   o f   DN S   Tu n n e ls,”   a rXiv:1 7 0 9 . 0 6 3 6 3 ,   2 0 1 6.   [2 5 ]   Y.  S o n g ,   e t   a l. ,   An   imp r o v e d   g e n e ti c   a lg o rit h m   fo n u m e rica f u n c ti o n   o p ti m iza ti o n ,   A p p li e d   In tel li g e n c e ,   v o l.   4 9 n o .   5 ,   p p .   1 8 8 0 - 1 9 0 2 ,   2 0 1 9 .   [2 6 ]   R.   Vijay a n a n d ,   e a l. ,   In tru si o n   d e tec ti o n   sy ste m   fo wire les m e sh   n e two rk   u si n g   m u lt ip le  su p p o rt  v e c to m a c h in e   c las sifiers   with   g e n e ti c - a lg o rit h m - b a se d   fe a tu re   se lec ti o n ,   C o mp u t e rs   &   S e c u rity,   v o l .   7 7 ,   p p .   3 0 4 - 3 1 4 ,   2 0 1 8 .   [2 7 ]   C.   C.   Ch a n g   a n d   C.   J.   Li n ,   LIBS VM:   a   li b ra r y   f o r   su p p o r v e c to m a c h i n e s,”   ACM   T r a n s a c ti o n o n   I n telli g e n t   S y ste ms   a n d   T e c h n o lo g y   (T I S T ),   v o l.   2 ,   n o .   3 ,   p .   2 7 ,   2 0 1 1 .   [2 8 ]   I.   Ho m e m   a n d   P .   P a p a p e tr o u ,   Ha rn e ss in g   P re d icti v e   M o d e ls  fo As sistin g   Ne two rk   F o re n sic   In v e stig a ti o n o f   DN S   Tu n n e ls,”  ADFS L   A n n u a l   C o n fer e n c e   o n   Dig i ta l   Fo re n sic s,  S e c u rity a n d   L a w 2 0 1 7 ,   p p .   1 - 11 .   Evaluation Warning : The document was created with Spire.PDF for Python.