I n d on e s i an   Jo u r n al   o El e c t r i c al   En gi n e e r i n g   an d   C o m p u te r   S c i e n c e   V o l .   1 8 ,   N o .   2 M a y   20 20 ,   pp .   1074 ~ 108 0   IS S N :   2502 - 4752 ,   D O I :   10. 1 1591 / i j e e c s . v 1 8 .i 2 . pp 107 4 - 108 0             1074       Jou r n al   h o m e pa ge ht t p: / / i ae s c or e . c om / j our na l s / i nde x . php/ i j e e c s   E f f i c i e n t   m e t h o d   f o r   b r e a st   c a n c e r   c l a ssi f i c a t i o n   b a s e d   o n   e n sem b l e   h o f f e d i n g   t r e e   a n d   n a ï v e   B a y e s       R o yi d A .   I b r ah e m   A l h ay al i 1 M u n e A b d u l l ah   A h m e d 2 ,   Y as m i n   M a k k i   M o h i al d e n 3 ,   A h m e d   H.   A l i 4   1 D e pa r t m e n t   o f   C o m put e r   E ng i ne e r i ng ,   C o l l e g e   o f   E ng i ne e r i ng ,   U n i v e r s i t y   o f   D i y a l a ,   D i y a l a ,   I r a q   2 F a c ul t y   of   A l - H a w i j a   T e c hni c a l   i n s t i t ut e ,   N o r t h e r n   T e c h n i c a l   U n i v e r s i t y ,   I r a q   3 D e pa r t m e n t   o f   C o m put e r   S c i e nc e ,   C o l l e g e   O f   S c i e nc e ,   M us t a n s i r i y a U ni v e r s i t y ,   I r a q   4 A L   S a l a m   U n i v e r s i t y   C o l l e g e   C o m put e r   S c i e nc e   D e pa r t m e nt   B a g h da d,   I r a q       A r ti c l e   I n fo     A B S TR A C T     Ar t i c l e   h i s t or y :   R e c e i v e A ug  22,   201 9   R e v i s e N o v   23,   2019   A c c e pt e D e c   7,   20 19       T he   m o s t   da ng e r o us   t y pe   o f   c a nc e r   s uf f e r e by   w o m e a bo v e   35  y e a r s   o f   a g e   i s   b r e a s t   c a nc e r .   B r e a s t   C a nc e r   d a t a s e t s   a r e   no r m a l l y   c ha r a c t e r i z e b y   m i s s i ng  da t a ,   h i g di m e ns i o na l i t y ,   no n - no r m a l   d i s t r i bu t i o n,   c l a s s   i m b a l a nc e ,   no i s y ,   a nd   i nc o ns i s t e nc y .   C l a s s i f i c a t i o i s   a   m a c hi n e   l e a r n i ng   ( M L )   p r o c e s s   w hi c h a s   a   s i g ni f i c a n t   r o l e   i n   t he   p r e d i c t i o n   o f   o ut c o m e s ,   a nd   o ne   o f   t he   o ut s t a n di ng  s upe r v i s e d   c l a s s i f i c a t i o n   m e t ho ds   i n   d a t a   m i n i ng   i s   N a i v e s   B a y e s s   C l a s s i f i c a t i o n   ( N B C ) .   N a ï v e   B a y e s   C l a s s i f i c a t i o ns   i s   g o o a t   pr e d i c t i ng   o ut c o m e s   a nd  o f t e n   o ut pe r f o r m s   o t he r   c l a s s i f i c a t i o ns   t e c hni qu e s .   O ne s   o f   t he   r e a s o ns   be hi n t hi s   s t r o ng   pe r f o r m a nc e   o f   N B C   i s   t h e   a s s um pt i o ns   o f   c o ndi t i o na l   I nde pe nd e nc e s   a m o ng   t h e   i n i t i a l   p a r a m e t e r s   a nd   t he   pr e d i c t o r s .   H o w e v e r ,   t hi s   a s s um pt i o i s   no t   a l w a y s   t r ue   a nd  c a n   c a us e   l o s s   o f   a c c ur a c y .   H o e f f di ng   t r e e s   a s s um e   t h e   s u i t a bi l i t y   o f   us i ng   a   s m a l l   s a m p l e   t o   s e l e c t   t h e   o pt i m a l   s p l i t t i ng   a t t r i bu t e .   T h i s   s t u dy   pr o po s e s   a   ne w   m e t ho f o r   i m pr o v i ng  a c c ur a c y   o f   c l a s s i f i c a t i o o f   br e a s t   c a nc e r   d a t a s e t s .   T he   m e t ho p r o po s e s   t he   us e   o f   H o e f f di ng   t r e e s   f o r   no r m a l   c l a s s i f i c a t i o a nd   n a ï v e   B a y e s   f o r   r e duc i ng   da t a   d i m e n s i o na l i t y .   Ke y w or d s :   B r e a s t   c a n c e r   Cl a s s i f i c a t i o n   H o e ff di n t r e e   M a c hi n e   L e a rn i n g   N a ï v e   B a y e s     C opy r i gh t   ©   20 20   I n s t i t ut e   o f   A dv anc e E ng i ne e r i ng   and   S c i e nc e .     A l l   r i gh t s   r e s e r v e d .   Cor r e s pon di n g   Au t h or :   Roy i da   A .   Ib r a h e m   A l ha y a l i ,   D e pa rt m e n t   o f   Co m put e E ngi n e e ri n g ,   Co l l e ge   o f   E n g i n e e r i ng,   U n i v e r s i t y   of   D i y a l a ,   D i y a l a ,   I ra q .   E m a i l :   r oy i da . a l h a y a l i @ e n g i n e e r i ng. uo di y a l a . e du. i q       1.      I N TR O D U C TI O N     B r e a s t   c a n c e r   i s   t h e   s e c o n l e a d i n g   c a n c e a m o n g   w o m e n   w o r l dw i de   [ 1 ] .   T h e   o c c urr e n c e   o f   b r e a s t   c a n c e i s   i n c r e a s i n g   y e a r ly   due   t o   h e r e di t y ,   i n c r e a s e d   l i f e   e xp e c t a n c y ,   di f fe r e n t   l i f e s t y l e s ,   a n d   f oo h a b i t s .   T h is   r e s e a r c h   p r i m a ri l y   a i m e a t   b ui l d i n g   c l a s s i f i c a t i o n   m o de l   f or   b r e a s t   c a n c e r   c l a s s i f i c a t i o n,   a s   w e l l   a s   p r o v i d i n g   a n   a c c ur a t e   di a g n o s i s   t o   p h y s i c i a n s   t o   p r o v i de   e f fe c t i ve   t r e a t m e nt   t o   s a v e   l i f e .   T hus ,   a n   e f f i c i e n t   c l a s s i f i c a t i o m o de l   c a h e l p   t o   r e duc e   c a n c e r - r e l a t e d   m o r t a l i t y   a m o n g   w o m e n .   Cl a s s i f i c a t i o n   i s   o n e   o f   t h e   b e s t   a v a i l a b l e   da t a   m i ni n t e c hni que s   f o r   t h e   p r e di c t i o o f   o ut c o m e s   f r o m   a   g i v e n   da t a s e t .   T h e   N B [ 2 3 ]   i s   a   w e l l - k n o w n   s upe r v i s e c l a s s i f i e r   w hi c h   c a b e   us e t o   pr e di c t   o ut c o m e   f ro m   a   g i v e n   d a t a   s e t .   T h e   N B ge n e r a l l y   e xh i b i t s   go o pe r fo r m a n c e   w h e n   c o m pa r e t o   o t h e c l a s s i f i e r s ;   s uc pe r f o r m a n c e s   a r e   a t t ri b ut e t o   t h e   s i m pl e   na t u r e ,   l e s s   c o m put a t i o n a l   di f f i c ul t y ,   goo pr e d i c t i o a c c u r a c y ,   a n d   l e s s   m e m o r y - de pe n de n c e   o f   t h e   N B C N B a l s o ut pe r f o r m s   o t h e r   c l a s s i f i e r s   due   t o   t h e   a s s u m pt i o o f   i n de pe n de n c e   b e t w e e n   t h e   p r e di c t o r s .   H ow e v e r ,   t h e   a c c ur a c y   of   N B i s   us u a l l y   l o s t   due   t o   t h i s   a s s um p t i o o f   I n d e pe n de n c e   a n d   b a d   i n i t i a l i z e d   pa ra m e t e r [ 4 ] T h e   pr e s e n c e   o f   i n t e r - r e l a t e a t t r i b ut e s   i da t a s e t s   c a a l s o   a f f e c t   t h e   a c c u r a c y   of   N B C .   T h e r e f o r e ,   i t   i s   a   t e di o us   tas t o   i m p r o v e   t h e   a c c ur a c y   of   N B C   w i t p a r a m e t e o pt i m i z a t i o n   [ 5 ] D a t a   d i m e n s i o n a l i t y   i s   n o rm a l l y   r e duc e us i n g   f e a t ur e   s e l e c t i o (F S t e c hni que s .   T h e   F S   t e c hni que   e l i m i na t e s   i rr e l e v a nt   a n d   r e du n d a n f e a t u r e s   f r o m   da t a s e t s   a s   t h e y   h a v e   n o   i m po r t a n t   pa rt   t o   p l a y   du r i ng   t h e   c l a s s i f i c a t i o n   p r o c e s s B r e a s t   c a n c e da t a s e t   ha s   762691   i n s t a n c e s   w i t h   1 34  a t t r i b ut e s ;   h o w e v e r ,   o n l y   a t t ri b ut e s   a r e   o f t e n   i n v o l v e i c l a s s i f i c a t i o p r o c e s s   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E f f i c i e n t   m e t h od  f or   br e as t   c a nc e r   c l as s i f i c at i on  bas e d   on   e n s e m bl e   ( R oy i da   A .   I br ahe m   A l ha y al i )   1075   us i n F S   t e c hn i q ue .   I t hi s   s t udy ,   a   n o v e l   a pp r o a c o f   us i n h o e ff di n t r e e   t o   m i ni m i z e   a c c ur a c y   l o s s   i n   N BC   due   t o   po o pa ra m e t e r s   i ni t i a l i z a t i o i s   p r o po s e d.   H oe ff di n g   t r e e   (H T c o n s t r uc t s   a nd  a na l y z e s   de c i s i o n   t r e e s   us i n t h e   H o e ff di n b o un d .   T h e   r o l e   of   t h e   H oe ff di n b o un ds   i s   t o   de t e rm i n e   t h e   n u m b e r   o f   r e qui r e i n s t a n c e s   t o   b e   e xe c ut e t o   a t t a i a   c e r t a i c o n f i de n c e   l e v e l .   T h e   pe r f o r m a n c e   o f   t h e   p r o po s e t e c hn i q ue s   w a s   e v a l ua t e d   o n   t h e   B r e a s t   Ca n c e r   D a t a   s e t   h o s t e i t h e   U CI  M a c hi n e   L e a rn i ng  R e po s i t o r y .       T h e   o r g a n i z a t i o o f   t h i s   s t udy   i s   a s   f o l l ow s :   S e c t i o n - II  r e v i e w e t h e   p r e v i o us   w o r ks   i t hi s   do m a i n   w h i l e   s e c t i o n - I I p r e s e n t e de t a i l e d i s c us s i o n s   o n   N B a nd  H oe ff di n g   t r e e .   T h e   e xpl a na t i o o f   t h e   d a t a s et  w a s   pr e s e n t e i s e c t i o n - I V   w hi l e   t h e   i m p l e m e nt a t i o o f   t he   pr o po s e m e t h o w a s   pr e s e n t e i n   s e c t i o n V .   S e c t i o n - V I   p r e s e nt e a n d   di s c us s ed   t h e   r e s ul t s   o f   t h e   e xpe r i m e nt s   w hi l e   t h e   c o n c l us i o n   d r a w f r o m   t h e   s t udy   w a s   pr e s e n t e d   i t h e   l a s t   s e c t i o n.       2.   R ELA TED   WO R K   B r e a s t   c a n c e c l a s s i f i c a t i o ha s   r e c e i v e s e ve r a l   r e s e a r c i n t e r e s t s ;   t h e r e f o r e ,   t h e   s t udy   of   da t a   m i n i ng  t e c hn i q ue s   a n i m p r o v i n t h e   c l a s s i f i c a t i o n   o f   b r e a s t   c a n c e i s   hi g h l y   r e qui r e d .   T h i s   s e c t i o p r o v i de s   a   b r i e f   r e v i e w   of   s o m e   of   t h e   p r e v i o us   w o r ks   r e l a t e t o   t hi s   s t udy .   A t t a r o di   e t   a l .   [ 6 ]   p r e s e nt e t h e   c o m b i na t i o n   o M e l - f r e que n c y   c e ps t ra l   c o e ff i c i e n t   (M F CC)   a n d   A u t o   Co rr e l a t i o t e c hni que s   i w hi c t h e   1 st   s o un d   ra n ge   w a s   s e pa ra t e w i t a   hi g l e v e l   o f   pr e c i s i o n.   T h e y   s uc c e e d e i us i n g   S V M   e qui ppe d   w i t h   R B F   a n d   Q u a d r a t i c   ke rn e l s   t o   c l a s s i f y   g r o ups   o f   n e w bo r n s   i nt o   n o rm a l   s o u n d,   m u r m u s o u n d   due   t o   V S D ,   a n d   m u rm u due   t o   A S   (a o rt i c   s t e n o s i s ).   A n o t h e s t udy   by   K a v i t h a   e t   a l .   [ 7 ]   r e po rt e t h e   de v e l o pm e n t   o f   a   f ra m e w o r w i t h   n u m e r o us   s t e ps   s uc a s   o ut l i e de t e c t i o a nd   P CA - gui de d   f e a t u r e   e x t r a c t i o n .   W r a ppe f i l t e w a s   us e du ri n g   t h e   s ub s e t   f e a t u r e s   s e l e c t i o t o   e n s u r e   b e t t e r e s ul t s .   T h e   s y s t e m   p r e s e n t e d   a i m p r o v e pe r f o r m a n c e   c o m pa r e d   t o   t h e   o t h e r   s c o r i n g   f un c t i o n s   s uc a s   P e a r s o c o rre l a t i o n   a nd  E uc l i de a di s t a n c e   c o e ff i c i e n t s .     S h e n f i e l e t   a l .   [ 8 ]   s ugge s t e t h e   c o n s i de r a t i o n   o f   a   m ul t i - o b j e c t i ve   a ppr o a c h   t o   A N N s ’  e vo l ut i o na r y   de s i gn  us i n a   r o b us t   o pt i m i z e b a s e o n   t h e   n o v e l   M O E A / D D R A   a l go r i t hm   a n d   i n c o r po ra t i o o f   de c i s i o n - m a ke r   pr e f e r e n c e s .   A m ra n e   e t   a l .   [ 4 ]   c l a s s i f i e b r e a s t   c a n c e r   us i n g   N B a n K - n e a r e s t   n e i g h b o r   (K N N ).   T h e y   i m p l e m e nt e d   t h e   t w o   m e t h o ds   a n d   c o m pa r e d   t h e i pe r f o r m a nc e   a c c ur a c y   us i n g   c r o s s - v a l i da t i o n .   S a r a   e t   a l .   [ 3 ]   pr e s e nt e t h e   c a t e go r i z a t i o n   a n d   a u t o m a t i c   c l a s s i f i c a t i o o f   s t r o m a l   r e g i o n s   w i t r e s pe c t   t o   t h e i m a t u ri t y ;   t h e y   pr o v e t ha t   t h i s   c l a s s i f i c a t i o n   a g r e e w i t t ha t   o f   s ki l l e ob s e r ve r s ,   h e n c e ,   p r o v i di ng  a   qua nt i t a t i v e   a n r e pe a t a b l e   m e a s u r e   f o r   p r o gn o s t i c   a p pl i c a t i o n .   T h e y   c l a s s i f i e b r e a s t   c a n c e r   s t r o m a   r e gi o n s - of - i nt e r e s t   (R O I)  us i n l o c a l   b i n a r y   pa t t e rn s   a nd  m ul t i s c a l e   b a s i c   i m a ge   f e a t u re s   i c o m b i na t i o n   w i t a   ra n do m   D T   c l a s s i f i e r.         3.   C LA S S I F I ER S   Cl a s s i f i c a t i o i s   a   s i g ni f i c a n t   p r o c e s s   i D M   a n d   i t h e   b u i l di ng   o f   l e a rn e s y s t e m s .   T h e   l e a rn i ng  a l go ri t hm   [ 9 ]   b ui l ds   a   c l a s s i f i e r   b a s e o a   s e t   o f   i n s t a n c e s ,   s uc h   a s   a   f e a t u r e   s e t   o f   v a l ue s   (x1, x 2, ….   , x n)  i n   w h i c xi   r e p r e s e n t s   t h e   v a l ue   o f   f e a t ur e   X i .   A s s um e   c   t o   b e   t he   c l a s s i f i c a t i o f e a t u r e   a n d   c   C   ℝm   a s   a n   i n s t a n c e   of   C.   Cl a s s i f i c a t i o n   a i m s   a t   e s t a b l i s hi n t h e   p r e s e n c e   o f   c l a s s e s   w i t h   a   g i v e n   s e t   o f   ob s e r v a t i o (f o r   t h e   un s upe r v i s e f o r m   o f   l e a rn i ng)   o i a   s i t ua t i o w h e r e   t h e r e   a r e   v a r i o us   c l a s s e s   a n d   t h e   a i m   i s   t o   c l a s s i fy   n e w   ob s e r v a t i o n   i nt o   a n y   of   t h e   a l r e a dy   e xi s t i ng  c l a s s e s   (f o r   t h e   s upe r v i s e fo r m   o f   l e a rni n g)  [ 10 11 ] .   T h e   c l a s s i f i c a t i o t a s i n   t h i s   s t udy   e m pl oy e t h e   s upe r v i s e f o r m   o f   l e a rn i ng.         F i gu r e   1 .   D a t a   C l a s s i f i c a t i o n     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 20   :     1074   -   1 08 0   1076   3. 1         N a ï v e   B a ye s   A   c l a s s i f i e m a i nl y   a i m s   a t   pe r f o r m i ng   a a c c ura t e   p r e di c t i o of   c l a s s   v a l ue s   c o n s i de r i ng   e a c i n s t a n c e   i n   a   s e t   o f   da t a .   T h e   N B [ 12 13 ]   i s   a   s upe r v i s e c l a s s i f i c a t i o t e c hni que   w h i c h   de pe n ds   o t h e   B a y e s   T h e o r e m   t o   p r e di c t   t h e   c l a s s   f r o m   t h e   a t t ri b ut e s   o f   a   da t a s e t .           F i gu r e   2 .   B a y e s   T h e o r e m       3. 2         H o e ffd i n g   Tr e e   ( H T)   T h i s   i s   a   r e c e n t   de v e l o pm e n t   [ 14 - 18 ]   i d a t a   c l a s s i f i c a t i o n   w hi c h   pe r f o r m s   p r e di c t i o n   by   s e l e c t i ng  t h e   m a j o r i t y   c l a s s   a t   e a c l e a f .   T h e   i n c o rpo r a t i o o f   N a i v e   B a y e s   m o de l s   a t   t h e   t r e e   l e a v e s   c a i m p r o v e   t h e   pr e di c t i v e   a c c ur a c y   of   H T .   H ow e ve r ,   t h e   na i v e   B a y e s   m e t h o h a s   b e e n   o ut l i n e d   p r e v i o us l y   t o   i n i t i a l l y   pe r fo r m   b e t t e r   t ha t h e   s t a n d a r d   H T   b ut   i s   l a t e r   o v e r t a ke n.   H e n c e ,   a   hy b r i a da p t i v e   a pp r o a c c a l l e H o e ff di n g   N a i v e   B a y e s   T r e e   (hn b t w hi c h   pe r f o rm s   b e t t e r   t ha n   t h e   c o m po n e n t   pr e d i c t i o n   m e t h o ds   f o r   bo t h   c o m pl e a n s i m p l e   c o n c e pt s   h a s   b e e n   p r o po s e d.   T hi s   c o n c e pt   of   t h i s   m e t h o b a s e o n   e xe c ut i n a   na i v e   B a y e s   pr e di c t i o n   o n   e a c h   t r a i ni n g   f e a t u r e ,   t h e n ,   c o m pa r i ng  t h e   p r e di c t i o n   pe r f o r m a n c e   w i t t h e   m a j o r i t y   c l a s s   [19 - 25] .   T h e   num b e r   o t i m e s   t h e   na ï v e   B a y e s   m a ke s   a   c o rr e c t   p r e di c t i o n   o f   t h e   t r ue   c l a s s   i s   n o t e (by   t a ki ng  c o un t s c o m pa r e t o   t h e   m a j o r i t y   c l a s s .   W h e p r e di c t i ng  a   t e s t   c a s e ,   t h e   l e a f   c a n   o n l y   o ut put   a   n a ï v e   B a y e s   pr e di c t i o n   w h e n   i t s   o v e r a l l   a c c ur a c y   i s   m o r e   t h a t h e   m a j o r i t y   c l a s s ,   e l s e ,   i t   w i l l   o ut pu t   a   m a j o r i t y   c l a s s   p r e di c t i o n   [ 26 - 2 8 ] .             4.   D A TA   S ET   W i s c o n s i n   B r e a s t   C a n c e r   D a t a b a s e   (W B C)   w a s   us e i n   t h i s   s t udy .   Th is   d a t a s e t   w a s   us e b e c a us e   i t   i s   w i de l y   us e i n   m a n y   r e s e a r c h e s .   I n   a   ge n e r a l   s e n s e ,   t e s t   r e s ul t s   f r o m   t hi s   p a pe c a n   b e   c o m pa r e w i t h   t h o s e   pr e v i o us   r e s ul t s .   W i s c o n s i n   B r e a s t   Ca n c e D a t a b a s e   (W D C)   da t a s e t   w a s   c o l l e c t e f r o m   t h e   U n i v e r s i t y   of  W i s c o n s i n   H o s pi t a l s ,   M a d i s o n   by   D r .   W i l l i a m   H . W a l b e r i n   1991.   T h e   d a t a s e t   i n c l ude s   699   i n s t a n c e s   a n 10   pa t i e nt   f e a t u r e s ,   w hi c i n c l ude   a n   i n s t a n c e   i de nt i f i e r,   t um o r   i n f o r m a t i o n,   c l a s s e s ,   e t c .   T h e r e   a r e   16  i n s t a n c e s   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E f f i c i e n t   m e t h od  f or   br e as t   c a nc e r   c l as s i f i c at i on  bas e d   on   e n s e m bl e   ( R oy i da   A .   I br ahe m   A l ha y al i )   1077   t h a t   c o n t a i a   s i n g l e   m i s s i ng  a t t r i b ut e ;   so ,   t h e s e   r e c o r ds   a r e   n o t   c o n s i de r e d.   A f t e de l e t i ng   t h e   m i s s i ng  i n f o r m a t i o da t a ,   t h e r e   a r e   683   i n s t a n c e s ,   65 . 01%   (444)   o f   t h e m   a r e   b e n i g n   c a s e s ,   a n 3 4. 9 9%  (2 39)  o f   t h e a r e   m a l i g na n t   c a s e s .   T h e   s t a t i s t i c a l   s u m m a r y   of   t h e   9   i nput   f e a t u r e s   i s   g i v e n   i n   T a b l e   1 .       T a b l e   1 .   W i s c o n s i B r e a s t   C a n c e D a t a b a s e   (W B C)   N u m b e r   o a t t ri b u t e s   D e s c ri p t i o n   o a t t r i b u t e s   Ra n g e   M e a n   S t a n d a rd   D e v i a t i o n   1   T h e   t h i c k n e s s   o t h e   c l u m p   1 . 0   - 1 0 . 0   4 . 4 4 0   2 . 8 2 0   2   Ce l l   s i z e   u n i f o r m i t y   1 . 0   - 1 0 . 0   3 . 1 5 0   3 . 0 7 0   3   Ce l l   s h a p e   u n i f o rm i t y   1 . 0   - 1 0 . 0   3 . 2 2 0   2 . 9 9 0   4   M a rg i n a l   a d h e s i o n   1 . 0   - 1 0 . 0   2 . 8 3 0   2 . 8 6 0   5   S i z e   o s i n g l e   e p i t h e l i a l   c e l l   1 . 0   - 1 0 . 0   3 . 2 3 0   2 . 2 2 0   6   Ba re   n u c l e i   1 . 0   - 1 0 . 0   3 . 5 4 0   3 . 6 4 0   7   Bl a n d   c h r o m a t i n   1 . 0   - 1 0 . 0   3 . 4 5 0   2 . 4 5 0   8   N o r m a l   n u c l e o l i   1 . 0   - 1 0 . 0   2 . 8 7 0   3 . 0 5 0   9   M i t o s e s   1 . 0   - 1 0 . 0   1 . 6 0 0   1 . 7 3 0             F i g u r e   3 .   T y pe s   of   B r e a s t   C a n c e r       5.   I M P LEM EN TA TI O N   S t e p - 1:   T h e   B r e a s t   C a n c e r   d a t a s e t   i CS V   i s   c o m put e d   a s   t h e   i n p ut .   S t e p - 2 E xe c ut e   l o g2  n o rm a l i z a t i o n   i f   t h e   s i z e   o f   t h e   d a t a s e t   i s   > 25   M B ,   e l s e ,   r e s o r t   t o   M i n - M a x   n o rm a l i z a t i o n .   S t e p - 3 P a r t i t i o n   t h e   d a t a s e t   i nt o   t w o   ( t e s t i n g   a n d   t ra i ni n g   s e t s ) C r o s s - v a l i d a t i o n   w a s   us e i n   t h i s   s t udy .   S t e p - 4 :   D i f fe r e nt i a t e   t h e   t ra i ni n g   da t a s e t   a c c o r di n g   t o   t h e   c l a s s   v a l ue s .   S t e p - 5 Co m p ut e   t h e   m e a a n d   s t a nda r d   v a l ue s   f o r   e a c h   da t a   c a s e   a c c o r di ng  t o   t h e   c l a s s   v a l ue s .   S t e p - 6 :   C h o o s e   t h e   H oe ff i di n t r e e   f o r   t h e   f i r s t   p ha s e   o f   c l a s s i f i c a t i o n.   S t e p - 7 F i r s t   e v a l u a t i o n .   S t e p - 8 F o r w a r d   t h e   m i s s - c l a s s i f i e s a m p l e   f o r   na ï v e   B a y e s .   S t e p - 9 S e c o n e v a l ua t i o n .   S t e p - 10 B ui l t h e   f i n a l   m o de l .   S t e p - 11 C o m pa r e   t h e   c l a s s   d a t a   o f   t e s t   da t a s e t   t o   de t e rm i ne   t h e   p r e di c t i o n   a c c ur a c y .   E v a l u a t e   t h e   c o m put e a c c ura c y   b a s e o n   t h e   s c a l e   o f   t o   100   %.   S t e p - 12 G e n e r a t e   t h e   p r e di c t i o n s   us i ng  t h i s   m o de l .   Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 20   :     1074   -   1 08 0   1078         F i gu r e   4 .   T h e   P r o po s e M e t h o d       6.   R ES U LTS   A N D   C O M P A R I S O N S   T h e   p r o po s e m o de l   w a s   i m p l e m e nt e o n   t h e   W B a n d   f r o m   t h e   a c h i e v e r e s ul t s ,   t h e r e   w a s   a i n c r e a s e   i n   t h e   a c c ur a c y   of   t h e   H o e ff i di n g   na ï v e   m e t h o t o   95. 994 3%  w h e S t e p - 8   w a s   i n v o l v e a n d   a b o ut   88. 33 w h e n   S t e p - w a s   n o t   i n v o l v e d.   In   S t e p - 8 ,   t h e   m i s c l a s s i f i e s a m pl e   i s   f o r w a r de f o r   n a ï v e   B a y e s   a n e v a l ua t e i t h e   s e c o n p ha s e .   U s i n g   t h e   s a m e   da t a s e t ,   t h e   i n b ui l t   N B o f   M a t l a b   r e c o r de d   a a c c ura c y   o 79. 09 %.   T h e   m e r ge d   a na l y s i s   of   t h e   s ugge s t e m e t h o i c o m pa ri s o t o   t h e   o t h e r   t e c hni que s   f o r   a c c ura c y   i s   pr e s e nt e i F i gu r e   8 .   F r o m   t h e   r e s ul t s ,   t h e   s ugge s t e m e t ho e xh i b i t e a   l o w e r   ra t e   o f   a c c ur a c y   l o s s   i n   t h e   N B ow i n t o   i t s   a s s u m pt i o n   o f   c o n di t i o n a l   i nde pe n de n c e .   H e n c e ,   t h e   m o de l   p r e s e nt e i t hi s   w o r c a n   i m p r o v e   t h e   pe r f o r m a n c e   o f   N B C.   T h e   pe r f o r m a n c e   of   t h e   pr o po s e a pp r o a c h   hi g hl i g ht e t h e   f e a s i b i l i t y   of  us i n g   H oe f f i di n g   c l a s s i f i e t r e e   w i t na ï v e   B a y e s   o b r e a s t   c a n c e da t a s e t .   T h e   r e s ul t s   s h o w n   i F i gu r e s   5 - s h o w e t ha t   t h e   s ugge s t e m e t h o c a r e duc e   t h e   ra t e   o f   a c c ur a c y   l o s s   i t h e   c l a s s i f i c a t i o o f   b r e a s t   c a n c e r   e ve n   w h e c o n di t i o na l   i n de pe n de n c e   i s   a s s um e d.   T h e   pe r f o r m a n c e   o f   N B w a s   a l s o   i m p r o ve by   t h e   pr o po s e d   m o de l   i t hi s   s t u dy .             F i g u r e   5 .   F a l s e   N e ga t i v e   R a t e   c o m pa ri s o n     F i g u r e   6 .   S e n s i t i v i t y   c o m pa r i s o n   Evaluation Warning : The document was created with Spire.PDF for Python.
In do n e s i a J   E l e c   E ng  &   Co m S c i     IS S N :   2502 - 4752       E f f i c i e n t   m e t h od  f or   br e as t   c a nc e r   c l as s i f i c at i on  bas e d   on   e n s e m bl e   ( R oy i da   A .   I br ahe m   A l ha y al i )   1079         F i g u r e   7 .   S pe c i f i c i t y   c o m pa ri s o n     F i g u r e   8 .   A c c ura c y   c o m pa ri s o n       7.   C O N C LU S I O N   A N D   R EC O M M EN D A TI O N   T h e   a c c u r a c y   of   N B i s   n o r m a l l y   a ff e c t e by   t h e   i n i t i a l   v a l u e s .   H ow e v e r ,   t hi s   a s s u m pt i o m a ke s   t h e   pr o b a b i l i t i e s   e s t i m a t i o n   e a s i e r.   I n   t h i s   s t udy ,   t h e   a do pt e s e pa ra t i o n   t e c hn i q ue   i m p r o v e t h e   c l a s s i f i e r s   a c c ur a c y   us i n t h e   N a i v e   B a y e s   t e c h ni que .   F r o m   t h e   a c h i e v e d   r e s ul t s ,   t h e   e m pl oy e a ppr o a c h   r e c o r de a   b e t t e pr e di c t i o a c c ur a c y   w h e c o m pa r e t o   t h e   t ra d i t i o n a l   N B i M a t l a b .   H e n c e ,   t h e   a c c ur a c y   of   N B c a b e   i m p r o v e by   t h e   a s s u m pt i o o f   c o n di t i o na l   i n de pe n de n c e .   T h e   p r o po s e a pp r o a c c a c l a s s i fy   i n put   b r e a s t   c a n c e d a t a   i nt o   b e n i g n,   n o n - b e n i g (m a l i g na n t ) ,   o n o rm a l   w i t a   go o l e ve l   o f   s pe c i f i c i t y ,   a c c ura c y ,   s e n s i t i v i t y ,   a n d   l o w   r a t e   o f   f a l s e   n e ga t i v e s .   T h e   m a j o r   de r i v a t i v e   f r o m   t hi s   s t udy   i s   t h a t   i t   c a n   h e l p   m e di c a l   e xpe r t s   i n   t h e   di a g n o s i s   o f   b r e a s t   c a n c e r   s i n c e   e a r l y   c a n c e d e t e c t i o n   i m p r o v e s   t h e   c ha n c e s   of   s ur v i v a l   due   t o   t h e   a d m i ni s t ra t i o o f   t h e   a pp r o p r i a t e   t r e a t m e nt .       A BB R EV I A TI O N S   N B C N a ï v e   B a y e s   Cl a s s i f i e r       R EF ER EN C ES     [ 1]   A .   B .   A s hr a f ,   S .   C .   G a v e no ni s ,   D .   D a y e ,   C .   M i e s ,   M .   A .   R o s e n ,   a nd  D .   K o nt o s ,   " A   m ul t i c ha nne l   m a r ko v   r a ndo m   f i e l d   f r a m e w o r k   f o r   t um o r   s e g m e n t a t i o w i t a a pp l i c a t i o t o   c l a s s i f i c a t i o o f   g e ne   e x pr e s s i o n - ba s e d   b r e a s t   c a nc e r   r e c ur r e nc e   r i s k , "   I E E E   t r an s ac t i o ns   on   m e di c al   i m agi ng ,   v o l .   32 ,   pp .   637 - 648 ,   201 2.     [ 2]   Y .   T a ng ,   W .   P a n,   X .   Q i u ,   a n Y .   X u ,   " T he   i de nt i f i c a t i on   o f   f u z z y   w e i ght e c l as s i f i c at i o s y s t e m   i nc or p or a t e w i t h   F uz z y   N a i v e   B a y e s   f r om   da t a , "   i I E E E   I nt e r na t i o na l   C o nf e r e nc e   o S y s t e m s ,   M a a nd   C y be r ne t i c s ,   200 2,     p.   pp .   v o l .   5.     [ 3]   S .   R e i s ,   P .   G a z i n s ka ,   J .   H .   H i pw e l l ,   T .   M e r t z a n i do u,   K .   N a i do o ,   N .   W i l l i a m s ,   e t   a l . ,   " A ut o m a t e d   c l a s s i f i c a t i o o f   br e a s t   c a nc e r   s t r o m a   m a t ur i t y   f r o m   hi s t o l o g i c a l   i m a g e s , "   I E E E   T r a n s ac t i o ns   on   B i om e di c al   E n gi ne e r i n g,   v o l .   64 ,   pp.   2344 - 235 2,   20 17.     [ 4]   M .   A m r a ne ,   S .   O uki d,   I .   G a g a o ua ,   a nd   T .   E ns a r İ ,   " B r e a s t   c a nc e r   c l a s s i f i c a t i o u s i ng   m a c hi n e   l e a r n i ng , "   i n   2018   E l e c t r i c   E l e c t r oni c s ,   C om pu t e r   S c i e nc e ,   B i om e di c al   E ng i ne e r i ng s '   M e e t i ng   ( E B B T ) ,   201 8,   pp .   1 - 4.     [ 5]   A .   M e r t ,   N .   K i l i c ,   a nd   A .   A ka n,   " B r e as t   c anc e r   c l a s s i f i c a t i on   b y   us i ng   s upp or t   v e c t or   m a c h i ne s   w i t h   r e duc e d   di m e ns i on , "   i P r o c e e di ng s   E L M A R - 2011,   2 011 ,   pp .   3 7 - 40.     [ 6]   G .   A t t a r o di ,   A .   T a r e h,   N .   J .   D a ba n l o o ,   a nd   A .   A de l i a n s e d e hi ,   " C l a s s i f i c a t i o o f   c o ng e ni t a l   he a r t   di s e a s e   by   S V M - M F C C   us i ng   pho no c a r di o g r a ph , "   i 2017   C om p ut i ng   i C ar d i o l og y   ( C i nC ) ,   201 7,   pp .   1 - 4.     [ 7]   R .   K a v i t ha   a nd  E .   K a nna n,   " A n   e f f i c i e nt   f r am e w or k   f or   he ar t   d i s e as e   c l as s i f i c a t i o us i n f e at ur e   e x t r ac t i o an d   f e at ur e   s e l e c t i o n   t e c h ni q ue   i n   d at a   m i n i ng , "   i n   20 16   I nt e r n a t i o na l   C o nf e r e nc e   o n   E m e r g i ng   T r e n ds   i n   E ng i ne e r i ng ,   T e c hno l o gy   a nd  S c i e nc e   ( I C E T E T S ) ,   2016 ,   pp .   1 - 5.     [ 8]   A .   S he nf i e l d   a n S .   R o s t a m i ,   " A   m u l t i   obj e c t i v e   app r oa c t o   e v ol v i ng  a r t i f i c i a l   ne ur al   ne t w or k s   f or   c o r on ar y   he ar t   di s e as e   c l a s s i f i c a t i on , "   i 2 015   I E E E   C o n f e r e nc e   o C o m put a t i o na l   I nt e l l i g e nc e   i B i o i nf o r m a t i c s   a nd   C o m put a t i o na l   B i o l o gy   ( C I B C B ) ,   2015 ,   pp .   1 - 8.     [ 9]   M .   D .   H o s s a i n ,   F .   Y a ng ,   M .   A be di n,   a n A .   S .   M o ha n ,   " T i m e   r e v e r s a l   m i c r ow av e   i m ag i ng   f o r   t he   l oc a l i z a t i on  and   c l a s s i f i c a t i on   o f   e ar l y   s t age   b r e as t   c a nc e r , "   i A s i a - P a c i f i c   M i c r o w a v e   C o nf e r e nc e   2011 ,   201 1,   pp .   477 - 4 80.     [ 10]   A .   H .   A l i   a nd   M .   Z .   A bdul l a h ,   " R e c e nt   t r e nds   i d i s t r i bu t e on l i ne   s t r e am   pr oc e s s i ng   pl at f o r m   f or   bi g     dat a :   S ur v e y , "   i 2018   1s t   A nnua l   I nt e r n a t i o na l   C o nf e r e nc e   o I nf o r m a t i o a n S c i e n c e s   ( A i C I S ) ,   201 8,     pp.   14 0 - 145.     [ 11]   A. - H .   A .   S a l i h ,   A .   H .   A l i ,   a nd   N .   Y .   H a s h i m ,   " J a y a :   A E v o l ut i o na r y   O pt i m i z a t i o n   T e c hni que   f o r   O bt a i ni ng   t h e   O pt i m a l   D t hr   V a l ue   o f   E v o l v i ng   C l us t e r i ng   M e t ho ( E C M ) . "   [ 12]   M .   A .   M o ha m m e d ,   R .   A .   H a s a n ,   M .   A .   A hm e d,   N .   T a pu s ,   M .   A .   S h a na n,   M .   K .   K ha l e e l ,   e t   al . ,   " A   F oc a l   l o ad   ba l an c e r   bas e a l g or i t hm   f or   t as k   a s s i gnm e nt   i n   c l oud   e nv i r onm e n t , "   i n   2 01 10 t h   I nt e r n a t i o na l   C o nf e r e nc e   o E l e c t r o ni c s ,   C o m put e r s   a nd   A r t i f i c i a l   I nt e l l i g e nc e   ( E C A I ) ,   2018 ,   pp .   1 - 4.     Evaluation Warning : The document was created with Spire.PDF for Python.
                                IS S N :   2502 - 4752   In do n e s i a J   E l e c   E ng  &   Co m S c i ,   V o l .   1 8 ,   N o .   2 M a y   20 20   :     1074   -   1 08 0   1080   [ 13]   M .   A .   M o ha m m e a nd  N .   Ţ Ă P U Ş ,   " A   no v e l   a ppr o a c o f   r e duc i ng   e ne r g y   c o ns um pt i o by   ut i l i z i ng   e nt ha l py   i m o bi l e   c l o ud   c o m put i ng , "   St u di e s   i I n f or m a t i c s   an C ont r o l ,   v o l .   26,   pp .   425 - 43 4,   20 17.     [ 14]   X .   S o ng ,   H .   H e ,   S .   N i u ,   a nd   J .   G a o ,   " A   dat a   s t r e am s   a nal y s i s   s t r at e gy   ba s e o n   hoe f f di ng   t r e e   w i t h   c onc e pt   dr i f t   on   H adoop   s y s t e m , "   i 2016   I nt e r n a t i o na l   C o nf e r e nc e   o A dv a nc e C l o ud  a nd   B i g   D a t a   ( C B D ) ,   2016 ,   pp .   45 - 48 .     [ 15]   H a m m oo d,   O .   A . ,   N i z a m ,   N . ,   N a f a a ,   M . ,   &   H a m m o o d,   W .   A .   ( 2019 ) .   R E S P :   R e l a y   S ui t a b i l i t y - ba s e R o ut i ng   P r o t o c o l   f o r   V i de o   S t r e a m i ng   i V e hi c ul a r   A H o c   N e t w o r ks .   I n t e r nat i ona l   J ou r na l   of   C om p ut e r s ,   C om m un i c a t i ons   &   C ont r o l ,   1 4( 1 ) .     [ 16]   H a s a n ,   R .   A . ,   &   M o ha m m e d,   M .   N .   ( 2 017 ) .   A   k r i l l   he r d   be ha v i o u r   i n s pi r e l o a b a l a nc i ng   o f   t a s ks   i c l o ud   c om put i ng .   S t u di e s   i n   I nf or m a t i c s   an C o nt r ol ,   26 ( 4 ) ,   41 3 - 424.     [ 17]   H a s a n ,   R .   A . ,   M o ha m m e d,   M .   N . ,   A m e e de e n ,   M .   A .   B . ,   &   K ha l a f ,   E .   T .   ( 201 8) .   D y na m i c   L o a B a l a nc i ng   M o de l   B a s e d   o S e r v e r   S t a t us   ( D L B S )   f o r   G r e e n   C o m put i ng .   A dv a nc e S c i e nc e   L e t t e r s ,   2 4( 1 0) ,   7777 - 77 82.     [ 18]   M .   A .   M o ha m m e d   a n R .   A .   H a s a n ,   " P ar t i c l e   s w ar m   op t i m i z a t i on   f o r   f a c i l i t y   l ay out   p r ob l e m s   F L P c om pr e he ns i v e   s t ud y , "   i 2 017   13 t h   I E E E   I nt e r na t i o na l   C o nf e r e nc e   o I nt e l l i g e nt   C o m put e r   C o m m uni c a t i o n   a n d   P r o c e s s i ng   ( I C C P ) ,   2 017 ,   pp.   9 3 - 99.     [ 19]   R .   A .   H a s a n ,   I .   A l ha y a l i ,   A .   R o y i da ,   N .   D .   Z a k i ,   a nd   A .   H .   A l i ,   " A a da pt i v e   c l us t e r i ng   a nd  c l a s s i f i c a t i o a l g o r i t hm   f o r   T w i t t e r   d a t a   s t r e a m i ng   i A pa c he   S pa r k , "   T E L K O M N I K A   ( T e l e c om m uni c at i on ,   C om pu t i ng ,   E l e c t r on i c s     and  C ont r o l ) ,   v o l .   17 ,   201 9.     [ 20]   M .   A .   M o ha m m e d,   Z .   H .   S a l i h,   N .   Ţ ă puş ,   a nd   R .   A .   K .   H a s a n,   " S e c ur i t y   and   ac c ou nt a bi l i t y   f or   s h ar i ng   t he   da t a   s t o r e i t he   c l o ud , "   i 2016   1 5 t h   R o E duN e t   C o nf e r e nc e :   N e t w o r ki ng   i n   E duc a t i o a nd   R e s e a r c h,   201 6,   pp .   1 - 5.     [ 21]   M un e f . A . A hm e ,   R .   A .   H a s a n   . A hm e d . H . A   , a nd   M . A . M o ha m m e d ,   U s i ng   M a c hi n e   L e a r n i ng   f o r   t h e   C l a s s i f i c a t i o o f   t he   M o de r A r a b i c   P o e t r y " ,   T E L K O M N I K A   ( T e l e c om m uni c at i on,   C om pu t i ng,   E l e c t r o ni c s   and   C on t r o l ) ,   v o l .   17. N o . 5 .     [ 22]   N a da . Q . M   , M . S h. A hm e d   , a nd   M . A . M o ha m m e d ,   C om p ar a t i v e   A n al y s i s   B e t w e e Sol a r   A nd   W i nd  T u r b i ne   E ne r g y   Sour c e s   I n   I oT   B as e O E c on om i c al   A n E f f i c i e nc y   C o ns i de r a t i o ns ,   P a pe r   p r e s e n t e a t   t he   20 19   22 s t   22 nd   I nt e r na t i o na l   C o nf e r e nc e   o C o nt r o l   S y s t e m s   a n C o m put e r   S c i e nc e   ( C S C S 22 ) .     [ 23]   R .   A .   H a s a n ,   M .   A .   M o ha m m e d ,   N .   Ţ ă puş ,   a n d   O .   A .   H a m m o o d,   " A   c om pr e he ns i v e   s t ud y :   A nt   C o l on y   O pt i m i z a t i o n   ( A C O )   f or   f a c i l i t y   l ay out   p r ob l e m , "   i n   201 16t R o E duN e t   C o nf e r e nc e :   N e t w o r k i ng   i n   E duc a t i o a nd   R e s e a r c ( R o E duN e t ) ,   20 17 ,   pp.   1 - 8 .     [ 24]   R .   A .   H a s a n,   M .   A .   M o ha m m e d,   Z .   H .   S a l i h,   M .   A .   B .   A m e e de e n ,   N .   Ţ ă pu ş ,   a nd  M .   N .   M o ha m m e d ,   " H S O :   A   H y br i S w a r m   O p t i m i z a t i o A l go r i t hm   f o r   R e duc i ng   E ne r gy   C o ns um pt i o i t h e   C l o ud l e t s , "   T E L K O M N I K A   ( T e l e c om m uni c a t i on,   C om p ut i ng ,   E l e c t r o ni c s   and   C on t r ol ) ,   v o l .   16,   pp .   2144 - 21 54 ,   2 018 .     [ 25]   Z .   H .   S a l i h ,   G .   T .   H a s a n ,   a n M .   A .   M o ha m m e d,   " I nv e s t i gat e   an anal y z e   t he   l e v e l s   o f   e l e c t r om agne t i c   r ad i a t i o ns   e m i t t e f r om   unde r g r oun pow e r   c ab l e s   e x t e nde i n   m ode r n   c i t i e s , "   i n   2 017   9 t h   I nt e r n a t i o na l   C o nf e r e nc e   o n   E l e c t r o n i c s ,   C o m put e r s   a n A r t i f i c i a l   I nt e l l i g e nc e   ( E C A I ) ,   20 17.     [ 26]   Z .   H .   S a l i h ,   M .   A .   M o ha m m e d ,   St u dy   t he   E f f e c t   of   I n t e gr a t i ng  t h e   Sol a r   E ne r g y   Sour c e   on   S t ab i l i t y   o f   E l e c t r i c a l   D i s t r i bu t i o S y s t e m ,   P a pe r   pr e s e n t e a t   t h e   20 19  22s t   2 2nd   I nt e r na t i o na l   C o nf e r e nc e   o C o nt r o l   S y s t e m s   a nd   C o m put e r   S c i e nc e   ( C S C S 22 ) .     [ 27]   A de e S a l h,   L ukm a A uda h ,   N o r   S .   M .   S ha h ,   S hi p un  A .   H a m z a h ,   P i l o t   r e u s e   s e q ue nc e s   f o r   T D D   i do w nl i nk  m u l t i - c e l l s   t o   i m p r o v e   da t a   r a t e s ,   T E L K O M N I K A   ( T e l e c om m un i c at i on ,   C om pu t i ng ,   E l e c t r on i c s   and   C on t r o l )   v o l .   17. N o . 5,   pp . 21 61 ~ 216 2019 .     [ 28]   T e j a s w i ni   R   M ur g o d,   S   M e e n a ks hi   S u nda r a m ,   S u r v e y   o unde r w a t e r   o pt i c a l   w i r e l e s s   c o m m uni c a t i o n:   pe r s pe c t i v e s   a nd  c ha l l e ng e s   I nd one s i a J ou r na l   of   E l e c t r i c a l   E ng i n e e r i ng  an C om put e r   S c i e nc e   ( I J E E C S)   V o l .   1 3,     Evaluation Warning : The document was created with Spire.PDF for Python.