I nte rna t io na l J o urna l o f   E lect rica l a nd   Co m p ute E ng in ee ring   ( I J E CE )   Vo l.   8 ,   No .   3 J u n 201 8 ,   p p .   1 6 7 1 ~ 1 6 8 3   I SS N:  2 0 8 8 - 8708 DOI : 1 0 . 1 1 5 9 1 / i j ec e . v8 i 3 . p p 1 6 7 1 - 1683     1671       J o ur na l ho m ep a g e h ttp : //ia e s co r e . co m/ jo u r n a ls /in d ex . p h p / I JE C E   Tex M ining   for  Pest  a nd   D isea se  Identifica tion  o Rice  Far m i ng   w ith  I nteractive  Tex M es sa g ing       E dio   da   Co s t a 1 H a nd a y a ni  T j a nd ra s a 2 Su pe no   Dj a na li 3   1 , 2, 3 De p a rtm e n o f   In f o rm a ti c s,  S e p u l u h   N o p e m b e In stit u te  o f   T e c h n o l o g y ,   S u ra b a y a ,   In d o n e sia   1 De p a rtme n o f   Co m p u ter S c ien c e ,   Dili   In sti tu te  o f   T e c h n o lo g y ,   Di li ,   T im o Les te       Art icle  I nfo     AB ST RAC T   A r ticle  his to r y:   R ec eiv ed   J an   1 3 ,   2 0 1 8   R ev i s ed   A p r   2 9 ,   2 0 1 8   A cc ep ted   Ma r   8 ,   2 0 1 8     T o   o v e rc o m e   p e sts  a n d   d ise a se o f   ric e   f a r m in g ,   f a r m e r a l wa y re l y   o n   in f o rm a ti o n   a n d   k n o w led g e   f ro m   a g ricu lt u ra e x p e rts  f o d e c isi o n   m a k in g .   T h e   p ro b lem   is  th a t   e x p e rts  a re   n o a lw a y a v a il a b le  w h e n   th e   f a r m e rs  n e e d   a n d   th e   c o st  is  q u it e   h ig h .   P e sts  a n d   d i se a se e li m in a ti o n   is  h a rd   to   b e   d o n e   in d iv id u a ll y   sin c e   th e   f a r m e rs  a r e   lac k   o f   k n o w led g e   a b o u t h e   p e st   ty p e th a a tt a c k   th e   rice   f ield s.   T h e   o b jec ti v e   o f   th is  stu d y   is  to   b u i ld   a   k n o w led g e - b a se d   s y ste m   th a c a n   id e n ti fy   p e sts  a n d   d ise a se in tera c ti v e l y   b a se d   o n   t h e   in f o rm a ti o n   th a h a b e e n   to ld   b y   th e   f a r m e rs  u sin g   S M S   c o m m u n ica ti o n   se rv ice s.  T h e   s y ste m   c a n   p ro v id e   c o n v e n ien c e   w a y   to   th e   fa r m e rs  in   d e li v e rin g   p e sts  a n d   d ise a se   p ro b lem   in f o rm a ti o n   u sin g   a   n a tu ra lan g u a g e .   T h e   tex m in in g   m e th o d   p e rf o rm s   to k e n izin g ,   f il terin g   a n d   p o r ter  ste m m in g   th a t   u se d   to   e x trac t   im p o rtan in f o rm a ti o n   se n b y   a   S M S   se rv ice .   T h e   m e th o d   o f   Ja c c a rd   S im il a rit y   Co e ff icie n (JSC)  w a u se d   to   c a lcu late   sim il a rit ies   o f   e a c h   p e st  a n d   d ise a se   b a se d   o n   sy m p to m th a a re   se n b y   th e   f a r m e rs  th ro u g h   S M S .   T h e   c o r p u d a tab a se   u se d i n   t h is  stu d y   c o n sists   o f   2 8 . 5 2 6   ro o w o rd s 1 . 3 0 9   s to p   w o r d s a n d   1 8 0   w o rd li st .   P e st  a n d   d ise a se   d a tab a se   re f e re n c e   in   th is  stu d y   wa o b tain e d   f ro m   th e   M in istry   o Ag ricu lt u re   a n d   F ish e (M A F T i m o r - Les te .   T h e   re su lt   o th e   e x p e ri m e n sh o w th a th e   sy st e m   is  a b le   to   id e n ti fy   th e   s y m p to m b a s e d   o n   t h e   k e y w o rd id e n ti f ied   w it h   th e   a c c u ra c y   o f   81% .   T h e   re su lt   o f   p e st  a n d   d ise a se   id e n ti f ica ti o n   h a s   th e   a c c u ra c y   o f   8 6 % .   K ey w o r d :   I n ter ac tiv te x m es s ag i n g   Kn o w led g e - b ased   s y s te m   R ice  p ests   a n d   d is ea s es   T ex t m in i n g   T im o r   L es te   Co p y rig h ©   2 0 1 8   In stit u te o A d v a n c e d   E n g i n e e rin g   a n d   S c ien c e   Al rig h ts  re se rv e d .   C o r r e s p o nd ing   A uth o r :   E d io   d C o s ta,     Dep ar t m en t o f   I n f o r m atic s ,   Sep u l u h   No p e m b er   I n s tit u te  o f   T ec h n o lo g y ,     Su r ab a y a,   I n d o n e s ia .   E m ail:  ed io co s ta7 3 @ g m ai l.c o m       1.   I NT RO D UCT I O N   Ag r icu ltu r i s   o n o f   th m ai n   m ea n s   o f   li v eli h o o d   f o r   th e   p eo p le  o f   th T im o r   L este.   Data   s h o w s   th at  a g r icu lt u r al  p r o d u ctiv i t y   i n   T im o r   L este   i s   v er y   lo w   co m p ar ed   w it h   o th er   co u n tr y   in   So u t h ea s Asi an d   4 5 o f   f ar m er s   s u r v e y ed   in   T i m o r -   L este  s u f f er   f r o m   f o o d   s h o r tag e s   b ec au s o f   cr o p   f ailu r ev er y   y ea r   [ 1 ] Nea r l y   7 6 o f   co n s u m p tio n   n ee d s   to   b i m p o r ted   b ec au s o f   t h lo w   p r o d u ctiv it y   le v el .   T h co n s u m p tio n   o f   r ice  in   T im o r - L e s te  is   1 3 5 , 0 0 0   to n s   p er   y ea r ,   w h ile  f ar m er s   p r o d u ce   o n l y   6 5 , 0 0 0   to n s ,   s o   th at  ev er y   y ea r   th e   g o v er n m e n h as  to   i m p o r r ice  f r o m   Viet n a m   [ 2 ] Far m er s   lo s an   esti m ated   av er a g o f   3 7 o f   th eir   r ice  cr o p   to   p ests   an d   d is ea s e ev er y   y ea r Far m er s '   y ield s   ar li k e l y   to   ex p er ien ce   c h a n g e s   in   th last   f e w   y ea r s .   E r ad icatio n   o f   p est s   a n d   d is ea s es  i s   d i f f ic u lt   to   b i m p le m e n ted   to   t h m ax i m u m   s in ce   m o s t   f ar m er s   d o   n o t   u n d er s ta n d   t h t y p o f   p est s   t h at  attac k   r ice  cr o p s .   A ll  k i n d s   o f   s y m p to m s   ar ec o n s id er ed   s i m ilar ,   s o   f ar m er s   u s o n l y   o n t y p o f   p esti cid to   eli m in a te  v ar iet y   o f   s y m p to m s   [ 3 ] .   T o   o v er co m th p r o b le m s   o f   p ests   a n d   d is ea s es,  s o m o f   t h w eb - b as ed   ag r icu lt u r al  ex te n s io n   s y s t e m s   [ 4 ] ,   an d   w eb - b ased   s m ar t p h o n ap p licatio n s   [ 5 ]   h av b ee n   d ev elo p ed ,   b u t o n l y   f e w   g r o u p s   o f   f ar m er s   u n d er s ta n d   th tec h n o lo g y   o f   i ts   co m p lex it y .   Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N :   2088 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  8 ,   No .   3 J u n 2 0 1 8   :   1 6 7 1     1683   1672   P ests   an d   d is ea s es  id e n ti f icati o n   h a v b ee n   d e v elo p ed   b y t h I n ter n atio n al  R ice  R e s ea r ch   I n s tit u t e   [ 6 ] T h s tu d y   h as  b u ilt  a   p est  an d   d i s ea s co n s u lti n g   a p p licatio n   ca lled   " R ice  Do ct o r "   w it h   co n s u lti n g   s er v ices  f o r   w eb - b ased   an d   a n d r o id - b ased   m o b ile  p h o n e.   S elec tio n   o f   s y m p to m s   in   t h is   s tu d y   w a s   d o n b y   m ar k i n g   c h ec k   lis t   o f   s y m p t o m s   to   b d eli v er ed .   T h p r o b le m s   ar is w h e n   s y m p to m s   ar n u m er o u s ,   s o   t h at   f ar m er s   h a v to   r e ad   o n b y   o n th e x is tin g   s y m p to m s   u n ti f i n all y   f o u n d   th s y m p to m   r ef er r ed .   W h ile,   th e   s tu d y   in   t h [ 7 ]   h as  b u ilt  t h SMS  co n s u lta tio n   s er v ices  to   s o lv t h r ice  f ar m in g   p r o b lem   s u ch   a s   th e   p est s   an d   d is ea s e s   id en ti f icatio n T h s a m s tu d y   u s in g   SMS   w as   co n d u cted   b y   [ 8 ] ,   th e   id en ti f ic atio n   p r o ce s s   u s ed   s o m p ar a m eter s   a n d   m u s t   f o l lo w ed   t h co m p lex   p r o ce d u r e,   s o   t h f ar m er s   d id   n o ea s il y   d eliv er   i n f o r m atio n   ab o u th p ests   an d   d is ea s e s   p r o b lem s .   T h g r o w i n g   u s e   o f   SMS  s er v ice  as  co m m u n icat io n   m ed i u m   b ec o m e s   o n o f   t h p latf o r m s   to   s o lv in ter ac ti v p r o b le m s .   I is   e s ti m ated   t h at  o v er   h a lf   o f   m o b ile  p h o n u s er s   g lo b all y   w ill  h a v s m ar tp h o n es   i n   2 0 1 8   [9 ] .   T h m o b ile  p h o n e   h a s   estab li s h e d   th e m s elv e s   as  t h m o s i n v ad in g   co m m u n ica tio n   m ed ia  in   th d ev elo p i n g   co u n tr ies .   T h SMS  s e r v ice  ca n   b o f   g r ea u s to   t h f ar m er s   i n   t h r u r al  co m m u n i t y   w h er t h e y   lac k   ad v an ce d   i n ter n et  s er v ice s   a n d   co m p u ti n g   tec h n o lo g y .   T h u s e   o f   SMS   s er v ice   ca n   b u ti lized   b y   t h e   f ar m er s   to   co m m u n ica te  w ith   e x p er ts   av ailab le  r e m o tel y   w it h   m u c h   ea s in   co s t - e f f ec ti v m a n n er   an d   w it h   p r o m p r esp o n s e   [ 1 0 ] T h u s e   o f   m o b ile  p h o n e   i n   T i m o r - L es te  co n t in u e s   to   in cr ea s ea c h   y ea r ,   t h d ata  s h o w   t h at  in   2 0 1 5   m o b ile  p h o n u s ag i n cr ea s ed   b y   9 0 %   [ 1 1 ] Su r v ey s   co n d u cted   b y   th U n ited   Natio n s   I n te g r ated   Miss io n   i n   T im o r - L este  ( UN MI T )   s h o w ed   th at  5 8 o f   f ar m er s   c h o o s to   u s th e   SMS  s er v ice  to   s e n d   an d   r ec eiv m e s s a g es   [ 1 2 ] .   Far m er s   ch o o s to   u s SMS  b ec au s i n ter n et   p ac k et  d ata  s e r v ice  is   s till   v er y   ex p en s iv e .   T h m o b ile  p en etr atio n   r ate  h as  b ee n   in cr ea s in g   r ap id ly   d u r i n g   th la s f e w   y e ar s   b u th n et w o r k   in f r astru ct u r is   s t ill  n o av a il ab le  to   all  th d is tr icts   in   T i m o r   L este  s o   th at  f ar m er s   h av l i m ited   ac ce s s   to   t h in ter n e t b y   u s in g   s m ar tp h o n es.   T h er ef o re ,   t h o b j ec tiv o f   t h is   s tu d y   is   to   b u i ld   k n o w led g e - b a s ed   s y s te m   t h at   ca n   id en ti f y   p est s   an d   d is ea s es  in ter ac tiv el y   b ased   o n   th in f o r m atio n   t h at  h as  b ee n   to ld   b y   th f a r m er s   u s in g   SMS   co m m u n icatio n   s er v ices T h s y s te m   ca n   b u s ed   to   li n k   f ar m er s   a n d   k n o w led g e - b ased   s y s te m   w h ich   ac ts   as  an   ex p er t.  Ou r   ap p r o ac h   is   b ased   o n   d ev elo p in g   an   i n n o v ativ an d   i n ter ac tiv I C T   to   en ab le  an   ag r icu lt u r al   k n o w led g e - b a s s y s te m   w it h   t h h elp   o f   e x p er ts Far m er s   e asil y   s e n d   SMS   u s i n g   a   n at u r al  lan g u ag e,   i.e .   t h e   tex m e s s a g es  as s o ciate d   w it h   th p r o b lem s   o f   p ests   an d   d is e ases   o f   r ice.   T h en   th p r o p o s ed   s y s te m   p r o ce s s e s   th m e s s a g es   a n d   r ep lies   th u s er s   r eq u e s t i n ter ac tiv e l y .   T h p ap e r   co n s is ts   o f   f iv s e ctio n s Fo llo w i n g   th i s   f ir s s e ctio n ,   t h s ec o n d   s ec tio n   d es cr ib es  th p r o p o s ed   m e th o d   f o r   p ests   a n d   d is ea s es   d ata  ex tr ac tio n .   Natu r al  la n g u a g e   p r o ce s s i n g   u s i n g   tex t   m in i n g   in cl u d es  to k e n izi n g ,   f il ter in g   to   s elec k e y w o r d s   an d   t h P o r ter   s te m m in g   to   g e th r o o w o r d s .   T h th ir d   s ec tio n   d escr ib es  th ex p er i m en tal  r esu lts   f o r   s y m p to m s   id e n ti f icatio n ,   p ests   an d   d is ea s es  id en ti f icatio n   u s i n g   J ac ca r d   Sim ilar it y   C o e f f icie n ( J SC ) .   Fin all y ,   th i s   p ap er   is   co n clu d ed   in   s ec tio n   f o u r .     1 . 1 .   T ex t   m i nin g   T ex m in in g   is   a   p r o ce s s   o f   d is co v er y   o f   n e w   i n f o r m a tio n   o r   ter m s   t h at  w er n o t   r ev ea led   p r ev io u s l y .   T ex m i n i n g   h a s   b ee n   ap p lied   in   s e v er al  f ield s   s u c h   as   h ea lth   [ 1 3 ] ,   telec o m m u n i ca tio n s   an d   m ar k et in g   [ 1 4 ] .   W h ile ,   in   I n d o n esia n   lan g u ag te x m i n in g   h as  al s o   b ee n   i m p le m e n ted   in   s o m ca s e s ,   s u c h   a s   s en ti m e n an al y s is   o n   s o cial  m ed ia   [ 1 5 ] h ea lth   s er v ice s   [ 1 6 ]   an d   s ec u r it y   [1 7 ] .   Fig u r 1   r ep r esen ts   th s tep s   in   th p r o ce s s   o f   te x m i n in g w ic h   co n s is t s   o f T o k en izi n g ,   Fil ter in g ,   Ste m m in g ,   T ag g i n g   an d   A n a l y s is   [1 8 ] Ho w e v er ,   t h is   s t u d y   o n l u s ed   th r ee   p r o ce s s e s ,   n a m e l y :   T o k en iz in g ,   Fil ter i n g ,   an d   Ste m m i n g .   T o k en izi n g   i s   th s ta g o f   s eg m e n ti n g   s tr i n g   in p u i n to   w o r d s .   Fi lter in g   i s   an   i m p o r tan i n f o r m atio n   co llectio n   s ta g f r o m   th p r o ce s s   o f   to k e n izi n g .   T h i s   p r o ce s s   eli m i n ate s   th n o n - f u n ct io n al  c h ar ac ter s th a t c o n s i s ts   o f   [ 1 9 ]   a.   R e m o v th s u b s eq u en t c h ar a cter s   if   t h e y   ar f o llo w ed   b y   s p ac e,     b.   R e m o v th s y m b o ls ,     c.   E li m i n ate  t h f o llo w i n g   p air s   o f   b r ac k ets,    d.   E li m i n ate  t h s i n g le  an d   d o u b le  q u o tatio n   s y m b o l,    e.   E li m i n ate  t h s las h         Fig u r 1 T h s tag es  o f   te x m i n in g   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g   I SS N:  2 0 8 8 - 8708     Text  Min in g   fo r   P est a n d   D is ea s I d en tifi ca tio n   o n   R ice  F a r min g   w ith   I n tera ctive   Text    ( E d io   d a   C o s ta )   1673   S te m m i n g   is   t h s ta g to   g et  t h r o o w o r d s   b ased   o n   t h f il ter in g   r esu lts .   T h s te m m i n g   p r o ce s s   in   I n d o n esia n   la n g u a g te x i s   m o r co m p licated   t h a n   E n g l is h   b ec au s t h er ar v ar iatio n s   o f   a f f ix e s   t h at  m u s t   b r e m o v ed   to   g et  t h r o o w o r d   [ 2 0 ] .   T h s tr u c tu r o f   I n d o n esia n   m o r p h o lo g y   h as   h i g h er   le v el  o f   co m p le x it y   th a n   t h E n g lis h   l an g u a g e.   P o r ter   s te m m i n g   is   o n m et h o d   o f   s te m m i n g   f o r   I n d o n esia n   lan g u ag e   tex t t h at  r eq u ir es a   s h o r ter   ti m co m p ar ed   to   th e   o th er   s te m m i n g   al g o r ith m .   I n   I n d o n e s ian   la n g u a g te x t,  th s u f f i x ,   p r ef i x ,   a n d   co n f i x   ( co m b in atio n   o f   t h p r ef i x   a n d   s u f f i x )   m u s b r e m o v ed   to   g et  t h r o o w o r d .   T h er ar f o u r   g r o u p s   o f   r u les  to   co n d u ct  P o r ter   s te m m in g   m et h o d   f o r   th I n d o n esia n   lan g u ag e   [ 2 0 ] .   E x a m p le,   r e m o v in g   p r ef ix   m en g ”  in   th e   w o r d   men g u n i n g men g - u n i n g   t h p r ef ix   men g   is   r e m o v ed   an d   p lu s   “k ”  b e f o r u   b ec o m e   ku n in g   ( T ab le  1 ) .   I f   w o r d   b eg in s   w i th   mem -   p atter n   ( v o w el /n o   v o w el s b y   r e m o v i n g   th p r ef i x   me m ”  f r o m   th w o r d   mem b u s u k mem - b u s u k ”,   it  b ec o m e s   b u s u k”  ( T ab le  1 ) T h m o r p h o lo g y   o f   I n d o n esia n   lan g u a g w o r d s   ca n   co m p r i s b o th   in f lectio n al   an d   d er iv atio n al  s tr u ctu r e s .   I n f lectio n al  is   th s i m p le s s tr u ctu r w h ic h   is   ex p r es s ed   b y   s u f f i x es.  R e m o v in g   t h in f lec tio n   p ar ticle  " p u n "   f r o m   t h w o r d   " ak ar p u n "   it b ec o m e s   " ak ar "   ( T a b le  2 ) .       T ab le  1 .   R u le  o f   First Or d er   Der iv atio n al  P r ef i x   P r e f i x   W o r d   R o o t   W o r d   M e a n i n g   me n g -   M e n g u n i n g   K u n i n g   Y e l l o w   me n y -   M e n y e r a n g   S e r a n g   A t t a c k   me m -   M e mb u su k   B u s u k   R o t t e n   pe m -   Pe mb u n g a a n   B u n g a   F l o w e r     T ab le  2 R u le  o f   I n f lectio n   P ar ticle   S u f f i x   W o r d   R o o t   W o r d   M e a n i n g   - P u n   A k a r p u n   A k a r   R o o t   - l a h   B a t a n g l a h   B a t a n g   S t e m   - k a h   A p a k a h   A p a   w h a t         T ab le  3 R u le  o f   I n f lectio n   P o s s es s i v P r o n o u n s   S u f f i x   W o r d   R o o t   W o r d   M e a n i n g   - ku   Bu n g a k u   B u n g a   F l o w e r   - mu   P a d i mu   P a d i   Rice   - n y a   D a u n n y a   D a u n   L e a f     T ab le  4 R u le  o f   Der iv atio n al  Su f f ix   S u f f i x   W o r d   R o o t   W o r d   M e a n i n g   - k a n   M e n y e b a b k a n   S e b a b   C a u se   - an   M a k a n a n   M a k a n   F o o d   - i   M e n d a p a t i   D a p a t   C a n         Su f f ix   r e m o v i n g   co n s is t s   o f   2   ca teg o r ies:   p o s s es s i v p r o n o u n s   a n d   d er iv at io n al  s u f f i x   ( T ab le  3   an d   T ab le  4 ) .   R e m o v i n g   ea ch   ca te g o r y   s h o u ld   o n l y   b e   d o n o n c e.   Ste m m i n g   a lg o r it h m   co m b i n ed   w it h   s to p   w o r d   co r p u s   ca n   p r o v id th h ig h   k e y w o r d s   id en ti f icat io n   ac cu r ac y .   T h r esear ch   b y   [ 2 1 ]   s h o w s   t h ac cu r ac y   o f   9 0 w it h   th e   ex tr ac tio n   k e y w o r d s   u s in g   co r p u s   w h ic h   h a s   b ee n   p r ep r o ce s s ed   b y   r e m o v in g   t h s to p   w o r d s   an d   b y   t h s te m m i n g   p r o ce s s ,   co m p ar ed   w it h   t h ac c u r ac y   o f   8 2 w h ic h   i s   p r ep r o ce s s ed   w i th o u r e m o v i n g   th s to p   w o r d s   a n d   u s i n g   s te m m i n g   p r o ce s s .     1 . 2 .   Sh o rt   m e s s a g s er v ice   ( SM S)   SMS b ec o m es   o n e   o f   th e   s er v ices  m o s t   u s ed   b y   t h u s er   b e ca u s e   it  is   c h ea p   a n d   ea s y   to   u s e .   SMS   s er v ice  h a s   b ee n   i m p le m e n te d   in   s o m p u b lic  s er v ices,  s u ch   as  s ex u al  h ea lth   ed u ca ti o n   [ 2 2 ] .   T h SMS  m es s ag e s   w er e   u s ed   f o r   h ea l t h   i n f o r m atio n   s h ar i n g   p u r p o s e   lik e   co m m u n icatio n   b et w ee n   p atie n t   a n d   h ea lt h   clin ic s ,   s ex u al  h ea lt h   ed u ca ti o n   an d   s o   o n .   W h ile,   in   th ag r icu l tu r e,   r esear ch   f o r   co r n   f ar m er s   h ad   b ee n   i m p le m en ted   [ 2 3 ] .   T h r esea r ch   f o cu s s ed   o n   t h e   h o w   to   u s SMS   s er v ices  to   h elp   f ar m er s   to   b ab le  to   id en ti f y   t h b est  d ate  to   s tar t   p lan tin g ,   b est  d ate  to   h ar v e s an d   o p ti m al  w a ter   av ailab i lit y   as  w ell  as  t h e   p r o j ec ted   cr o p   y ield .   An o t h er   w o r k   b y   [ 2 4 ]   ev al u ated   m o b il e - p h o n e   b ased   co n s u lti n g   s er v ice   to   th f ar m er s .   T h s tu d y   h as  b u i lt  a   m o b ile - p h o n b ased   ag r o n o m ic  in f o r m atio n   s er v ice  ca lled   Av aa j   Otalo ”.   Ma n y   f ar m er s   u s ed   th is   s er v icef o r   g ettin g   ex p er ad v ice  r eg ar d in g   co tto n   f ar m i n g .   So m co u n tr ies s u c h   as  I n d ia,   T an za n ia   an d   Ke n y a   h a v al s o   i m p le m en ted   k n o w led g e - b ased   SMS   s er v ice   to   p r o v i d ea s in es s   f o r   th e   f ar m er s   to   co n s u lt  w it h   ex p er t s   [2 5 ] .   W ch o s to   u s SMS  s er v ice  b ec au s e:    a.   L o w   co s t a n d   SM S ser v ice s   ar av ailab le  in   all  s m ar tp h o n es,     b.   E as y   to   u s ed   b y   f ar m er s   b ec au s o f   it s   s i m p lici t y ,     c.   GSM  m o b ile  s er v ice  is   a v aila b le  w id el y   t h a n   o th er   s er v ices  lik GP R S [ 1 0 ] .     T h A tte n tio n   C o m m an d   ( AT C )   u s ed   to   s e n d   an d   r ec ei v SMS  ar d escr ib ed   i n   T ab le  5   [ 2 6 ] C o n n ec t G SM  o r   C DM A   m o d e m   to   th co m p u ter   an d   t h en   u s in g   A T C   f o r   s en d i n g   tex m e s s a g es.   Mo b ile  p h o n e   o r   GSM/C DM A   m o d e m   w ill  r esp o n d   b y   g i v in g   P r o to co Data   Un it  ( P DU)   o f   th d esire d   SMS,  w h ic h   in cl u d ed   th n u m b er   o f   t h e   s e n d er ,   s en d in g   ti m e,   a n d   t h co n ten t   o f   th SMS   s e n t.  T h e   task   o f   P DU  is   to   en co d SMS - C en ter   d ata,   s o   th at  th m es s ag e s   s en b y   th s y s te m   w ill  b r ec eiv ed   b y   t h e   u s er .         Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N :   2088 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  8 ,   No .   3 J u n 2 0 1 8   :   1 6 7 1     1683   1674   T ab le  5 Sen d   an d   R ec eiv i n g   SMS  A T   co m m a n d s   S e n d i n g   S M S   R e c e i v i n g   S M S   A t t e n t i o n   c o mm a n d s   U sag e   A t t e n t i o n   c o mm a n d s   U sag e   A T + C M G S   S e n d   S M S   A T + C N M I   I d e n t i f y   n e w   me ssag e   A T + C M S S   S e n d   S M S   f r o m st o r a g e   A T + C M G L   L i st   a l l   t h e   me ssag e   A T + C M G W   W r i t e   S M S   t o   st o r a g e   A T + C M G R   R e a d   t h e   me ssag e   A T + C M G D   D e l e t e   S M S   A T + C N M I   I d e n t i f y   n e w   me ssag e       1 . 3 .   J a cc a rd  s i m ila rit y   co ef f icient   ( J SC)   J SC   h as  b ee n   ap p lied   in   v ar io u s   f ield s   a n d   is   o n o f th s i m ilar it y   in d e x es   m o s w id el y   u s ed   on   b in ar y   d ata  ( 0   an d   1 )   [2 7 ] .   T h f o r m u la  f o r   ca lcu la tin g   t h s i m ilar it y   b et w ee n   o b j ec ts   A   a n d   B   ar e   as f o llo w s :     B A B A B A J ) , (     W h er e ) , ( B A J   is   s i m ilar it y   b et w ee n   A   to   B ,   | | B A ( A   I n ter s ec t io n   B )   is   th s et  co n tai n i n g   j u s th o s e   ele m e n ts   co m m o n   to   b o th   a n d   B .   A n d | | B A ( A   Un io n   B )   i s   i s   t h s et  co n tai n i n g   ev er y th in g   in   eith er   o r   B   o r   b o th .       2.   RE S E ARCH   M E T H O D   P ests   an d   d is ea s es  d ata  in   th i s   s tu d y   w er o b tain ed   f r o m   in t er v ie w s   w it h   th e x p er ts   o f   th p est  an d   d is ea s r esear ch   d ep ar t m en t,   Min i s tr y   o f   Ag r icu lt u r a n d   F is h er   ( M AF)   T im o r - L e s te .   Fi g u r 2   d escr ib e s   al l   p r o ce s s   o f   th s y s te m   to   co n n ec th f ar m er s   w it h   k n o w led g e - b a s ed   s y s te m s   to   id en ti f y   p ests   an d   d is ea s es  o f   r ice  p lan ts .   T h is   p r o ce s s   c o n s is ts   o f   k n o w led g e - b ased cr ea ti ng ,   te x m i n i n g   SM S   test in g ,   s y m p to m s   id en ti f icatio n ,   p est s   an d   d is ea s es id en ti f icatio n   an d   in ter ac tiv it y           Fig u r 2 S y s te m   ar ch itect u r f o r   p ests   an d   d is ea s e s   id en ti f ic atio n       2 . 1 .   K no w ledg e - ba s ed   cr ea t ing   T h p r o ce s s   o f   k n o w led g e - b ased   cr ea tin g   co n s is t s   o f   th r ee   s tep s :   d ata  co llecti n g   o f   p ests   an d   d is ea s es  f r o m   e x p er ts ,   l ab elin g   b ased   o n   r ice  p lan co m p o n en ts   f r o m   t h g r o w t h   p r o ce s s   u n til  h ar v e s t   an d ass i g n i n g   b in ar y   n u m b er s   f o r   p ests   an d   d is ea s es   s y m p t o m s th e n   s to r ed   in   t h d atab ase   r ef er en ce .   T h r esu lt s   o f   lab e lin g   b ased   o n   th p ar t   o f   r ice  f ar m i n g   p r o b le m s   o f   t h g r o w th   p r o ce s s   u n ti h ar v est in g ,   w h ic h   co n s is t o f   1 4   p ar ts   is   s h o w n   in   T a b le  6 .               Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g   I SS N:  2 0 8 8 - 8708     Text  Min in g   fo r   P est a n d   D is ea s I d en tifi ca tio n   o n   R ice  F a r min g   w ith   I n tera ctive   Text    ( E d io   d a   C o s ta )   1675   T ab le  6 L ab elin g   b ased   o n   T h P ar t   o f   R ice  Far m in g   M o r p h o l o g y   M e a n i n g   L a b e l i n g   D a u n   L e a f   a   B a t a n g   S t e m   b   A k a r   R o o t   c   B i j i   S e e d   d   B i b i t   S e e d i n g   e   M a l a i   T a sse l   f   P u c u k   S h o o t   g   P e mb u n g a a n   F l o w e r i n g   h   A n a k a n   T i l l e r i n g   i   P e l e p a h   M i d r i b   k   K e c a mb a h   S p r o u t   l   T a n g k a i   S t a l k   m   P e mb i j i a n   S e e d i n g   n   T u n a s   B u d   o       T h n ex p r o ce s s   w as  lab eli n g b ased   o n   th s y m p to m s   o f   ea ch   m o r p h o lo g y   t h at  w er attac k ed   b y   p ests   an d   d is ea s e s .   P ar t o f th class i f icatio n   r esu lts   ar s h o w n   in   T ab le  7 .       T ab le  7 L ab elin g   S y m p to m s   b ased   o n   Mo r p h o lo g y   i n   P ar t o f   R ice  Far m i n g   S u b   M o r p h o l o g y   M e a n i n g   L a b e l i n g   D a u n   L e a f   a   d a u n   b u s u k   r o t t e n   l e a f   a 1   d a u n   k e r i n g   d r y   l e a f   a 2   d a u n   g u l u n g   c u r l i n g   l e a f   a 3         d a u n   p u t i h   w h i t e   l e a f   a 89   B a t a n g   S t e m   b   b a t a n g   p e n d e k   t e r se   st e m   b 1   b a t a n g   k e r i n g     d r o u g h t y   st e m   b 2   b a t a n g   k u n i n g   y e l l o w   st e m   b 3         b a t a n g   h i t a m   b l a c k   st e m   b 16   A k a r   R o o t   c   a k a r   b u s u k   r o t t e n   r o o t   c 1   a k a r   h i t a m   b l a c k   r o o t   c 2   a k a r   c o k l a t   b r o w n   r o o t   c 3         a k a r   k a sar   c o a r se   r o o t   c 9         T u n a s   S h o o t   p       T h last   s tep   o f   th k n o w led g e - b ased   cr ea tin g   p r o ce s s   is   to   b u ild   r u le - b ased   s y s te m   i n   t h f o r m   o f   co lu m n s   u s in g   t h b in ar y   v al u es  0   an d   1 p ar o f   th e m   is   s h o w n   in   T ab le  8 T h v alu es  o f   1   in d icate   th at  t h s y m p to m s   o cc u r   f o r   th p ests   an d   d is ea s es,  w h er ea s   th v al u es  o f   0   in d icate   t h at  th s y m p to m s   d o   n o o cc u r .   I n   th i s   ca s e,   it  is   as s u m ed   th at  all  th p ests   a n d   d is ea s es  h av e   th s a m w e ig h ti n g   f ac to r s .   T h at  is ,   t h er ar n o   s y m p to m s   th at  h a v th h i g h er   v alu t h a n   th o t h er   s y m p to m s .       T ab le  8 R u le  b ased   P ests   an d   Dis ea s e s   P e st s a n d   d i se a se s   a 1   a 2   a 3   a 4   a 5   a 6   a 7   a 8     p 3   H a ma  p u t i h   0   0   1   0   0   0   0   0     0   H a ma  p u t i h   0   0   1   0   0   0   0   0     0   H a ma  p u t i h   0   0   1   0   0   0   0   1     0   G a r i c o k l a t   d a u n   1   0   0   0   1   1   0   1     0   G a r i s c o k l a t   d a u n   1   0   0   0   1   0   0   1     0   G a r i s c o k l a t   d a u n   1   0   0   0   1   1   0   0     0   B e r c a k   c o k l a t   se mp i t   0   0   0   0   1   1   1   1     0   B e r c a k   c o k l a t   se mp i t   0   0   0   0   1   0   1   1     0   B e r c a k   c o k l a t   se mp i t   0   0   0   0   1   1   1   1     0       E ac h of   p es an d   d i s ea s co n s is t s   o f   th r ee   v ar ia n ts   o b tain ed   f r o m   t h r ee   e x p er ts .   T h er is   s o m e   s i m ilar it y   o f   s y m p to m s   o w n e d   b y   th th r ee   v ar ian t s .   Fo r   a n   e x a m p le,   t h er ar s i m i lar it y   o f   th p e s Ha m Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N :   2088 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  8 ,   No .   3 J u n 2 0 1 8   :   1 6 7 1     1683   1676   p u tih ”  ( lea f f o ld er )   s y m p to m s ,   i.e .   a 3 = d au n   g u lu n g ”  ( cu r li n g   lea f )   w h ic h   i s   o w n ed   b y   th e   th r ee   v ar ia n ts .   B u t   th er ar also   s y m p to m s   th a ar n o s h ar ed   b y   th t w o   o th er   v ar ian t s ,   s u ch   as  s y m p to m s   o f   a 8 = d a u n   b er g ar is ”  ( s tr ip ed   leaf )   w h ic h   i s   o n l y   f o u n d   in   t h las t v ar ia n t .     2 . 2 .   T ex t   m i nin g   o n s m s   t esting   SMS  e x tr ac tio n   w as  u s ed   t o   co llect  i m p o r tan i n f o r m atio n   b ased   o n   SMS  co n ten d el iv er ed   b y   f ar m er s .   T o   ex tr ac u n s tr u ctu r SMS,  th a u th o r s   ad o p th T o k en izin g ,   Fil ter i n g ,   a n d   Ste m m in g   al g o r ith m   as   p r o p o s ed   in   [ 19 ],   [ 28 ].   T h p u r p o s o f   t h o s th r ee   s tep s   w a s   to   i m p r o v e   t h e   ef f ec ti v e n es s   o f   t h s y s te m .   Ke y w o r d s   o b tain ed   f r o m   to k e n izi n g   a n d   f ilter i n g   w er m at ch ed   w it h   th e   lis t   o f   k e y w o r d s   in   th d atab ase  o f   s y m p to m s   o f   r ice  p ests   a n d   d is ea s es.  I f   t h er w as  m at ch   th e n   t h s y s te m   p r o ce ed ed   to   th p r o ce s s   o f   s te m m i n g .   C o n v er s el y ,   w h e n   th er w a s   n o   m atc h ,   th s y s te m   s e n m es s ag o f   f ail u r an d   d ir ec ted   f ar m er s   to   r esu b m it  p r o b lem s   r elate d   to   p ests   an d   d is ea s es  o f   r ice.   T h f i n al  s ta g o f   th SMS  e x tr ac tio n   p r o ce s s   w as   s te m m i n g   in   o r d er   to   o b tain   r o o w o r d   an d   k e y w o r d s   f r o m   t h p r ev io u s   p r o ce s s .   C o r p u s   I n d o n esia n   lan g u ag e   in   t h i s   s tu d y   co n s is ted   o f   2 8 ,   526   r o o w o r d s   a n d   1 . 3 0 9   s to p   w o r d s   [ 2 9 ] T h w o r d   lis o f   p est s   a n d   d is ea s e s   co n s is ted   o f   1 7 9   w o r d s   o b tain ed   f r o m   t h e x tr ac tio n   t h s y m p to m s   o f   p est s   an d   d is ea s e s   o f   r ice.     2 . 3 .   Sy m pto m s   ide ntif ica t io n   T h r esu lt  o b tain ed   f r o m   t h r o o w o r d   w o u ld   b m atc h ed   w it h   s y m p to m s   d atab ase  to   id en ti f y   p est s   an d   d is ea s es.  T h le v el  o f   d if f icu lt y   i n   t h is   p r o ce s s   i s   h o w   t o   tr an s late  t h n atu r al  lan g u ag th at  h as  b ee n   to ld   b y   th e   f ar m er s   u s in g   SMS  c o m m u n icatio n   s er v ices .   I n   g en er al,   th e   lan g u ag e   o f   co m m u n icat io n   u s ed   b y   f ar m er s   i s   u n s tr u ct u r ed ,   lik n o u n s ,   ad j ec tiv es,  a n d   co m p lem en ts .   T h u s   i r eq u ir es  k n o w led g e - b a s ed   s y s t e m   th at  i s   ab le  to   i n ter p r et  t h co n ten t   o f   t h s u b m itted   S MS T h s tep s   a u t h o r   s u g g e s ted   f o r   id en tify i n g   s y m p to m s   o f   p ests   a n d   d is ea s e s   b ased   o n   n at u r al  lan g u a g ar e:   a.   Sen d   SMS  u s i n g   n at u r al  la n g u ag e   b.   R e m o v i n g   p u n ct u atio n   an d   wo r d s   th at  ar n o t i m p o r tan t   c.   Dete r m i n th n o u n s   a n d   ad j e ctiv f r o m   th r o o w o r d   d.   Me r g th n o u n s   a n d   ad j ec tiv es   e.   C o m b i n ed   th w o r d s   th at  h av e   m o r th an   o n a d j ec tiv e   f.   Ma tch i n g   s y m p to m s   b ased   co m b in at io n   w o r d   th at  h a s   b ee n   g en er ated   g.   P est an d   d is ea s s y m p to m s   id en ti f icatio n   R ef er r i n g   to   s u g g es ted   s tep s   f r o m   th p r e v io u s   p r o ce s s ,   t h en   w p r o p o s ed   alg o r ith m   f o r   i d en tify i n g   th s y m p to m s   o f   p ests   a n d   d is ea s es a r s h o w n   i n   Fi g u r 3 .           Fig u r 3 .   S y m p to m s   id e n ti f ica tio n   alg o r it h m   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g   I SS N:  2 0 8 8 - 8708     Text  Min in g   fo r   P est a n d   D is ea s I d en tifi ca tio n   o n   R ice  F a r min g   w ith   I n tera ctive   Text    ( E d io   d a   C o s ta )   1677   Her is   o n ca s o f   p ests   an d   d is ea s es  p r o b lem s   th at  f ar m er s   s en u s i n g   n atu r al  la n g u a g e :   ta d p a g i   s a ya   ke   s a w a h ,   ta n a m a n   p a d s a ya   ko k   d a u n n y a   ke co kl a ta n   d a n   b erca s erta   d a u n   men g a mb a n g   s ep erti   ke tu p a t.   B a g a ima n a   ca r a   men g a ta s in ya ? .   T h at  ca s s u b s eq u e n tl y   s o lv ed   u s i n g   t h s u g g e s ted   s tep s   an d   a lg o r it h m s .   T h f ir s s tep ,   w a s   to k en izi n g   a n d   f il ter in g   to   r e m o v p u n c tu at io n   a n d   u n i m p o r ta n w o r d s   to   g e t h i m p o r tan w o r d s .   Af ter   th at,   s te m m i n g   w a s   d o n u s in g   P o r ter   alg o r ith m   to   o b tain   th r o o w o r d ,   th r esu l ar s h o w n   in   T ab le  9 T h n ex p r o ce s s   w a s   m ar k i n g   wo r d s   co n s is o f   n o u n   an d   ad jectiv e.   T h n o u n   r ef er s   to   1 4   p ar ts   o f   r ice  m a i n   p r o b lem   f r o m   g r o w t h   p r o ce s s   u n til  h ar v e s ti n g   ( T ab el  6 ) .   T h ad j ec tiv is   ty p o f   s y m p to m s   w h ich   e x is ted   in   ev er y   s y m p to m   o f   p est  a n d   d is ea s e,   s u c h   as   co kla t   ( b r o w n ) ,   b erca k   ( s p o ttin g ) an d   men g a mb a n g   ( f lo atin g ) .   So ,   th r esu lt o f   m ar k i n g   t h w o r d   is   s h o w n   i n   T ab el  1 0 .       T ab le  9 .   T h R esu lt o f   W o r d   L is t a n d   o f   R o o t W o r d   W o r d   l i st   R o o t   w o r d   M e a n i n g   d a u n n y a   d a u n   L e a f   k e c o k l a t a n   c o k l a t   B r o w n   b e r c a k   b e r c a k   S p o t t i n g   d a u n   d a u n   L e a f   me n g a mb a n g   a mb a n g   F l o a t i n g   k e t u p a t   k e t u p a t   R h o m b     T ab le  10 .   T h R esu lt o f   Ma r k i n g   W o r d   W o r d   M e a n i n g   M a r k i n g   d a u n   l e a f   n o u n   c o k l a t   b r o w n   a d j e c t i v e   b e r c a k   sp o t t i n g   a d j e c t i v e   d a u n   l e a f   n o u n   a mb a n g   f l o a t i n g   a d j e c t i v e   k e t u p a t   r h o mb   a d j e c t i v e         T h n ex t   p r o ce s s   w a s   co m b in in g   n o u n   w it h   a n   ad j ec tiv an d   s ett in g   b ac k   co m p o u n d   w o r d s   t h a t   h av m o r th a n   o n ad j ec tiv e.   Du r in g   t h e   m ar k i n g   p r o ce s s ,   ad d in g   ar r a y   d ep en d ed   o n   o b ject  k e y w o r d .   W h e n   th co m p o u n d   w o r d s   co n s is te d   o f   m o r th an   t w o   w o r d s ,   lo o p in g   w as  d o n t h en   ad d ed   n e w   ar r a y .   E x a m p le   d a u n   co kla b e r ca k”  ( s p o tted   b r o w n i s h   leaf )   m o r t h an   t w o   w o r d s .   T o   m atch   it  w it h   a   d atab ase,   th n u m b er   o f   ar r ay   lo o p in g   d o n w a s   t w i ce   d a u n   co kla t   ( b r o w n i s h   le af )   an d   d a u n   b erca k   ( s p o tte d   leaf ) s o   th r esu lt   is   as f o llo w s :         T h f in al   s ta g o f   s y m p to m s   id en ti f icatio n   p r o ce s s   w as  to   m atc h   w it h   p est s   a n d   d is ea s e s   d atab ase  r ef er en ce .   So   th at  t h r es u lt o f   s y m p to m s   id en ti f icatio n   is   as  f o llo w s :         Nex t,  th s y m p to m s   w er m a t ch ed   w i th   t h d atab ase  r ef er en ce   to   id en tify   p ests   a n d   d is ea s es.     2 . 4 .   P est  a nd   dis ea s i de ntif ica t io n   T h er w er f o u r   ( 4 )   s y m p to m s   o b tai n ed   f r o m   SMS  e x tr ac tio n ,   a 7 = d au n   co k lat”   ( b r o w n   leaf ) ,   a 9 = d au n   b er ca k ”  ( s p o tted   lea f ) ,   a 34 = d au n   a m b an g   ( f lo at  l ea f )   a n d   a 35 = d au n   k et u p at”  ( r h o m b   lea f ) .   T h o s e   f o u r   id en tific atio n   s y m p to m s   w er m atc h ed   to   s y m p to m s   f r o m   t w o   d i s ea s es  n a m el y   B er ca k   d au n   co k lat”   (B r o w n   leav e s   s p o t )   (P 1 )   an d   B last   (P 2 ) ,   s o   th illu s tr a tio n   r esu lt i s   s h o w n   i n   Fi g u r 4 .   T h er e   ar e   t w o   s y m p to m s   th at  h av e   m a tch   w it h   t h B er ca k   d au n   co k lat”  ( B r o w n   lea f   s p o t)   d is ea s (P 1 )   th at  is   a 7 = d au n   co k lat”   ( b r o w n   lea f )   a n d   a 35 =“ d au n   k etu p at”   ( r h o m b   lea f ) .   So   th at  th e   v al u o f   t h e   I n ter s ec tio n =2 ,   w h ile   o f   U n io n =1 1 ,   th e n   J SC   o b tai n ed   is   2 /1 1 =0 . 1 8 .   W h ile  B las t”  ( B last )   p ests   ( P 2 )   h a s   4   m atc h es,  n a m el y   a 7 = d au n   co k lat”   ( b r o w n   leaf ) ,   a 9 = d a u n   b er ca k ”  ( s p o tted   leaf ) ,   a 34 = d au n   a m b a n g ”  ( f lo at  leaf )   an d   a 35 = d a u n   k etu p at”  ( r h o m b   leaf ) ,   th er ef o r th v alu o f   I n ter s ec tio n =4 ,   w h ile  v alu o f   Un io n =4 ,   th en   J S C   w as 4 /4 =1 . 0 0 .   B o th   o f   th ill u s tr atio n   co n cl u d ed   th at  th h i g h est  s i m ilar itie s   v al u w as B las t ( P 2 ).       Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N :   2088 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  8 ,   No .   3 J u n 2 0 1 8   :   1 6 7 1     1683   1678       Fig u r 4 .   P ests   an d   d is ea s es id en ti f icatio n   w it h   J SC       2 . 5 .   I nte ra ct iv pro ce s s   T h s a m r e s u l o f   J S C   ca u s es  a m b i g u it y   s y s te m   to   id en t i f y   p ests   an d   d is ea s es   b ec au s e   th er ar e   s i m ilar   s y m p to m s   b et w ee n   o f   o n d is ea s w it h   an o t h er .   T o   s o lv t h i s   p r o b le m ,   w p r o p o s th e   s tep s   f o r   t h e   in ter ac ti v p r o ce s s :   a.   Sh o w   t h p ests   a n d   d is ea s es t h at  h av t h s a m J SC   b.   Fo r m in g   o f   t h d y n a m ic  q u es t io n s   c.   A s k   t h m ain   s y m p to m s .   d.   Se n d   th s y m p to m s , i t h a n s w er   “y e s ”  s h o w s   t h r esu lt o f i d en tific atio n ,   else s   en d   t h n e x t s y m p to m s .   T h er w er f iv e   ( 5 )   s y m p to m s   o b tain ed   f r o m   SM e x tr ac tio n   ( Fi g u r 5 ) ,   an d   o n e   s y m p to m   t h at  h a s   m atc h   w it h   b o th   o f   t h p est s   an d   d is ea s es. T h r esu lt  s h o w s   t h e   p ests   a n d   d is ea s es  id e n ti f icatio n   th a h a v e   th s a m v al u o f   J S C .   T o   f ac ilit ate  t h id en ti f icat io n   p r o ce s s   th s y s te m   w il s e n d   t h m ain   s y m p to m s   b et w ee n   b o th   o f   th p ests   a n d   d is ea s es,   e. g . ,   a 2 =“ d au n   k er in g ”  ( d r ied   leaf ) ,   o r   b 3 = b atan g   k u n i n g ”  ( y el lo w   s te m ) .           Fig u r 5 .   T h s am v al u o f   J SC         T h n ex p r o cess   is   ch ain   co n s tr u ctio n   f o r   in ter activ q u esti o n s .   ch ain   o f   t h q u esti o n s   is   d y n a m icall y   ar r an g ed   b ased   o n   th s y m p to m s   in   th e S MS s en b y   th e f ar m er s ,   s o   th e i llu s tr atio n   r esu lt  i s   s h o wn   i n   F i g u r e 6 .             Fig u r 6 .   I llu s tr atio n   o f   in te r ac tiv q u e s tio n s       T h s ix   s y m p to m s   in   th illu s tr atio n   will  b e   s en i n ter activ e ly ,   an d th f ar m er s   o n l y   an s wer   y es  o r   n o .   I f   th e   s y m p to m s   b 3   =   b atan g   k u n in g   an d   b 1 0   =   “b atan g   k er d il”   th a ar s en in ter activ el y ,   an d   an s wer ed   y es   th en   th co n clu s i o n   is   “W er en g   C o k lat” ,   o th er wis e g o   to   t h e s y m p to m s   a2   =   “d a u n   k er in g ” an d   a 29 =   d au n   b u s u k .   Evaluation Warning : The document was created with Spire.PDF for Python.
I n t J   E lec  &   C o m p   E n g   I SS N:  2 0 8 8 - 8708     Text  Min in g   fo r   P est a n d   D is ea s I d en tifi ca tio n   o n   R ice  F a r min g   w ith   I n tera ctive   Text    ( E d io   d a   C o s ta )   1679   2 . 6 .   Ana ly s is   o f   t esting   re s ult   T h test   w as  co n d u cted   to   id en tify   p o s s ib le  p ests   an d   d is ea s es  b ased   o n   th in f o r m at io n   b y   t h e     f ar m er s .   T h test   w a s   d o n t w i ce   w it h   t h f o llo w i n g   f o r m u lat io n s :   a.   T h test   w as  co n d u cted   to   m ea s u r th ac c u r ac y   o f   e x p ec t ed   s y m p to m s   f r o m   u s er   in p u t.  S y m p to m s   id en ti f icatio n   is   p er f o r m ed   to   m ea s u r t h ac c u r ac y   o f   s y m p to m s   ac co r d in g   to   t h u s er   in p u t.  A cc u r ac y   is   ca lcu la ted   u s i n g   th f o r m u la :     % 100 x S M S on sy m p t o m s of N u m b e r i d e n t i f i e d sy m p t o m s of N u m b e r A c c u ra c y S y m p t o m s     b.   T h ac cu r ac y   o f   t h p ests   a n d   d is ea s esid en t if ica tio n   b ased   o n   th s y m p to m s   is   ca lc u lat ed   u s i n g   t h e   f o r m u la  as  f o llo w s :     % 100 x d a t a t e st i n g of n u m b e r T h e re su l t t e st t ru e of n u m b e r T h e A c c u ra c y       3.   RE SU L T A ND  AN AL Y SI S   3 . 1 .   T he  re s ult  o f   s y m pto m   i dent if ica t io n   T h ex p er i m e n o f   s y m p to m   id en ti f icatio n   w a s   d o n e   f o r   1 0 0   s en te n ce s .   T h ex p er i m en w a s   p er f o r m ed   u s i n g   4 0   s en ten ce s   co llected   f r o m   t h e x p er ts   an d   6 0   s en ten ce s   co llected   f r o m   th f ar m er s   in   th e   s u r v e y   b y   Mi n is tr y   o f   Ag r ic u lt u r an d   F is h er   ( M A F)  T im o r   L e s te.   T h ex p er i m en w a s   d o n to   te s t h ac cu r ac y   o f   t h s y s te m   to   id en ti f y   s y m p to m s   b ased   o n   th ac tu al  n u m b er   o f   th s y m p to m s .   T h ex p er i m e n t   w a s   co n d u cted   o n   all  o f   1 7 9   s y m p to m s   o f   p ests   an d   d is ea s es  an d   ac h ie v th ac cu r ac y   o f   8 1 %.  T a b le  1 1   s h o w s   s o m e x a m p le s   an d   r es u lts   o f   s y m p to m s   id e n ti f icatio n   th at  h as  b ee n   g e n er ated   b y   t h s y s te m r ea ch in g   an   ac cu r ac y   o f   1 0 0 % .       T ab le  1 1 E x a m p les o f   I n p u t S en ten ce   a n d   R es u lt s   o f   S y m p t o m s   I d en ti f ied   Ex a mp l e   o f   d a t a   i n p u t   N u mb e r   o f   a c t u a l   sy mp t o ms   S y mp t o ms i d e n t i f i e d   ( %)   T a d i   p a g i   say a   k e   saw a h ,   t a n a ma n   p a d i   say a   k o k   d a u n n y a   k e c o k l a t a n   d a n   b e r c a k   se r t a   d a u n   me n g a mb a n g   se p e r t i   k e t u p a t .   B a g a i ma n a   c a r a   me n g a t a s i n y a ?   4   1 0 0 %   d a u n   t a n a ma n   k e r i n g   d a n   m a t i .   T a n a m a n   a d a   y a n g   me n j a d i   k e r d i l ,   b a g i a n   p u c u k   b e r w a r n a   k u n i n g   h i n g g a   k u n i n g   k e c o k l a t a n .   5   1 0 0 %   B a g a i ma n a   me n g a t a si   t a n a m a n   p a d i   y a n g   d a u n   b e r c a k   c e n d e r u n g   l e b i h   se mp i t ,   b a t a n g   l e b i h   p e n d e k   d a n   b e r w a r n a   g e l a p .   B e r u k u r a n   b e r w a r n a   c o k l a t   g e l a p . t e r i ma  k a si h .   5   8 0 %   A p a   y a n g   me n y e b a b k a n   d a u n   p a d i   me n g g u l u n g   d a n   k u n i n g   k e c o k l a t a n ?   3   1 0 0 %   D a u n   t a n a ma n   se p e r t i   b e r c a k - c o k l a t .   b a g i a n   d a u n   a d a   y a n g   me n j a d i   k e r d i l     d a n   p u c u k   b e r w a r n a   k u n i n g   h i n g g a   k u n i n g   k e c o k l a t a n .   4   7 5 %   S e l a mat   p a g i ,   k a mi   b i n g u n g   k a r e n a   t a n a m a n   p a d i   k a m i   d a u n n y a   b i n t i k   b i n t i k   d a n   l u b a n g   k e c i l   p a d a   d a u n n y a ,   b a g a i m a n a   me n g a t a s i n y a ?   2   1 0 0 %   S e l a mat   so r e ,   t a n a ma n   p a d i   k a m i   mal a i n y a   me n j a d i   c o k l a t ,   d a u n   b e r b i n t i k - b i n t i k   d a n   a k a r   me mb u su k .     3   6 6 . 6 7 %       S y m p to m s   m i s id en t if icatio n   w a s   d u to th s y m p to m s   th at  h av m o r th a n   o n s u f f i x ,   f o r   ex a m p le,   b er b in ti k - b in ti k ”  ( s p o tted ) ,   “b er ca k - co k lat”   ( b r o w n   s p o t) ,   “k ek u n in g - k u n i n g a n ”  ( y ello wis h ) .   T h ese   w o r d s   m i g h t   b co n s id er ed   as  r o o w o r d s   d u r i n g   th s te m m i n g   p r o ce s s ,   s o   i w a s   n o id en ti f ied   as  s y m p to m s Misi d en ti f ica tio n   o f   th s ec o n d   s y m p to m s   is   s y n o n y m   p r o b le m ,   f o r   ex a m p le,   th w o r d s   b u a h   b er s er ak an   ( s ca tter ed   f r u it)   w h ile   t h i n t en tio n   o f   t h e   u s er   i s   b ij b e r s er ak an   ( s ca tter ed   s ee d s ) T ab le  1 2   s h o w s   t h r esu lt  o f   t h id e n ti f icatio n   o f   s y m p to m s   o b tai n ed   f r o m   t h e   in p u s e n te n ce   p r o d u ce d   b y   th p r o ce s s   o f   te x t   m i n in g .   Fo r   1 0 0   tr ials ,   th er w er 8 1   tr ials   id en ti f y   t h s y m p to m s   w it h   t h s u cc e s s   r ate   o f   1 0 0 % 9   tr ials   r ea ch ed   th s u cc ess   r ate  o f   8 0 %,  7 5 % f o r   6   tr ials ,   an d   6 6 . 6 7 % f o r   4   tr ials .         Evaluation Warning : The document was created with Spire.PDF for Python.
      I SS N :   2088 - 8708   I n t J   E lec  &   C o m p   E n g ,   Vo l.  8 ,   No .   3 J u n 2 0 1 8   :   1 6 7 1     1683   1680   T ab le  12 .   T h R esu lt o f   S y m p to m s   I d en ti f icat io n   A mo u n t   o f   d a t a   N u mb e r   o f   a c t u a l   sy mp t o ms   T h e   n u m b e r   o f   e r r o r sy mp t o ms   i d e n t i f i e d     81   2 ,   3 ,   4 , 5 , 6 , 1 0   -   9   5   1   6   4   1   4   5   2       3 . 2 .   T he  re s ult  o f   pes t s   a nd   dis ea s es ide ntif ica t io n   T h d atab ase  r ef er en ce   f o r   p es ts   a n d   d is ea s e s   id e n ti f icatio n   c o n s is ts   o f   6 0   d ata  a n d   1 7 9   s y m p to m s   o f   p ests   a n d   d is ea s e s .   T h s elec ted   d ata  ar e   th e   d o m in a n t   p ests   a n d   d is ea s es  in   T im o r - L e s te T h d ata  w er e   o b tain ed   f r o m   Min is tr y   o f   Ag r icu ltu r T i m o r - L este  i n   th p est  an d   d is ea s r ese ar ch   d ep ar tm e n t   a n d   in ter v ie w s   w it h   t h ex p er ts .   T h d ata  ar e   u s ed   as  r ef er en c d atab ase  to   id en tify   p ests   a n d   d is ea s es  o f   r ic p lan ts   f r o m   f ar m er s   b y   SMS.   T h test in g   d ata  o f   p est s   a n d   d is ea s es  w er o b tain ed   f r o m   t h id en tific atio n   o f   t h s y m p t o m s   i n   t h e   p r ev io u s   p r o ce s s   f r o m   th e   t ex m e s s a g es.   T h n u m b er   o f   te x m e s s a g es   w as   1 0 0 .   P ests   an d   d is ea s e s   id en ti f icatio n   u s i n g   2   s ce n ar io s t h f ir s t   s ce n ar io   ( A )   u s ed   4 0   d ata  a n d   t h s ec o n d   s ce n ar i o   ( B )   u s ed   60   d ata.   T h o b j ec tiv es   o f   th ese  t w o   s ce n ar io s   w er to   an al y ze   th p o s s ib le  ef f ec t s   o f   t h a m o u n o f   d ata  o n   th e   s y s te m 's  p er f o r m an ce   to   id en t if y   p ests   an d   d i s ea s es   b ased   o n   J SC   r ec o m m en d atio n .   J SC   v alu e   is   in f l u e n ce d   b y   th n u m b er   o f   t h s y m p to m s   i n   t h SM Ss e n b y   th f ar m er s .   T h h i g h er   v al u o f   J S C   r ec o m m en d atio n   m ea n s   t h h i g h er   p o s s ib ilit y   o f   r ice  p lan ts   a f f ec ted   b y   p ests   an d   d is ea s es.   T h ac cu r ac y   b o th   o f   t h s ce n ar io s   ar 8 6 %.   T h J SC   r ec o m m e n d atio n s   c o n s is o f   t h r ee   o u tp u ts .   T h r esu lt s   o f   r ec o m m e n d atio n   w e r s o r tin g   b ased   o n   J SC   v alu e .   T h f ir s t   r ec o m m e n d atio n   s h o w s   t h h ig h er   J SC s co r an d   s o   o n .   B u th er w er s o m e   p ests   a n d   d is ea s e s   h a v t h s a m J S C   r ec o m m e n d atio n   v alu e   b ec au s e   h a s   s i m i lar   s y m p to m s T h e   J SC   r ec o m m e n d atio n   in   s ce n ar i o   ( T ab le  1 3 )   is   o b tain ed   v a lu r a n g e   o f   0 . 0 8 - 0 . 7 5   an d   ac h iev ed   th e   ac cu r ac y   o f   8 7 . 5 % T h r esu lt  o f   th ex p er im e n s h o w s   t h at  th er w er 1 2   tr ials   w h i ch   h ad   th s a m e   J SC   w it h   th s a m e   o f   p ests   a n d   d is ea s es,  2 3   tr ia ls   h ad   t h d i f f er en v al u o f   J SC   s a m w it h   t h d i f f er en p ests   a n d   d is ea s es,     4   tr ials   h ad   th s a m v al u o f   J SC   w ith   d i f f er en t p est a n d   d is ea s es.       T ab le  1 3 R esu lts   I d en ti f icatio n   P ests   an d   Di s ea s es ( Sce n ar i o   A )   C o u n t   o f   S y mp t o ms   P e st   a n d   D i se a se I d e n t i f i c a t i o n   JS C   R e c o mm e n d a t i o n   5   P e n g g e r e k   b a t a n g   p a d i   0 . 7 5   P e n g g e r e k   b a t a n g   p a d i   0 . 6 7   P e n g g e r e k   B a t a n g   P a d i   0 . 4 3   4   W a l a n g   san g i t   0 . 4 3   W a l a n g   san g i t   0 . 3 6   W a l a n g   san g i t   0. 36   6   W e r e n g   c o k l a t   0 . 4 3   W e r e n g   h i j a u   0 . 4 0   W e r e n g   c o k l a t   0 . 3 0   3   F u sari u m   0 . 5 0   F u sari u m   0 . 3 0   B e r c a k   d a u n   c o k l a t   0 . 0 8       T ab le  13   s h o w s   s o m e   o f   th e   r esu lt s   o f   t h r ec o m m e n d atio n   o f   p ests   an d   d i s ea s es   b ased   o n   t h t h r ee   h ig h er   v a lu e s   of J SC .   T h e   r ec o m m e n d atio n   r es u lt  o n   t h J SC   f o r   d is ea s es  P en g g er ek   b atan g   p ad i   = 0 . 7 5 P en g g er e k   b atan g   p ad i   = 0 . 6 7   an d   P en g g er e k   b atan g   p ad i   =0 . 43 So   th r esu lt  o f   id en ti f icatio n   is   d is ea s e   P en g g er e k   b atan g   p ad i”.   T h n ex r esu lts   s h o w ed   t h at  t h Fu s ar i u m   ap p ea r ed   t w o   ti m es  w it h   t h h i g h est   s i m ilar it y   v a lu e   ar 0 . 5 0   an d   0 . 3 0 ,   s o   it  ca n   b co n cl u d ed   th at  th e   li k el y   o u tco m i s   Fu s ar iu m   d i s ea s e   id en ti f icatio n   w i th   v al u o f   J SC 0 . 5 0 .   T h th r ee   r ec o m m e n d atio n   o f   J S C   w it h   3   o u tp u th s a m p est s   an d   d is ea s es  ca n   ea s y   th s y s te m   f o r   d ec is io n   m a k i n g   b ec au s e   o n o f   th th r ee   o u tp u t s   is   co n c lu d ed   as  r es u lt  o f   th id en ti f icat io n .   T h e   r esu lt  o f   test i n g   J SC   r ec o m m en d atio n   i n   s ce n ar io   B   ( T ab le   1 4 )   o b tain ed   v al u r an g o f   0 . 0 7 - 0 . 6 7   an d   ac h iev e d th ac cu r ac y   o f   85% Fro m   t h r es u lts   o f   6 0   tr ials ,   th er w er 5 1   tr ials   w h ic h   h ad   th r ee   o u tp u t s   w it h   th e   h i g h est  v al u in   t h e   f ir s r ec o m m e n d atio n ,   8   tr ials   h a d   th s a m o u tp u t   r ec o m m e n d atio n s w h er ea s   2   tr ials   w er n o id en tif ied .   T h r esu lts   also   s h o w   t h at  th er ar s o m o u tp u r esu lts   t h at  h a v s a m e   v alu J SC   r ec o m m e n d atio n ,   i.e .   p ests   ca lled   W er en g   co k lat”= 0 . 1 7 ,   W er en g   h ij au ”= 0 . 1 7   an d   Ulat   Evaluation Warning : The document was created with Spire.PDF for Python.