ISSN: 1693-6
930
¢
7
Klasifika
s
i Se
cara Efisien
Pada Data
ba
se Multi Rel
a
si De
nga
n…
…(Sarwo
s
ri)
KLASIFIKASI SECARA EFISIEN PADA DATABASE
MULTI RELASI
DENGAN ALGORITM
A CROSSMINE
Sar
w
osri, Darlis Herumu
rti, Indri Sulis
t
y
o
w
ati
Jurusan Te
kn
ik Informati
k
a
,
Fakulta
s
Te
knol
ogi Informasi,
Institut Tekn
o
l
ogi Sepulu
h
Nop
e
mbe
r
e-mail:
s
r
i
@
it
s-
sby
.
edu
,
d
a
rlis@it
s
-sby.edu
A
b
st
r
a
ct
Multi-rel
a
tion cla
ssifi
cation
s can be wid
e
ly
u
s
e
d
in m
any
di
sci
pli
nes, su
ch as
financi
a
l
deci
s
io
n m
a
king, m
edical
resea
r
ch, an
d geo
gra
phi
cal appli
c
atio
n
s
, and
inform
ation store
d
in
m
u
ltiple relati
ons
nee
ds to
be u
s
ed
in d
e
ci
sion m
a
ki
ng. Cro
ssm
in
e is
an effici
e
n
t and
scalab
le
approa
ch
fo
r m
u
lti-relation cla
ssifi
cation.
Crossm
i
ne
a
l
goritm
ha
s t
h
ree
ste
p
, first is find
-rul
e
s,
the rul
e
h
a
s
been
gotten f
r
om
find a
ru
le process
th
an rem
o
ve
al
l po
sitif tuple
s
satisf
ying
rule
while there are more than ten pe
rc
ent
pos
itif tuple left. The
s
e
c
o
nd is
find a
rule, this s
t
ep
has
input from
th
e re
sult
of find be
st p
r
e
d
icate
pro
c
e
s
s, that is th
e
com
p
lex p
r
edi
cate
with m
o
st
foilgain. If foilgain val
ue is m
o
re than m
i
ngain, the predi
cate i
s
adde
d with rule, and m
a
x rule
length less than si
x. Third is find best
predi
cate
, in this step we
find the best predicate with
definition, if the foilgain
va
lue m
o
re tha
n
the
m
a
x gai
n val
ue, the p
r
edi
cate
will b
e
sa
ve
d and t
h
e
bigger gain
value
will
repl
ace the last gain value fo
r next com
perative proces
s. I
n
other
side,
the
accuracy i
s
com
puted f
r
o
m
each
rule
that produ
ce
in find rules
proc
ess
.
The tes
t
for
this
appli
c
ation u
s
e the sum
tuple of 200, 5
00, 1000, 50
00 for m
easu
r
ing the le
vel
of accuracy from
rule which is
prod
uced b
y
cro
s
sm
ine al
goritm
.
Key
w
ord
:
crossm
ine, posi
t
ive tuple, ne
gativ
e tupl
e, rule, predi
cate
, accu
ra
cy.
Abs
t
rak
Klasifika
s
i m
u
lti-rel
a
si d
a
pat digun
aka
n
se
ca
ra lua
s
dalam
ban
ya
k disi
plin,
sep
e
rti
pem
buatan kep
u
tusan keuan
gan,
pe
nelitian
m
edi
s,
dan
aplikasi g
eog
rafi, inform
asi yang
disim
pan dal
am
m
u
lti-relasi dipe
rlu
k
a
n
dalam
p
e
m
buatan ke
putusan.
CrossMine, su
atu
pend
ekatan
yan
g
efisie
n dan da
pat di
skala untu
k
kl
a
s
ifika
s
i m
u
lti-rela
si. Algoritm
a
cro
s
sm
ine
m
e
m
iliki tiga langkah, pertam
a
dim
u
lai dari
pencari
an
sekum
pul
an
rule, rule didapatkan
dari
pro
s
e
s
p
enca
r
ian
seb
uah
rule yang
kem
udian
diam
bil tuple po
sitifn
ya
sam
pai te
rsi
s
a l
ebih
da
ri
sep
u
luh
pe
rsen. La
ng
kah
ked
ua
adal
ah
pen
ca
ria
n
se
buah
rule, p
a
da la
ng
kah
in
i m
e
m
iliki inp
u
t
dari h
a
sil
prose
s
p
e
n
c
ari
an predi
kat terbai
k, yaitu
predi
kat
kom
p
lek
den
gan
nilai foilgain,
nilai
foil gain dib
andin
g
kan d
enga
n m
i
n gain jika h
a
sil
n
ya le
bih be
sar m
i
n gain
m
a
ka predi
kat
terse
but dita
m
bahkan
de
ngan
rule, d
a
n
m
a
ksim
a
l kedalam
an
rel
a
si a
dalah
ku
rang
da
ri en
a
m
.
Lang
ka
h keti
ga ad
alah fin
d
be
st pre
d
, pada la
ng
ka
h ini dila
ku
ka
n pen
ca
rian
predi
kat te
rb
aik
deng
an keten
t
uan jika
nilai
foilgain lebih
besa
r
da
ri nil
a
i m
a
x gain
m
a
ka pre
d
ika
t
akan di
sim
pan
dan nilai gain yan
g
leb
i
h besa
r
aka
n
m
engganti
k
an nilai g
a
i
n
sebel
um
nya untuk p
r
o
s
es
perb
andi
nga
n
selanjutn
y
a.
Sedang
kan
untuk a
c
cura
cy dihitu
ng d
a
ri m
a
sing m
a
sin
g
rule ya
n
g
diha
silkan pa
da proses p
e
n
ca
rian
se
ku
m
pulan rule.
Uji co
ba a
p
lika
s
i ini m
eng
guna
ka
n jum
l
ah
tuple 200, 5
00, 1000, 5
000 untu
k
m
enguku
r
tin
g
kat efi
s
ien
s
i
dan a
k
urasi
dari rule yang
diha
silkan alg
o
ritm
a cro
s
sm
ine.
Kata kunci
: cro
s
sm
ine, tuple po
sitif, tu
ple neg
ative,
rule, predi
kat, accura
cy
1. PEN
D
AHU
LUAN
Kebanya
k
an
data terstru
k
tur sa
at ini disimpa
n
dala
m
rela
si
dat
aba
se
.
Data
base
ini
terdiri d
a
ri b
anyak
rela
si yang berhub
unga
n se
ca
ra kon
s
e
p
tual
melalui
link-l
i
nk entity-relation
dalam de
sai
n
skema
-
ske
m
a rela
si da
tabase. Kl
asi
f
ikasi multi
-re
lasi dap
at diguna
ka
n se
cara
luas
dalam
banya
k
di
sipl
in, sep
e
rti p
e
mbuat
a
n
ke
putusan
keu
anga
n, penel
itian medi
s, dan
Evaluation Warning : The document was created with Spire.PDF for Python.