Stemming merupakan suatu cara untuk pemenggalan huruf-huruf dalam suatu kata untuk mendapatkan hasil berupa kata dasarnya. Intinya: stemming memisahkan imbuhan dari kata dasarnya.
Saya punya beberapa keinginan (tugas) untuk membuat sesuatu tentang stemming, yaitu: kamus bahasa sunda dengan metode stemming. Walaupun saya gak bisa bahasa sunda .. hehe ..
kalau temen2 semua punya pengalaman/cerita/source code tentang stemming -> tolong di share ya .. :D
terima kasih
Hoho... aku baru tahu malahan,
STEMMINGBarusan nanya sama tante WIKI, lumayan memuaskan jawabannya, plus dikasih alamat buat dapetin informasi yang lebih lengkapnya.
[pranala luar disembunyikan, sila masuk atau daftar.]Nah disini ada beberapa contoh algoritma dan source code yang bisa dipake :
[pranala luar disembunyikan, sila masuk atau daftar.]Disini juga ada
[pranala luar disembunyikan, sila masuk atau daftar.]Rasanya perlu belajar atau minta bantuan sama orang yang bisa bahasa Sunda bener-bener atau setidaknya banyak buka-buka kamus lengkap bahasa sunda. Soalnya pasti kan mau gak mau perlu bikin
lookup table dan
suffix stripping-nya. Dan karena bahasa Sunda itu banyak variasinya.
*btw.. yg nulis ini orang Parahyangan juga loh...! ^_^
Baru tahu ada istilah stemming :D
Kalo di grammar bahasa belanda, kata dasar (sebelum berubah atau ditambahi prefix-suffix-dsb) memang disebut stem. Ternyata itu istilah umum dlm linguistik ya :D
Ternyata bahasa Sunda banyak sekali variasinya .. (haha_)
Oia, terimakasih linknya ya :D
Lets get it started :-*
@eky
Kalo dah jadi, bagi2 code snippetnya ya ;D
ahahah ..
okeh2 ..
kapan direncanakan selesainya???
Jangan lupa kalo dah berhasil, undang kita-kita buat pesta (alias syukurannya) hahaha... ;D
okeh2 ..
banyak stucknya nih ..
banyak banget imbuhan di bahasa sunda ...
heheh
dijadwalkan: seminggu dari sekarang selesai!!
oia, tau ga, sebenarnya gimana alurnya kalo mau nambahin google dengan pencarian dengan menggunakan bahasa sunda?? asik juga tuh .. kan belum ada .. :D:D
@eky
google ada kok dalam bahasa sunda :
[pranala luar disembunyikan, sila masuk atau daftar.](http://www.google.com/intl/su_ALL/images/logo.gif)
Bahasa jawa juga ada.
wleh ..
ada toh ya ..
tapi tadi pas coba2, perasaan cuma tampilannny doang pake bahasa sunda ..
pengennya:
mis:kita nulis "abdi" di keywordnya
hasil: web yang include kata "aku", dan bukan kata "abdi"
hehe .. pusing jg ya ..
y udah deh .. back to work!
oh iya. itu cuman tampilannya aja ya bahasa sunda. Tapi ya susah dong. satu kata masih mungkin, kalo udah berbentuk kalimat ??? Tapi keren juga andai bisa. Met bikin deh ;)
baru denger tuh istilah stemming..
kalo program udah jadi,, bagi yah ;D ;D
wilujeng lah..
moga sukses!
Btw... yang ngerjain ini proyek (Eky) udah selesai belum yach?
Kutip dari: eky pada Juli 11, 2008, 07:56:46 AM
dijadwalkan: seminggu dari sekarang selesai!!
Kayaknya dah lebih dari seminggu... Bagi-bagi dong... Jadi pengen lihat
Kutip dari: insan sains pada Juli 25, 2008, 06:04:02 AM
Btw... yang ngerjain ini proyek (Eky) udah selesai belum yach?
Kutip dari: eky pada Juli 11, 2008, 07:56:46 AM
dijadwalkan: seminggu dari sekarang selesai!!
Kayaknya dah lebih dari seminggu... Bagi-bagi dong... Jadi pengen lihat
hmm..
programnya sih udah 80%selesai. sekarang sedang ngebuat tampilannya. Maklum, para programmernya tak terlalu maknyus buat ngebikin tampilan yahud..hahah..
ntar kalo dah 100% saya share deh ..
tapi source code nya aja ya ..
ga usah semua filenya ..
hehehe
mauuuuu dong om. Beneran ya bagi source codenya. Penasaran juga nih. Siapa tau bisa gw bikin ntar buat bahasa batak ;D
sebenarnya cuma permainan string kok ..
nothing's special about this stemming
progress: sedang mengerjakan dokumentasi ... jadi sabar yakh ...
sebagai gambaran saja,
di bahasa sunda terdapat beberapa kondisional untuk memuluskan hasil akhir program (terurut):
1. jika input merupakan kata dasar, maka FINISH, kalau tidak -> lakukan langkah 2
2. cek barung (gabungan awalan dan akhiran), kalau ketemu maka FINISH, kalau tidak -> lakukan langkah 3
3. cek awalan, kalau ketemu maka FINISH, kalau tidak -> lakukan langkah 4
4. cek akhiran, kalau ketemu maka FINISH, else lakukan step 5
5. kalau tidak ada satupun hasil yang didapat, maka masukan INVALID
nb. program belum memakai fungsi cek sisipan (karena cukup ribet) hehe
source code nya ga di bagi di sini ya??
ato meLalui pesan??
janjinya sih mo dibagi, caranya ga tau.
Gimana nih bang eky, jadikah ;D diattach ato via PM nih ;D
huahuahua sudah banyak yang minta ..
hehehhee ..
ntar saya attach aja ..
cuma 2 file aja deh .. yang pentingnya doang
sik asik.... siapa sih yang ga suka gretongan ;D
Janji bukan buat komersil deh, tenang aja. Kalo ada yg pake buat komersil, kita gugat rame2 :P
berhubung projectnya dah jadi, dan telah diupload ke internet..
maka room ini di close aja ya??
terimakasih atas atensinya selama ini .. :D
nih saya sertakan salah satu fungsi penting dalam stemming bahasa sunda .. :kribo:
=====room closed=====