Stemming – Bahasa Indonesia

Stemming dapat dikatakan sebagai proses membentuk suatu kata menjadi kata dasarnya. Misalnya:

berkata           -> kata
mengakatakan      -> kata
perkataan         -> kata

Mungkin mudah bagi manusia untuk mencari kata dasar dari suatu kata. Namun bagi komputer yang tidak tahu apa-apa adalah kesulitan tersendiri. Contoh aplikasi yang menggunakan stemming antara lain: information retrieval, mesin pencari, dll.

Beberapa algoritma dasar dalam stemming antara lain:

  • Brute force stemming. Algoritma ini adalah algoritma yang paling sederhana. Bermodalkan database kata dengan kata dasarnya, komputer dengan mudah mencari kata dasar. Namun metode ini mempunyai kelemahan yaitu jumlah database kata dan kata dasarnya harus besar. Kesalahan terjadi bila kata tidak ditemukan di database dan kemudian dianggap kata dasar, padahal bukan.
  • Menghilangkan imbuhan (awalan, akhiran, sisipan). Untuk menggunakan metode ini harus tahu terlebih dahulu aturan bahasanya. Kata akan dipotong imbuhannya berdasar aturan bahasanya. Kesalahan terjadi bila kata tersebut adalah kata dasar yang dipotong, misalnya: perawan -> awan.
  • Dan masih banyak algoritma-algoritma dasar lainnya, seperti gabungan algoritma di atas, stokastik, lematasi, dll [1].

Untuk bahasa Indonesia beberapa algoritma yang biasanya digunakan antara lain:

  • Porter Stemmer. Algoritma ini terkenal digunakan sebagai stemmer untuk bahasa Inggris. Porter Stemmer dalam bahasa Indonesia akan menghasilkan keambiguan karena aturan morfologi bahasa Indonesia [2].
  • Nazief & Adriani Stemmer. Algoritma ini paling sering dibicarakan dalam stemming bahasa Indonesia. Algoritma ini merupakan hasil penelitian internal UI (Universitas Indonesia) dan tidak dipublish secara umum [3]. Algoritma ini merupakan gabungan antara algoritma menghilangkan imbuhan dan brute force stemming. Namun algoritma ini mempunyai dua masalah, yang pertama kemampuannya tergantung dari besarnya database kata dasar, dan yang kedua, hasil stemming tidak selalu optimal untuk aplikasi information retrieval [2].

Bila dibandingkan, untuk teks berbahasa Indonesia, Porter stemmer lebih cepat prosesnya daripada Nazief & Adriani stemmer namun algoritma Nazief & Adriani memilki tingkat keakuratan lebih tinggi daripada Porter stemmer [5]. Dengan sedikit perbaikan, Nazief & Adriani stemmer bisa mencapai akurasi 95% [4].

Referensi:

[1]http://en.wikipedia.org/wiki/Stemming

[2]FZ Tala. 2003 .A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia. Master of Logic Project. Institute for Logic, Language and Computation Universiteit van Amsterdam. The Netherland.  [PDF][PDF]

[3] B. Nazief and M. Adriani. 1996. Confix Stripping: Approach to Stemming Algorithm for Bahasa Indonesia. Technical report, Faculty of Computer Science, University of Indonesia, Depok, 1996.

[4] Jelita Asian, Hugh E. Williams, S. M. M. Tahaghoghi. 2005. Stemming Indonesian. Proceedings of the Twenty-eighth Australasian conference on Computer Science – Volume 38. [Abstract]

[5] Ledy Agusta. 2009. Perbandingan Algoritma Stemming Porter Dengan Algoritma Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia.Konferensi Nasional Sistem dan Informatika 2009; Bali, November 14, 2009. [PDF]

Note: Saya tidak mempunyai source code untuk Porter stemmer dan Nazief & Adriani stemmer, silakan menghubungi ke yang bersangkutan langsung.

10 Alasan Mengapa Proyek TI Gagal

Ini adalah rangkuman dari tulisan Dr. Paul Dorsey yang tulisannya dapat diunduh di bawah.

Sekitar 50%-80% bahkan lebih, proyek TI termasuk kategori gagal. Mengapa gagal, karena proyek tersebut tidak memenuhi syarat biaya, kualitas, kecepatan (waktu), dan risiko yang diinginkan.

Berikut 10 cara yang dijamin akan membuat sebuah proyek TI gagal:

  1. Tidak menggunakan metodologi yang spesifik karena merasa koding adalah bagian yang terpenting
    Tidak menggunanakan sebuah metodologi adalah kesalahan yang fatal. Penggunaan metodologi yang telah terbukti dengan baik merupakan salah satu faktor sukses dalam sebuah proyek TI. Sebuah metodologi akan memberikan guideline dan langkah-langkah dalam proyek TI. Koding adalah bagian dalam sebuah metodologi dan itu bukan yang utama.
     
  2. Membuat perencanaan proyek, dengan melihat tanggal deadline
    Ini adalah kesalahan yang paling sering dilakukan dalam perencanaan proyek, yaitu merencanakan proyek dari awal proyek sampai tanggal dead line kemudian membaginya dalam fase-fase.  Memaksa sebuah proyek dengan tanggal deadline menyebabkan banyak langkah-langkah yang dilewati demi mengejar tangal deadline. Seharusnya sebuah perencanaan proyek dibuat berdasarkan waktu yang realistis tanpa melihat tanggal deadline.
     
  3. Membuat tabel di database tanpa membuat data model
    Data model adalah bagian utama dari sistem yang akan dibangun. Tanpa membuat data model dengan baik, maka sistem dipastikan tidak akan memenuhi keinginan dan kebutuhan dari penguna.
     
  4. Mempekerjakan technical lead yang belum pernah membuat sistem yang serupa, dengan alasan mahal untuk menggaji yang sudah berpengalaman
    Karyawan yang jadi technical lead, harus berpengalaman dan pernah mengerjakan proyek yang serupa. Kita tidak menginginkan seorang dokter umum melakukan operasi jantung bukan? Lebih baik mempekerjakan karyawan yang berpengalaman dengan gaji besar, dari pada mempekerjakan banyak orang yang tidak berpengalaman.
     
  5. Mempekerjakan lebih banyak developer agar koding lebih cepat
    Lebih banyak bukan selalu lebih baik. Proyek yang dibuat oleh sedikit developer yang berpengalaman, lebih baik daripada proyek yang dikerjakan oleh banyak developer namun kurang pengalamannya.
     
  6. Menggunakan teknologi yang tidak tepat
    Sebagai contoh, membuat suatu sistem dengan Java untuk membuat sebuah website, sementara developer dalam proyek tersebut menyangka bahwa Java adalah merk kopi.  Program Java memang bisa digunakan untuk pembuatan website, namun butuh developer yang berpengalaman. Sementara banyak alternatif program lainnya yang lebih sederhana dan lebih mudah untuk pembuatan website.
     
  7. Menyepelekan fase migrasi data
    Migrasi data dari sistem yang lama ke sistem yang baru adalah fase yang cukup berat. Kesalahan utama dalam proyek TI, biasanya sumber daya yang dipersiapkan dalam migrasi data sangat sedikit.  Contoh kesalahannya yaitu memberikan tugas kepada junior developer untuk melakukan migrasi data.
     
  8. Tidak melakukan testing karena proyek melebihi jadwal yang seharusnya
    Kesalahan ini adalah kesalahan cukup fatal, hal ini seperti terjun ke kolam renang tanpa mengecek dahulu ada airnya apa tidak kolam itu. Ingat bahwa tidak ada sistem yang bug-free.  Bug yang ditemukan ketika sudah sampai production, akan lebih berat diperbaikinya. Lebih mudah dan murah memperbaiki bug yang ditemukan dalam tahap development.
     
  9. Merubah requirement penting ketika proyek dalam fase akhir
    Memang requirement bisa berubah, namun harus dimanage agar tidak melebar dan mengganggu jalannya proyek. Harus dibuat aturan yang jelas bagaimana requirement yang baru diterima.
     
  10. Beli software jadi dan di-customize secara besar-besaran
    Software jadi dibuat berdasar asumsi proses bisnis tertentu. Proses bisnis dalam software, bisa jadi tidak sesuai dengan proses bisnis perusahaan, sehingga harus di-customize agar sesuai.  Namun bila kustomisasinya berlebihan akan membuat biaya lebih mahal daripada membangun dari awal.
     

Referensi:

Paul Dorsey. Top 10 Reasons Why Systems Projects Fail. 2000.
[Download][Mirror]

Bisnis Model – Warung Pecel Lele (bukan case study)

Abstrak
Anda pengin membuka usaha warung pecel lele? Di manapun warung anda akan atau sudah berdiri, di seberang jembatan, di bawah pohon mangga, atau di mall. anda perlu mendefinisikan model bisnis terlebih dahulu.

Pendahuluan
What? Model Bisnis? Lah warung saya sudah laris..apaan tuh pakai model bisnis model segala..gak butuh saya!

Ya sudahlah…tulisan ini ditujukan bagi siapa saja yang ingin membuka pecel lele dengan menggunakan model bisnis.

Model Bisnis
Menurut Applegate et al. 2009, model bisnis menjelaskan bagaimana sebuah organisasi berhubungan dengan lingkungannya untuk menentukan strategi unik,  menggunakan sumber daya, membangun kapabilitas yang diperlukan untuk menjalankan strategi, dan membuat suatu nilai untuk pemegang saham.

Apaan tuh maksud tulisan di atas? Saya mau jualan pecel lele doang kok aneh-aneh…

Kembali ke pecel lele, secara gampang bisnis model menentukan:
-    siapa sih pelanggan pecel lele kita? dan bagaimana cara menjual pecel lele tersebut?
-    bagaimana cara mendapatkan duitnya?
-    apa kelebihan pecel lele kita di banding yang lain?

Analisis Model Bisnis
Sekarang saatnya membuat analisis model bisnis pecel lele.

Asumsi: anda ingin membuat warung pecel lele di pinggir jalan Orchard Road di Singapura.

Pertama anda harus mendata dulu warung-warung lainnya yang ada di sepanjang jalan Orchard Road.

Ayam Bakar wong Tegal Bebek  Goreng pak Kumis Warung Pecel Lele Anda
Siapa pelanggannya & cara menjualnya? Pelanggannya anak kost, cara menjualnya dengan membuat warung tenda di bawah pohon jambu. Pelanggannya ibu-ibu yang malas memasak, cara menjualnya dengan mendorong gerobak di sepanjang jalan Orchard Road
Bagaimana cara mendapatkan duitnya?
Jualan ayam bakar dan pepes bakar Jualan bebek goreng dan nasi goreng
Kelebihan warungnya apa? - Lokasi strategis di bawah pohon jambu

- Sambelnya pedes sekali

- Ikan segar langsung diambil dari sungai sebelah

- Deket dengan pelanggan karena pakai gerobak-

- Digoreng di atas minyak dengan suhu 120 derajat celcius sehingga sehat dikonsumsi

Silakan anda isi kotak bagian anda di atas.

Dengan membandingkan model bisnis tersebut, anda akan mendapatkan gambaran bagaimana kira-kira kelangsungan usaha anda ke depan. Bila model bisnis anda sama dengan warung sebelah maka siap-siap anda berkompetisi gila-gilaan. Bila anda tidak bisa mengisi model bisnis di atas, sebaiknya anda jangan jualan pecel lele.

Beberapa saran dalam mengembangkan bisnis model warung pecel lele anda:

  • warung pecel lele anda harus mempunyai kelebihan dibanding warung lainnya, misalnya: lele yang dijual adalah lele lokal yang warnanya putih atau sambel pecel anda warnanya hijau karena dibuat dari cabai hijau
  • selain menjual pecel lele anda juga menjual produk varian lainnya misalnya kripik lele, lele bakar, lele cah kangkung, dll
  • anda menggratiskan pecel lele yang anda jual, tetapi men-charge lebih mahal minuman yang diminum pelanggan
  • warung menerima delivery order 24 jam, bila delivery order terlambat, pelanggan mendapat dua ekor lele ukuran jumbo
  • bila lele susah dicari di tempat anda, sebaiknya anda jangan jualan pecel lele

Kesimpulan
Warung pecel lele pun perlu suatu model bisnis agar sukses.  Karena tulisan ini bukan case study, jadi belum dapat disimpulkan berapa tingkat kesuksesan antara warung yang mendefinisikan model bisnis secara jelas dan yang tidak.

Referensi
Aplegate, M., Austin, R. D., Soule, D. L., 2009. Corporate Information Strategy and Management: Text and Cases – Eight Edition, McGraw Hill International Edition, 2009.

NB:
Tulisan di atas sedang dalam proses dikirim ke jurnal “Kamverd Business Review”

Tentang Pajak Import

Mungkin anda pernah mendapat paket dari luar negeri dengan pajak yang besar? Nilai paket 5 juta tapi kena pajak 3 juta?

Kemudian anda menuduh bahwa tukang pos telah memalak anda? Atau pihak bea cukai curang?

Eits..Tunggu dulu..jangan menyalahkan orang terlebih dahulu…mungkin anda belum tahu benar peraturan pajak yang berlaku di Indonesia.

Berikut pengalaman dan pengetahuan saya tentang pajak dalam mengimport barang. Saya bukan orang yang ahli pajak, sehingga penjelasan berikut belum tentu benar 100%, namun diharapkan bisa membantu anda.  Sebaiknya anda bertanya ke konsultan pajak untuk penjelasan lebih lanjut.

Import
Saya tidak tahu persis definisi import menurut undang-undang, tetapi kira-kira adalah suatu kegiatan memasukkan barang dari luar negeri ke dalam negeri.

Bila saudara anda mengirim paket dari luar negeri apapun isinya, itu termasuk import, walaupun itu adalah barang-barang anda sendiri.

Lewat manapun anda mengirimnya, lewat kantor pos, UPS, FedEx, atau jasa pengiriman lainnya, itu termasuk import.

Pabean/Bea Cukai
Semua barang import, terlebih dulu masuk ke pabean. Di pabean barang diperiksa, isi paket dibuka. Jadi yang membuka isi paket adalah pihak bea cukai disaksikan pihak kantor pos.

Kemudian kantor pos akan membungkus ulang paket. Saya tidak tahu pasti biaya bungkus ulang ini, kadang-kadang kena Rp 3.000,- , kadang-kadang Rp 7.000,-

Tiap jenis barang memiliki nilai bea masuk yang berbeda-beda dan pajak berbeda-beda. Bisa dilihat di link BTBMI di bawah.

Pajak
Yang menentukan berapa pajak barang anda adalah pihak bea cukai. Kantor pos hanya menerima pembayaran pajak yang dibebankan kepada anda. Bila anda bertanya kepada pihak pos darimana asal-usul perhitungan, mereka akan menyuruh anda menghubungi pihak bea cukai langsung.

Total biaya yang kena pajak, adalah nilai barang ditambah nilai ongkos kirim, disebut juga FOB (Freight On Board).  Bila tidak tercantum nilai barang, maka pihak bea cukai akan mengira-ngira nilainya. Oleh karena itu penting untuk mencantumkan nilai barang.

Untuk FOB dengan nilai 50 dollar, dibebaskan dari bea masuk dan pajak. Jadi bila anda ingin terbebas dari pajak, usahakan nilai barang dan ongkos kirim tidak lebih dari 50 dollar.

Bila nilai FOB lebih dari 50 dollar, maka anda akan kena bea masuk dan pajak. Pajak yang sudah pasti adalah PPN 10% dan PPH pasal 22 sebesar 7,5% (dengan asumsi anda tidak punya Angka Pengenal Importir -API). Jadi pajak yang pasti anda bayarkan adalah 17,5%.

Anda pun akan kena pajak lainnya, seperti pajak barang mewah, dan pajak lainnya tergantung jenis barang. Bisa dilihat di table BTBMI di bawah.

Perhitungan
Bila barang anda seharga 5 juta, ongkos kirim 1 juta, kira-kira berapakah uang yang anda keluarkan di kantor pos?

Jawab
Total FOB = 5 juta + 1 juta = 6 juta
PPN + PPH 22 = 17,5% x 6 juta = Rp 1.050.000,-
Bea Masuk = Rp Y,- (bisa dilihat ditabel BTMBI)
Pajak lainnya = Rp Z,-  (bisa dilihat ditabel BTMBI)
Biaya bungkus ulang = Rp 3.000,-

Total biaya = PPN + PPH 22 + Bea Masuk + Pajak lainnya + Biaya bungkus ulang
= Rp 1.050.000,- + Rp Y,- + Rp Z,- + Rp 3.000,-

Hal-hal lain

Bila anda kena pajak yang besar, biasanya akan ada pihak bea cukai yang menawarkan bantuan menurunkan pajak. Anda dapat membiarkan atau bekerja sama dengan pihak tersebut, tergantung hati nurani anda. Saya tidak tahu apakah hal tersebut dibenarkan secara hukum atau tidak.

Cek faktur pajak anda palsu atau tidak. Bisa jadi ada oknum di jasa pengiriman barang memalsukan faktur pajak dan menarik biaya yang lebih besar.

Hati-hati memaketkan barang bekas (barang tidak baru), walaupun itu barang anda sendiri. Karena ada barang bekas yang tidak boleh masuk ke Indonesia.

Semoga membantu. Silakan bertanya ke konsultan pajak untu informasi yang lebih jelas dan tepat.

Referensi

Tarif Pajak Impor ppn & pph22

Tarif Bea Masuk Indonesia (BTBMI)

E-readiness vs Corruption Perception Index

Saya mendapat tugas untuk membandingkan e-readiness dengan corruption perception index.  Supaya tidak hilang, saya tulis juga di blog ini dengan sedikit perubahan. Kira-kira berikut lah hasilnya, maaf bila analisisnya masih terlalu dangkal.


E-readiness

E-readiness adalah ukuran dalam pemanfaatan teknologi informasi dan komunikasi demi keuntungan ekonomi dan sosial, dalam suatu negara.

Yang diukur dalam e-readiness adalah kualitas infrastruktur teknologi informasi dan komunikasi (TIK), dan kemampuan konsumen, perusahaan, dan pemerintah dalam menggunakan TIK untuk meningkatkan keuntungan dan pelayanan kepada masyarakat.

Dengan ukuran ini, pemerintah bisa memperkirakan keberhasilan strategi TIK.  Semakin berhasilnya TIK diharapkan aktivitas ekonomi bisa menjadi transparan dan efisien.  Sehingga dengan kualitas yang baik,  para pemodal asing bisa menginvestasikan uangnya ke dalam negeri.

Nilai e-readiness berkisar dari angka 0 – 10. Nilai ini dikeluarkan oleh  Economist Intelligence Unit yang bekerja sama dengan IBM Institute for Business Value.  Semakin besar nilai e-readiness, berarti kesiapan TIK nya semakin baik.

Pada tahun 2008,  Indonesia mendapat nilai 3,59;  dan berada pada peringkat 68 dari 70 negara.


Corruption Perception Index (CPI)

Korupsi dalam CPI ini, didefinisikan sebagai penggunaan kekuasaan publik untuk keuntungan pribadi.  CPI adalah ukuran persepsi masyarakat terhadap korupsi di pejabat publik.

CPI adalah indeks dari berbagai survey data korupsi.  CPI dikeluarkan oleh lembaga Transparency International. Indeks ini merefleksikan pandangan dari pengusaha, masyarakat, dari dalam negeri ataupun dari luar negeri.

Nilai CPI berkisar dari angka 0 – 10. Semakin besar indeksnya berarti semakin sedikit korupsi terjadi (menurut pandangan orang yang disurvey).  Indonesia pada tahun 2008, mendapat nilai 2,6;  dan berada di urutan ke-126 dari 180 negara.


Perbandingan e-readiness dan CPI negara Indonesia

tabel_cpi

grafik_cpi

Grafik 1
Dari grafik 1, nilai e-readiness dan CPI mempunyai kecenderungan meningkat dari tahun ke tahun.

Dengan tingginya tingkat e-readiness, diharapkan kemampuan TIK tersebut akan membuat transparansi dan efisiensi dalam berbagai kebijakan publik.  Transparansi dan efisiensi ini diharapkan akan menurunkan persepsi masyarakat tentang korupsi.

Kalau dilihat dari harapan di atas, kemungkinan ada korelasi bahwa peningkatan nilai e-readiness mempengaruhi naiknya CPI. Atau malah sebaliknya CPI mempengaruhi naiknya nilai e-readiness.

Tapi yang jelas kedua-duanya mempunyai kecenderungan naik. Berarti ada usaha dari dalam negeri (pemerintah khususnya) untuk memperbaiki infrastruktur TIK dan mengurangi korupsi di Indonesia.

Grafik 2

Peringkat e-readiness Indonesia cenderung semakin menurun (dibanding dengan negara lain) dari tahun ke tahun, walaupun nilai e-readiness-nya meningkat. Ini menunjukkan bahwa negara lain TIK-nya maju semakin cepat. TIK di Indonesia semakin tertinggal dari negara lain.  Strategi dan penyerapan TIK Indonesia belum mampu untuk mengungguli strategi negara lain.

Dari grafik 2, juga dapat dilihat bahwa peringkat CPI cenderung semakin naik (dibandingkan dengan negara lain) dari tahun ke tahun. Hal ini menunjukkan pemberantasan korupsi semakin berhasil.

Pada tahun 2008 terjadi kenaikan tajam dari peringkat CPI.  Pada tahun 2008 juga, peringkat e-readiness malah semakin anjlok.


Kesimpulan

- Nilai e-rediness dan CPI cenderung naik, ada usaha pemerintah untuk memperbaiki infrastruktur TIK dan mengurangi korupsi di Indonesia.

- Peringkat e-readiness Indonesia cenderung turun, kesiapan infrastruktur TIK & pendukungnya semakin tertinggal dengan negara lain

- Peringkat CPI Indonesia cenderung naik, pemberantasan korupsi mulai menampakkan hasil

- Di Indonesia, belum ada korelasi jelas apakah nilai e-readiness mempengaruhi CPI, atau CPI mempengaruhi e-readiness

Referensi

[1] E-readiness – http://en.wikipedia.org/wiki/E-readiness

[2] Corruption Perceptions Index – http://en.wikipedia.org/wiki/Corruption_Perceptions_Index

[3] 2004, 2005. 2006, 2007, 2008 Corruption Perceptions Index – http://www.transparency.org/policy_research/surveys_indices/cpi

[4] 2004, 2005. 2006, 2007, 2008 EIU e-readiness rankings, Economist Intelligence Unit

Posted in Tugas. 1 Comment »