Jurusan Teknik Informatika Skripsi Sarjana Komputer. Semester Ganjil tahun
2005/2006. PENGENALAN KARAKTER MANDARIN DENGAN METODE BACK.
UNIVERSITAS BINA NUSANTARA ________________________________________________________________ Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006 PENGENALAN KARAKTER MANDARIN DENGAN METODE BACK PROPAGATION DANIEL / 0600609706 MICHAEL WITANTO / 0600616794 Abstrak Back Propagation digunakan sebagai metode pelatihan dalam sistem pengenalan tulisan tangan karakter Mandarin. Back Propagation memiliki karakteristik belajar dengan cara meng-update weight–weight yang terdapat dalam neural network, sehingga error yang di dapat semakin kecil. Recognition Method merupakan metode untuk menghasilkan feature–feature yang digunakan untuk proses training dalam Back Propagation. Dirancang 3 metode pengenalan yaitu secara Meshing, Stroke Based dan gabungan dari keduanya, dimana setiap metode akan menghasilkan feature yang berbeda.
Normalization
Method
merupakan
metode
yang
digunakan
untuk
menormalisasi citra dari karakter Mandarin yang di input, dimana setelah dinormalisasi, citra siap digunakan dalam proses Recognition. Digunakan 2 metode normalisasi, yaitu normalisasi garis dan normalisasi lingkaran terpahat. Perancangan ini memperlihatkan hasil pengenalan yang baik jika digunakan citra yang sudah di-training sebelumnya. Diperlukan metode feature extraction yang lebih baik untuk meningkatkan keakurasian pengenalan citra yang belum di-training. Kata Kunci: Back Propagation, Recognition Method, Normalization Method, Feature Extraction
UCAPAN TERIMA KASIH Puji syukur kepada Tuhan Yang Maha Esa atas kasih dan karuniaNya sehingga skripsi ini dapat disusun dan diselesaikan dengan baik. Skripsi ini dibuat sebagai syarat kelulusan program studi Strata 1 di Fakultas Ilmu Komputer, jurusan Teknik Informatika, Universitas Bina Nusantara, Jakarta. Kami mengucapkan banyak terima kasih kepada pihak – pihak yang mendukung dan terlibat, baik secara langsung maupun tidak langsung. Ucapan terima kasih ditujukan secara khusus pada : 1. Almarhumah Rektor Universitas Bina Nusantara, Dr. Ir. Th. Widia S., MM yang telah memberikan kesempatan untuk mendapatkan pengajaran di Universitas Bina Nusantara. 2. Rektor Universitas Bina Nusantara, Prof. Gerardus Polla, Dr., Drs., M.App.Sc yang telah memberikan kesempatan untuk membuat skripsi ini. 3. Ketua Jurusan Teknik Informatika, Ir. Sablin Yusuf, M.Sc., M.Comp.Sc yang telah membantu dalam persetujuan skripsi ini. 4. Sekretaris Jurusan Teknik Informatika, Fredy Purnomo, S.Kom, M.Kom yang telah membantu dalam proses persetujuan skripsi non-kelas. 5. Dosen Pembimbing, Haryono Soeparno, Dr., Ir. yang telah banyak dalam memberikan pengarahan, saran dan bantuan – bantuan lainnya sehingga skripsi ini dapat diselesaikan dengan baik. 6. Semua Dosen yang telah memberikan pengajaran selama waktu pelaksanaan perkuliahan, yang menjadi bekal untuk penulisan skripsi ini. 7. Orang tua dan keluarga, yang telah memberikan banyak dukungan baik moral maupun spiritual serta materiil sehingga skripsi ini dapat terselesaikan. 8. Teman - teman yang ikut mendukung dan memberikan inspirasi dalam pembuatan skripsi ini. 9. Ucapan terima kasih secara khusus untuk Dosen Tri Djoko Wahjono, Ir., M.Sc. yang telah memberikan inspirasi dan minat di bidang Artificial Intelligence.
10. Ucapan terima kasih secara khusus kepada Happy Land Language Center (Mr. Dennis Kitfo, Mrs. Claudia Syanny Latif), yang turut membantu dalam validasi data sehingga skripsi ini dapat terselesaikan dengan baik. 11. Ucapan terima kasih secara khusus juga disampaikan pada teman – teman yang terlibat proses evaluasi data (Rizal Sukarna, Richwan, Herna, Emilia Susanti, Meita Setiawan, Giana Sinukaban, Ekawati). 12. Teman – teman kelas peminatan Artificial Intelligence angkatan 2002 – 2006 semester 5 dan 6 yang telah merasakan suka dan duka bersama. 13. Semua pihak yang telah membantu dalam menyelesaikan skripsi ini yang tidak dapat disebutkan satu persatu. Akhir kata diharapkan skripsi ini dapat bermanfaat dan dikembangkan bagi para pembaca, dan para Binusian.
DAFTAR ISI Halaman Judul Luar ………………………………………………………
i
Halaman Judul Dalam .................................................................................
ii
Halaman Persetujuan Softcover ……………………………………….....
iii
Halaman Persetujuan Hardcover ………………………………………...
iv
Halaman Pernyataan Dewan Penguji …………………………………….
v
Abstrak ……………………………………………………………………...
vii
Ucapan Terima Kasih ………………………………………………………
viii
Daftar Isi …………………………………………………………………….
x
Daftar Tabel …………………………………………………………………
xiv
Daftar Gambar ………………………………………………………………
xv
Daftar Lampiran……….…………………………………………………….
xvi
BAB I
PENDAHULUAN …………………………………………..……. 1 1.1
Latar Belakang Masalah ………………………………………..…. 1
1.2
Ruang Lingkup ………………………………………………..…... 2
1.3
Tujuan dan Manfaat ………………………………………….…… 3 1.3.1
Tujuan Penulisan ……………………………………..…… 3
1.3.2
Manfaat Penulisan ………………………………….….….. 3
1.4
Metodologi ………………………………………………….….…. 4
1.5
Sistematika Penulisan …………………………………….….…… 4
BAB II 2.1
LANDASAN TEORI …………………………….……….……… 6 Teori – Teori Dasar / Umum …………………….……….……….. 6 2.1.1
Neural Network …………………………………….……... 6
2.1.2
Artifical Neuron …………………………….…….…….…. 8
2.1.3
Weight, Output dan Error …………………….……..…….. 9
2.1.4
Neural System …………………………………….………. 9
2.1.5 Multi Layer Neural Network ……………………….…….. 13
2.1.6
Inisialisasi Nguyen – Widrow …………………………….. 24
2.1.7
Fungsi Sigmoid …………………………………………… 25
2.1.8
Pengertian Citra …………………………………………... 27
2.1.9
Computer Vision ………………………………………….. 27
2.1.10 Flowchart ……………………………………….………… 28 2.2
Teori – Teori Khusus ………………………………….………….. 30 2.2.1 Relasi Antar Pixel ………………………….……………... 30 2.2.2
2.3
Tipe Citra ……………………………………….………… 31
Pengolahan Citra …………………………………………………. 31 2.3.1
Pengertian Pengolahan Citra …………………….……….. 31
2.3.2
Bi – Level Image ………………………………….………. 32
2.4
Segmentasi ……………………………………………….……….. 32
2.5
Histogram ………………………………………………………… 33
2.6
Pengenalan Pola ………………………………………………….. 33
2.7
Karakter Mandarin ……………………………………………….. 34 2.7.1 Sejarah Karakter Mandarin ………………………..….…… 34 2.7.2
Gaya Penulisan …………………………………..….…….. 34
2.8
Feature ……………………………………………….………..….. 36
2.9
Normalisasi Bentuk ……………………………………….….…… 37
2.10
2.9.1
Normalisasi Bentuk Linear …………………………..……. 38
2.9.2
Normalisasi Bentuk Non Linear ………….………….……. 39
2.9.3
Smearing …………………………………………….……. 43
Feature Extraction ……………………………………….……….. 44 2.10.1 4-Directional Plane ……………………………….………. 44 2.10.2 Projection Histogram …………………………….……….. 47 2.10.3 Meshing ……………………………………………….…… 47
BAB III
ANALISA DAN PERANCANGAN ………………………….…. 49
3.1
Analisa …………………………………………………………..... 49
3.2
Gambaran Proses Pelatihan dan Pengenalan Karakter Mandarin … 52
3.3
Gambaran Proses Pembuatan Neural Network …………………… 53
3.4
3.5
Gambaran Pengolahan Citra ………………………………………. 54 3.4.1
Segmentasi ………………………………………………… 55
3.4.2
Edge Smoothing …………………………………………... 57
3.4.3
Normalisasi Non Linear …………………………………... 59
3.4.4
Smearing …………………………………………………... 69
Feature Extraction ………………………………………………… 73 3.5.1
Elastic Meshing …………………………………………….74
3.5.2
Stroke Based ………………………………………………. 80
3.5.3
Hasil Feature Extraction ………………………………….. 83
3.6
Perancangan Neural Network …………………………………….. 85
3.7
Pelatihan Neural Network ………………………………………… 86
3.8
Recognition ……………………………………………………….. 88
3.9
Rancangan Layar …………………………………………….……. 91
3.10
Rancangan Object …………………………………………………. 101 3.10.1 Objek Main ……………………………………….……….. 102 3.10.2 Objek Hidden Layer Setting ………………..…………....... 110 3.10.3 Objek Tool ………………………………………………… 111 3.10.4 Objek Dynamic Neural Network …………………………... 112 3.10.5 Objek Chinese Character Image ………………………….. 118
BAB IV 4.1
IMPLEMENTASI DAN EVALUASI …………………………... 122 Implementasi ………………………………………………………. 122 4.1.1
Spesifikasi Sistem …….………………………………….... 122
4.1.2 Pengoperasian Aplikasi Pengenalan Huruf Mandarin ….… 123 4.1.3
Membangun Neural Network Baru ………………….…….. 124
4.1.4
Meng-Load Neural Network yang Sudah di-training Sebelumnya ………………………………………………... 126
4.1.5
Cara Menggambar di Kanvas ………………………………127
4.1.6
Cara Meng-Load Citra dari File ……………………………127
4.1.7
Cara Memasukan Pola ke dalam Neural Network ………… 128
4.1.8
Cara Meng-training Pasangan Pola ……………………….. 130
4.1.9
Cara Mengenali Karakter …………………………………. 131
4.1.10 Cara Meng-Save Neural Network yang Sudah Dibuat ……. 131 4.1.11 Fasilitas Lain yang Disediakan ……………………………. 131 4.2
BAB V
Evaluasi ……………………………………………………………. 132 4.2.1
Keberhasilan Pengenalan ………………………………….. 132
4.2.2
Evaluasi Setting dari Neural Network …………………….. 134
4.2.3
Evaluasi Feature …………………………………….…….. 143
4.2.4
Evaluasi Karakter Mandarin Yang Tidak Sempurna ……… 149
KESIMPULAN DAN SARAN …………………………………... 151
5.1
Kesimpulan …………………………………………………………152
5.2
Saran ………………………….……………………………...……. 152
Daftar Pustaka ………………………………………………………………….....153 Daftar Riwayat Hidup …………………………………………………………….157 Lampiran ………………………………………………………………………….. L1
DAFTAR TABEL BAB IV
IMPLEMENTASI DAN EVALUASI
4.1
Pengaruh Setting Neural Network Terhadap Kecepatan Pelatihan .. 135
4.2
Pengaruh Setting Neural Network Terhadap Akurasi …………….. 137
4.3
Pengaruh Alpha Terhadap Akurasi ……………………………….. 139
4.4
Pengaruh Target Error Terhadap Akurasi ………………………… 142
4.5
Pengaruh Recognition Method Pada Normalisasi Lingkaran Terpahat …………………………………………………………… 143
4.6
Pengaruh Recognition Method Pada Normalisasi Garis ………….. 145
4.7
Pengaruh Feature Extraction Pada Akurasi Pengenalan ................. 147
4.8
Tingkat Keakurasian Terhadap Karakter Cacat ............................... 149
DAFTAR GAMBAR BAB II
LANDASAN TEORI
2.1
Node ………… ………………………………………………..…. 10
2.2
Neural Network ………….. ……………………………………... 11
2.3
Multi Layer Network …………………………..………….……… 14
2.4
Multi Layer Network dengan 1 Hidden Layer …………………… 16
2.5
Contoh Neural Network …………………………….……………. 17
2.6
Non-Linear Sigmoid Function …………………………………… 26
2.7
Grafik Perbedaan Nilai α …………………………………………. 27
2.8
Relasi Antar Pixel ……………………………………………….. 30
2.9
Segmentasi 1 ……..……………………………………………… 32
2.10
Segmentasi 2 ……...……………………………………………… 33
2.11
Segmentasi 3 ……………………………………………………… 33
2.12
Feature Vector …………………………………………………..
36
2.13
Feature Space (3D) ……………………………………………...
36
2.14
Scatter Plot (2D) ………………………………………………...
37
2.15
Normalisasi dengan Perhitungan Interval Garis ………………… 41
2.16
Hasil Normalisasi Non Linear Tanpa Smearing ………………… 43
2.17
Mask 2 x 2 Untuk Perhitungan S ………………………………… 45
2.18
4-Directional Plane ……………………………………………… 46
2.19
Meshing ………………………………………………………….. 47
BAB III
ANALISA DAN PERANCANGAN
3.1
Proses Pelatihan dan Pengenalan Karakter Mandarin …………….. 52
3.2
Proses Pembuatan Neural Network ……………………………….. 53
3.3
Pengolahan Citra ………………………………………………….. 54
3.4
Hasil Pengolahan Citra ……………………………………………. 55
3.5
Flow Chart Proses Segmentasi ……………………………………. 56
3.6
Flow Chart Proses Edge Smoothing ……………………………..... 58
3.7
Proses Normalisasi Non Linear dengan Intensitas Garis ………….. 59
3.8
Proses Normalisasi Non Linear dengan Lingkaran Terpahat ………62
3.9
Flow Chart Normalisasi Non Linear Berdasarkan Lingkaran – Terpahat …………………………………………………………… 63
3.10
Flow Chart Proses Smearing ……………………………………… 71
3.11
Flow Chart Proses Feature Extraction ……………………………. 73
3.12
Flow Chart Proses Elastic Meshing ……………………………….. 76
3.13
Flow Chart Intensitas Mesh ……………………………………….. 77
3.14
Flow Chart Proporsi Mesh ………………………………………… 78
3.15
Flow Chart Projection Histogram ………………………………… 79
3.16
Hasil dari Stroke Based …………………………………………… 81
3.17
Flow Chart Stroke Based …………………………………………. 82
3.18
Proses Perancangan Neural Network …………………………….. 86
3.19
Proses Pelatihan Neural Network ………………………………… 87
3.20
Flow Chart Proses Pelatihan Neural Network …………………… 88
3.21
Proses Recognition …………………………………………….…. 89
3.22
Flow Chart Proses Recognition dengan Back Propagation …….… 90
3.23
Rancangan Layar …………………………………………………. 91
3.24
Menu Area – File ………………………………………………… 92
3.25
Menu Area – Neural Network ……………………………………. 94
3.26
Menu Area – Feature Extaction …………………………………. 96
3.27
Drawing Area …………………………………………………….. 97
3.28
Training Area …………………………………………………….. 98
3.29
Detail Area ……………………………………………………….. 101
BAB IV
IMPLEMENTASI DAN EVALUASI
4.1
Tampilan Awal Program ………………………………………… 124
4.2
Form Hidden Layer Setting ……………………………………… 125
4.3
Cara Mengganti Normalization & Recognition Method ………… 125
4.4
Pesan Neural Network Telah Terbentuk ………………………… 126
4.5
Pesan Weight Telah di-Load …………………………………….
127
4.6
Hasil Citra di Kanvas ……………………………………………
128
4.7
Cara Memasukkan Pasangan Pola ………………………………
128
4.8
Add Pattern ……………………………………………….…….
129
4.9
Cara Mengganti Error Method ……………………………….…
130
4.10
Training Area ……………………………………………………
130
4.11
Hasil Pengenalan ………………………………………………..
131
4.12
Grafik Pengaruh Setting Neural Network Terhadap Kecepatan Pelatihan …………………………………………………………
136
4.13
Grafik Pengaruh Setting Neural Network Terhadap Akurasi ......
138
4.14
Grafik Pengaruh Alpha Terhadap Akurasi ……………………..
141
4.15
Grafik Pengaruh Target Error Terhadap Akurasi ......................... 142
4.16
Grafik Pengaruh Recognition Method Pada Normalisasi Lingkaran Terpahat ......................................................................................... 144
4.17
Grafik Pengaruh Recognition Method Pada Normalisasi Garis ....
146
4.18
Grafik Pengaruh Feature Extraction Terhadap Akurasi ................ 148
4.19
Grafik Tingkat Keakurasian Terhadap Karakter Cacat .................. 150
DAFTAR LAMPIRAN Lampiran Pseudocode ……………………………………………………………...L1 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 1 ……….. L49 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 2 ……….. L53 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 3 ………..L57 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 4 ……….. L61 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 5 ……….. L65 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 6 ……….. L69 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 7 ………..L73 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Set 8 ……….. L77 Lampiran Karakter Mandarin yang Digunakan dalam Pengenalan – Karakter Cacat ...............................................................................................L81