Member baru? Bingung? Perlu bantuan? Silakan baca panduan singkat untuk ikut berdiskusi.

Welcome to Forum Sains Indonesia. Please login or sign up.

Desember 04, 2024, 09:36:26 AM

Login with username, password and session length

Topik Baru

Artikel Sains

Anggota
Stats
  • Total Tulisan: 139,653
  • Total Topik: 10,405
  • Online today: 43
  • Online ever: 1,582
  • (Desember 22, 2022, 06:39:12 AM)
Pengguna Online
Users: 0
Guests: 32
Total: 32

Aku Cinta ForSa

ForSa on FB ForSa on Twitter

Pengenalan Suara Berbasis Neural Network dengan Algoritma Momentum Back Propagation

Ini ada potongan artikel dari salah satu paper saya "Automatic Door using Voice Recognition based on Momentum Back Propagation and Cross-correlation Methods". Semoga bermanfaat.<br /> <hr style="width: 100%; height: 2px;" /> <span style="font-weight: bold;">Pendahuluan</span><br /> Secara umum, kemungkinan akses ilegal pada suatu ruangan bertambah dengan bertambahnya jumlah pemilik akses. Ini karena media identitas -- seperti bar code, nomor PIN, kartu magnetik, dan kunci -- dapat diduplikasi. Dalam kasus ini, identitas yang melekat pada tubuh menjadi penting. Identitas yang melekat pada tubuh meliputi struktur DNA, retina mata, sidik jari, spektrum suara, dan lain-lain <sup>[1]</sup>. Dalam penelitian ini Kami menggunakan spektrum suara sebagai identitas untuk akses ruangan.<br /> Alasan pemilihan spektrum suara sebagai identitas ialah berdasarkan fakta bahwa kita masih dapat membedakan suara dua orang berdasarkan suaranya walaupun mereka mengucapkan huruf vokal yang sama. Resonansi vokal dihasilkan oleh artikulator dalam mulut untuk membentuk suara vokal yang berbeda <sup>[2]</sup>. Karena artikulator hampir unik untuk setiap orang, maka kita bisa membedakan orang dari suaranya. Dalam penelitian ini kami memilih hanya menggunakan vokal "a" dengan alasan penyederhanaan masalah. Kami telah mempelajari bahwa spektrum suara untuk vokal "a" ialah berbeda untuk setiap orang.<br /> Jaringan syaraf tiruan dengan algoritma pembelajaran Momentum Back Propagation digunakan sebagai voice recognizer. Jaringan syaraf tiruan dengan multi-layer perceptron digunakan karena cocok untuk pengenalan pola non-linear <sup>[3]</sup>. Input bagi neural netwok ialah spektrum vokal "a". Noise dari lingkungan telah direduksi menggunakan metode yang kami sebut <span style="font-style: italic;">self multiplication</span>.<br /> <br /> <span style="font-weight: bold;">Momentum Back Propagation</span><br /> Back propagation atau error back-propagation ialah teknik pembelajaran terawasi (<span style="font-style: italic;">superviced learning</span>) yang digunakan untuk melatih jaringan syaraf tiruan. pertama kali dideskripsikan oleh Paul Werbos pada 1974, dan dikembangkan lebih lanjut oleh D.E. Rumelhart, G.E. Hilton, dan R.J. Williams pada 1986 <sup>[4]</sup>. Algoritma ini berdasar pada aturan delta umum (<span style="font-style: italic;">generalized delta rule</span>):<br /> <img height="47" width="300" src="http://farm4.static.flickr.com/3180/2769855886_73063fc48a.jpg" alt="" /><br /> dengan w<sub>ij</sub> ialah bobot neuron pada layer-i ke layer-j, <eta> ialah laju belajar, dan <e> ialah output SSE (jumlah kuadrat error).<br /> Biasanya jaringan syaraf tiruan belajar lebih cepat dengan kenaikan laju belajar, tetapi dapat menghasilkan osilasi bahkan kegagalan belajar. Untuk mereduksi osilasi pada nilai laju belajar yang tinggi, faktor momentum <sup>[5]</sup> digunakan untuk menjaga kekonstanan kecenderungan proses belajar. Sehingga aturan delta umum untuk perbarahruan bobot menjadi,<br /> <img height="44" width="300" src="http://farm4.static.flickr.com/3200/2769855920_045bd752a5.jpg" alt="" /><br /> dengan <alfa> ialah faktor momentum.<br /> <br /> <span style="font-weight: bold;">Teknik Mereduksi Noise</span><br /> Kami mengembangkan teknik mereduksi noise berdasarkan asumsi bahwa spektrum noise muncul secara acak. Dua sinyal yang mirip (dari sumber yang sama) yang direkam pada saat yang berbeda, tiap sinyal ditransformasi ke domain frekuensi menggunakan Fast Fourier ransform (FFT). Kedua spektrum hasil kemudian dikalikan komponen-per-komponen sehingga komponen spektrum yang muncul pada satu spektrum tapi tidak pada spektrum yang lain -- yaitu noise -- akan direduksi secarad dramatis. Metode ini kami sebut perkalian sendiri (<span style="font-style: italic;">self multiplication</span>). Gambar 3.1 mengilustrasikan metode self multiplication dalam mereduksi spektrum noise.<br /> <img height="225" width="400" src="http://farm4.static.flickr.com/3280/2769007529_ee26427edf.jpg" alt="" /><br /> <br /> Perhatikan bahwa metode ini menjaga komponen yang muncul pada kedua spektrum. Sehingga jika komponen noise muncul pada kedua spektrum, metode ini tidak bisa mereduksi noise tersebut.<br /> [perhatikan bahwa noise yang kami reduksi ialah noise multi frekuensi, bukan noise single frekuensi]<br /> <br /> <span style="font-weight: bold;">Implementasi System</span><br /> [bagian ini hanya diambil sebagaian saja, <span style="font-style: italic;">on request</span> <img src="/tpmod/FCKeditor/editor/images/smiley/msn/regular_smile.gif" alt="" />]<br /> Hardware untuk pengenalan suara meliputi unit komputer (dengan soundcard), microphone, dan sirkuit pengontrol motor berbasis mikrokontroller AT89S2051 yang terhubung ke PC melalui serial link.<br /> Data base sample suara menggunakan suara dari 4 orang.<br /> Berikut tampilan window di PC ketika berhasil mengenali suara.<br /> <img height="378" width="400" src="http://farm4.static.flickr.com/3267/2769856124_217d42234a.jpg" alt="" /><br /> <br /> Jaringan syaraf tiruan kami menggunakan 12 spektrum suara dari 4 orang sebagai referensi belajar. Training untuk 100 epoch dengan laju belajar 0.75, faktor momentum 0.75 dan kemiringan fungsi logistik 0.01 menghasilkan error global 0.065.<br /> <br /> <span style="font-weight: bold;">Ringkasan</span><br /> Spektrum noise dapat dieliminasi menggunakan metode self miltiplication dengan beberapa keterbatasan. Metode ini membagi dua sinyal input (dalam domain waktu), mentransformasi tiap sinyal ke domain frekuensi, dan mengalikan kedua sinyal konponen-per-komponen.<br /> Dalam online test (real case test), jaringan syaraf tiruan kami hanya berhasil mengenali satu dari empat orang secara baik (kepercayaan > 80%) berdasarkan spektrum suara, sisanya hanya dikenali dengan persentasi kepercayaan < 80%.<br /> <br /> <span style="font-weight: bold;">Referensi</span><br /> [1] <meta content="text/html; charset=utf-8" http-equiv="CONTENT-TYPE" /> <title></title> <meta content="OpenOffice.org 2.4 (Win32)" name="GENERATOR" /><style type="text/css"> <!-- @page { size: 8.27in 11.69in; margin: 0.79in } P { margin-bottom: 0.08in } --> </style> <p style="margin-left: 0.25in; text-indent: -0.25in; margin-bottom: 0in;"> <font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">Discovery Channel. </span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB"><em>2057: The City</em></span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">. (a documentary movie)</span></font></font></font></p> <br /> [2] <meta content="text/html; charset=utf-8" http-equiv="CONTENT-TYPE" /> <title></title> <meta content="OpenOffice.org 2.4 (Win32)" name="GENERATOR" /><style type="text/css"> <!-- @page { size: 8.27in 11.69in; margin: 0.79in } P { margin-bottom: 0.08in } A:link { color: #0000ff } --> </style> <p style="margin-left: 0.25in; text-indent: -0.25in; margin-bottom: 0in;"> <font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB"><em>Forming the Vowel Sounds</em></span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">. Available at: </span></font></font></font><font color="#0000ff"><u><a href="http://hyperphysics.phy-astr.gsu.edu/hbase/music/vowel.html"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">http://hyperphysics.phy-astr.gsu.edu/hbase/music/vowel.html</span></font></font></a></u></font></p> <br /> [3] <meta content="text/html; charset=utf-8" http-equiv="CONTENT-TYPE" /> <title></title> <meta content="OpenOffice.org 2.4 (Win32)" name="GENERATOR" /><style type="text/css"> <!-- @page { size: 8.27in 11.69in; margin: 0.79in } P { margin-bottom: 0.08in } --> </style> <p style="margin-left: 0.25in; text-indent: -0.25in; margin-bottom: 0in;"> <font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">Anil K. Jain (Michigan State Univ.), Jianchang Mao and K. M. Mohiuddin (IBM Almaden Research Center). </span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB"><em>Artificial Neural Networks: A Tutorial</em></span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">. Pp. 39, March 1996.</span></font></font></font></p> <br /> [4] <meta content="text/html; charset=utf-8" http-equiv="CONTENT-TYPE" /> <title></title> <meta content="OpenOffice.org 2.4 (Win32)" name="GENERATOR" /><style type="text/css"> <!-- @page { size: 8.27in 11.69in; margin: 0.79in } P { margin-bottom: 0.08in } A:link { color: #0000ff } --> </style> <p style="margin-left: 0.25in; text-indent: -0.25in; margin-bottom: 0in;"> <font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB"><em>Backpropagation</em></span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">. Available at: </span></font></font></font><font color="#0000ff"><u><a href="http://en.wikipedia.org/wiki/Backpropagation"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">http://en.wikipedia.org/wiki/Backpropagation</span></font></font></a></u></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">. Last modified: 24 June 2007.</span></font></font></font></p> <br /> [5] <meta content="text/html; charset=utf-8" http-equiv="CONTENT-TYPE" /> <title></title> <meta content="OpenOffice.org 2.4 (Win32)" name="GENERATOR" /><style type="text/css"> <!-- @page { size: 8.27in 11.69in; margin: 0.79in } P { margin-bottom: 0.08in } --> </style> <p style="margin-left: 0.25in; text-indent: -0.25in; margin-bottom: 0in;"> <font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">Ben Kr</span></font></font></font><font color="#000000"><font size="1" style="font-size: 8pt;"><span lang="en-GB">รถ</span></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">se (Fac. of Math. And Comp. Sci., Univ. of Amsterdam), Patrick van der Smagt (Inst. of Robotics and Sys. Dynamics, German Aerospace Research Establish). </span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB"><em>An Introduction to Neural Networks, 8</em></span></font></font></font><font color="#000000"><sup><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB"><em>th</em></span></font></font></sup></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB"><em> Ed</em></span></font></font></font><font color="#000000"><font face="HAMECN+TimesNewRoman, Times New Roman, serif"><font size="1" style="font-size: 8pt;"><span lang="en-GB">. Pp. 37, November 1996.</span></font></font></font></p> <br />

Share on Facebook!Share on Twitter!Reddit

Comments: 6 *

1) Re: Pengenalan Suara Berbasis Neural Network dengan Algoritma Momentum Back Propagation
Comment by anehBgt pada November 06, 2008, 12:01:38 AM

kira - kita bahasa pemograman apa yah yg cocok???
2) Re: Pengenalan Suara Berbasis Neural Network dengan Algoritma Momentum Back Propagation
Comment by obenk pada Maret 04, 2009, 06:41:14 PM

wah hebat donk kita bisa kenal suara orang dengan teknologi ini,,kira2 pake basis data apa?
3) Re: Pengenalan Suara Berbasis Neural Network dengan Algoritma Momentum Back Propagation
Comment by wa_u12 pada Maret 28, 2009, 04:47:07 PM

Mas, saya mau tanya: Apakah Neural Network bisa diterapkan pada Rekonfigurasi Jaringan Distribusi untuk mengurangi rugi daya listrik? Kalau bsa caranya bagaimana? ([email protected])
4) Re: Pengenalan Suara Berbasis Neural Network dengan Algoritma Momentum Back Propagation
Comment by cartiman pada Mei 05, 2009, 01:32:27 PM

4 orang itu umurnya sama apa beda ?
Umur juga mempengaruhi suara.
5) Re: Pengenalan Suara Berbasis Neural Network dengan Algoritma Momentum Back Propagation
Comment by endangsuwandi pada November 23, 2009, 01:48:22 PM

Saya juga baru belajar Jaringan syaraf tiruan, yang menjadi pertanyaan saya dapatkah sistem ini diimplementasikan pada mikrokontroler saja tanpa perlu PC?
6) Re: Pengenalan Suara Berbasis Neural Network dengan Algoritma Momentum Back Propagation
Comment by diki achmad pada Februari 23, 2010, 09:49:46 AM

kk sekalian mw nanya kalau JST nya d ganti dengan TDNN(time delay neural network) gmn apakah akurasi
ketepatan suaranya lebih tinggi atau lebih rendah dari metode backprogation?
You don't have permission to comment, or comments have been turned off for this article.

Articles dalam « Teknologi »