Discovering Genomic Patterns Using Fuzzy Self Organizing Map

Chu , Ho Yi (2009) Discovering Genomic Patterns Using Fuzzy Self Organizing Map. Masters thesis, Universiti Sains Malaysia.

[img]
Preview
PDF
Download (1MB) | Preview

Abstract

Teknologi barisan-mikro telah membolehkan pengumpulan beribu-ribu data genetik pada masa yang sama. Masalah yang dihadapi oleh data barisan-mikro adalah bilangan ciri yang banyak tetapi bilangan sampel yang sedikit. Pengerumunan menjadi pilihan yang praktikal dalam menganalisa data begini kerana untuk mengkaji setiap satu data adalah tak praktis. Walapun terdapat berbilang jenis kaedah pengerumunan seperti “k-means” dan pengerumunan berpangkat, namun ini tidak mencukupi apabila menglibatkan set data yang sangat besar. Peta menyusun sendiri (SOM) adalah satu konsep yang diperkenalkan oleh Teuvo Kohonen yang membolehkan pengerumunan yang tidak diawasi dan penggambaran data. Penggambaran ini dilakukan dengan pemancaran data tersebut ke atas satu jaringan peta 2-dimensi sambil mengekalkan hubungan antara unit peta yang mewakili data tersebut. Lagipun, penggunaan satah komponen dalam SOM membolehkan analisis setiap ciri dan perhubungan antara ciri. Secara keseluruhan, pengerumunan dan penggambaran ini membolehkan analisis set data secara keseluruhan. Microarray technology has allowed for the collection of thousands of genetic data simultaneously. The problem with microarray data lies in the fact that while there are thousands of attributes, the number of samples is few. Clustering becomes a practical option in analysing such data as it is impractical to study every data individually. Although there are numerous clustering methods such as k-means and hierarchical clustering, it is insufficient when it comes to a massive scale dataset. Self-organising maps (SOM) is a concept introduced by Teuvo Kohonen that allowed for an unsupervised clustering and subsequent visualisation of data. This visualisation is by means of projecting the data onto a 2-dimensional map grid while retaining relations among map units that represent the data. Furthermore, the use of component planes in SOM allows for the analysis of individual attributes and correlation between attributes.

Item Type: Thesis (Masters)
Subjects: Q Science > QA Mathematics > QA1 Mathematics (General)
Divisions: Pusat Pengajian Sains Matematik (School of Mathematical Sciences) > Thesis
Depositing User: Mr Mohammad Harish Sabri
Date Deposited: 09 Aug 2018 07:49
Last Modified: 12 Apr 2019 05:27
URI: http://eprints.usm.my/id/eprint/41262

Actions (login required)

View Item View Item
Share