Vedi traduzione automatica
Questa è una traduzione automatica. Per vedere il testo originale in inglese cliccare qui
#News
{{{sourceTextContent.title}}}
Microarray e bioinformatica
{{{sourceTextContent.subTitle}}}
«Un microarray» è uno scorrevole del laboratorio fatto di vetro di cui la superficie è fornita di migliaia di piccoli pori nelle posizioni definite. Funziona nell'ambito del principio di ibridazione dei fili complementari di DNA e ci permette di analizzare le espressioni dei geni multipli in una reazione in un efficace modo.
{{{sourceTextContent.description}}}
I dati hanno generato con la tecnologia di microarray sono riuniti e conservati in un computer per mezzo di un analizzatore di immagine. Poichè questi dati sono trovati nei grandi numeri, è difficile anche affinchè gli esperti statistici esegua l'analisi facendo uso dei metodi tradizionali. Il problema ha girato per essere altamente importante da ottenere indirizzato, particolarmente sfida sorgere dovuto la qualità e la normalizzazione dei dati redatti da questa tecnologia. Quindi, gli strumenti di bioinformatica sono inventati.
Bioinformatica
La bioinformatica è il campo interdisciplinare di scienza che è costituita dalla combinazione delle altre aree come biologia, matematica, l'informatica e le statistiche. Lo scopo di questa tecnologia è di mettere a punto i metodi per stoccaggio ed il recupero dei dati biologici complessi come pure della loro analisi.
Nell'analisi di microarray, questi strumenti dedicati eseguono l'analisi statistica, confronti del campione e l'interpretazione funzionale dei dati ha prodotto in un modo di serie dopo visualizzazione e normalizzazione. Oltre a questo, paragonando i dati di espressione genica alle informazioni biologiche già attuali, fornisce parecchi generi di scoperte compreso l'analisi della sede del legame di fattore di trascrizione, l'analisi di via e l'interazione della proteina-proteina dell'analisi di rete.
«Il Bioconductor» è uno degli strumenti importanti utilizzati nell'analisi di microarray. È un open source e un progetto di software aperto dello sviluppo basati sul linguaggio di programmazione della R.
Applicazione di bioinformatica nell'analisi di microarray:
I dati risultanti dalla tecnologia di microarray sono analizzati in un processo che comprende tre fasi:
Analisi primaria
Rappresentazione in scala e normalizzazione
Analisi approfondita
a) Analisi primaria: A questo punto, la qualità dei dati ottenuti da ogni matrice è verificata controllando se l'ibridazione, identificare, l'esame, ecc., sono fatti correttamente. Qui, tutti i dati inutili e di bassa qualità si eliminano.
b) Rappresentazione in scala e normalizzazione: Questi sono i due metodi che sono compresi nel regolamento dei dati raccolti da ciascuno allineano. Ciò è fatta per rendere il confronto efficiente e più facile.
la rappresentazione in scala di normalizzazione del Per-chip/normalizzazione del per-chip è un metodo in cui la fluorescenza globale di ogni matrice è regolato ad un'intensità media in modo che la luminosità di ogni campione si trasformi nella stessa.
la normalizzazione del Per-gene/normalizzazione è un processo in cui le fonti di variazioni che possono colpire i livelli misurati di espressione di gene sono rimosse. Ci sono molti metodi per normalizzazione, ma è difficile da decidere quale è il meglio.
c) L'analisi approfondita è il terzo punto nell'analizzare i dati di microarray. Sulla base della natura dell'esperimento, il dipendente delle prove sulle statistiche ed i filtri si applicano qui per categorizzare i geni di cui le espressioni sono modificate in vari campioni. L'analisi semplice è fatta per meno campioni mentre per tantissimi campioni, «raggruppamento più specializzato e la classificazione» è usata.
L'analisi più semplice: Il filtraggio è il metodo impiegato per analizzare i dati di meno campioni. «Il filtro sulle bandiere» e «il filtro sul cambiamento del popolare» sono i due approcci principali utilizzati nella filtrazione.
La bandiera è una misura qualitativa che è accompagnata dal punteggio crudo di espressione. Verifica le differenze statistiche dei geni dai precedenti e permette la filtrazione soltanto esattamente dei geni misurabili.
“Il filtro sul cambiamento del popolare” è un metodo di filtrazione di base fatto mediante il paragone del cambiamento del popolare. È usato per identificare i geni che sono almeno differente duplice nelle circostanze sperimentali.
Analisi avanzata: Il raggruppamento e la classificazione sono i metodi che possono essere usati per analizzare i dati estremamente complessi di microarray. Tuttavia, poichè i dati analizzati con questi metodi sono troppo grandi nella quantità, è migliore filtrare i dati in primo luogo e limitarlo secondo i bisogni.
Analisi per gruppi: Questo metodo che comprende tecniche sorvegliate/non supervisionate vario di raggruppamento dei disaccordi i geni nei gruppi differenti, particolarmente quando il campione consiste dei tipi differenti di geni. È una tecnica famosa usata per analizzare la matrice di dati di espressione genica
I tre metodi di raggruppamento comuni sono come segue:
Raggruppamento gerarchico: Una tecnica non supervisionata in cui i mazzi dei geni sono costruiti con gli approssimativamente stessi modelli dell'espressione raggruppando i geni insieme che notevolmente sono riferiti nelle misure di espressione. Tutti i geni sono rappresentati sotto forma di foglie su un albero di ramificazione nel dendrogram.
Raggruppamento di K-medie: Ciò è un algoritmo del data mining che è utilizzato nel raggruppamento dei dati nei gruppi senza informazioni preliminari sulle relazioni.
Mappe ad organizzazione autonoma (SOM): Un approccio di raggruppamento non gerarchico basato su rete neurale che funziona come il raggruppamento di K-medie.
Classificazione (previsione della classe/apprendimento sorvegliato/analisi discriminante): In questo metodo un gruppo di esempi preclassified sarà fornito. In confronto a quello, i classificatori troveranno una nuova regola, di modo che i nuovi campioni possono essere assegnati in c'è ne delle classi già date. Il numero di campione dovrebbe essere sufficiente per la formazione dell'algoritmo e verificarlo su un nuovo gruppo di campioni. I dati di espressione genica che sono normalizzati sono utilizzati come vettori dell'input per le regole di costruzione di classificazione.