Neural Networks

Documente similare
Laborator 6 - Statistică inferenţială I. Inferenţă asupra mediei - Testul Z pentru media unei populaţii cu dispersia cunoscută Se consideră o populaţi

ALGORITMICĂ. Seminar 3: Analiza eficienţei algoritmilor - estimarea timpului de execuţie şi notaţii asimptotice. Problema 1 (L) Să se determine număru

Limbaje de Programare Curs 6 – Functii de intrare-iesire

Subiectul 1

E_d_Informatica_sp_SN_2014_bar_10_LRO

PowerPoint Presentation

Matematici aplicate științelor biologie Lab05 MV

Logică și structuri discrete Limbaje regulate și automate Marius Minea marius/curs/lsd/ 24 noiembrie 2014

Modelarea si Simularea Sistemelor de Calcul

FIŞA DISCIPLINEI 1. Date despre program 1.1 Instituţia de învăţământ superior Universitatea de Vest din Timișoara 1.2 Facultatea Matematică și Informa

OPERATII DE PRELUCRAREA IMAGINILOR 1

Microsoft Word - TIC5

E_d_Informatica_sp_MI_2015_bar_02_LRO

Matematici aplicate științelor biologie Lab06 MV

Laborator 3

Microsoft Word _POO_Lab_1_Modificari_v01.htm

Laborator 2: Instrucţiuni Java şi lucru cu şiruri de caractere Întocmit de: Adina Neculai Îndrumător: Asist. Drd. Gabriel Danciu 18 octombrie 2011

Diapositive 1

Laborator 1-Teoria probabilitatilor si statistica matematica Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 1 P

Microsoft Word - Algoritmi genetici.docx

Microsoft Word - cap1p4.doc

GHERCĂ MAGDA CASA CORPULUI DIDACTIC BRĂILA PORTOFOLIU EVALUARE INFORMATICĂ ȘI TIC PENTRU GIMNAZIU CLASA A V-A Neamț SERIA 1 GRUPA 1 CURSANT: GHERCĂ G

CASA CORPULUI DIDACTIC BRAILA PROGRAM DE FORMARE INFORMATICA SI TIC PENTRU GIMNAZIU CLASA A V-A SERIA 1 GRUPA 2 CURSANT: TIMOFTI V. AFRODITA COLEGIUL

Laborator 10 Lect. dr. Daniel N.Pop Departamentul de Calculatoare-Inginerie electrică 17.dec

ALGORITMII ŞI REPREZENTAREA LOR Noţiunea de algoritm Noţiunea de algoritm este foarte veche. Ea a fost introdusă în secolele VIII-IX de către Abu Ja f

rrs_12_2012.indd

1. Găsiți k numerele cele mai apropiate într-un şir nesortat Dându-se un şir nesortat și două numere x și k, găsiți k cele mai apropiate valori de x.

Secţiunea 9-10 avansaţi Concurs online de informatică Categoria PROGRAMARE PROBLEMA 1 TEXT 100 puncte Un text este format din una sau mai multe propoz

Laborator 9- Estimarea parametrilor Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 29.nov

Logică și structuri discrete Logică propozițională Marius Minea marius/curs/lsd/ 3 noiembrie 2014

Nr. 932 din Avizat ISJ Vâlcea, Inspector școlar informatică, Ciochină Luisa EXAMEN DE ATESTARE A COMPETENȚELOR PROFESIONALE A ABSOLVENȚILOR

Secţiunea 5-6 începători Concurs online de informatică Categoria PROGRAMARE PROBLEMA puncte PERIODIC Se citește un număr natural nenul N. Se ump

PHP (II)

Calcul Numeric

Microsoft Word - CarteC.doc

Limbaje de Programare Curs 8 – Fisiere

Logică și structuri discrete Relații. Funcții parțiale Marius Minea marius/curs/lsd/ 20 octombrie 2014

1. Operatii cu matrici 1 Cerinte: Sa se realizeze functii pentru operatii cu matrici patratice (de dimensiune maxima 10x10). Operatiile cerute sunt: A

Inferenţa statistică

Microsoft Word - 2 Filtre neliniare.doc

Paradigme de programare

Laborator 3 - Simulare. Metode de tip Monte Carlo. I. Estimarea ariilor şi a volumelor RStudio. Nu uitaţi să va setaţi directorul de lucru: Session Se

Laborator 11 Lect. dr. Daniel N.Pop Departamentul de Calculatoare-Inginerie electrică 7.ian

Curs 3 Permutari cu repetitie. Combinari. Algoritmi de ordonare si generare

Lucrarea 7 Filtrarea imaginilor BREVIAR TEORETIC Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, principalul scop al acesteia fi

Microsoft PowerPoint - Curs_SDA_9_RO_2019_v2.pptx

Cuantizare Vectoriala.doc

Slide 1

Concurs online de informatică Categoria PROGRAMARE Secţiunea 5-6 avansaţi PROBLEMA puncte DANS De 1 Iunie - Ziua Copilului se organizează un spe

Laborator 8- Statistica Descriptiva Sef lucrari dr.mat. Daniel N.Pop Departamentul de calculatoare si inginerie electrica 22.nov

Microsoft PowerPoint - curs5-DPT-2010V97 [Compatibility Mode]

Managementul Resurselor Umane

ALGORITHMICS

Preprocesorul C Funcţii cu numǎr variabil de argumente 6 decembrie 2005 Programarea calculatoarelor 2. Curs 10 Marius Minea

Matrici și vectori în VBA În VBA, o matrice este un grup de variabile de același tip. De ce ar trebui să utilizați o matrice? Presupunem că ați vrut s

Probleme proiect TP BITPERM Implementați un algoritm care citește de la intrarea standard două numere naturale și scrie la ieșirea standard da

Microsoft Word - lab1_2007.doc

I. Partea introductivă Proiectul unității de învățare CONCEPTUL DE MATRICE ŞCOALA: Colegiul Național Petru Rareș Suceava CLASA: a XI a- matematică / a

Fâciu N. Maria-Ema CASA CORPULUI DIDACTIC BRĂILA PROGRAM DE FORMARE INFORMATICĂ ȘI TIC PENTRU GIMNAZIU CLASA A V-A SERIA 1 GRUPA 2 CURSANT: Fâciu N. M

Programarea şi utilizarea calculatoarelor

Lecții de pregă,re la informa,că Admitere 2019 Tema: Discutarea problemelor date la ul,mele sesiuni de admitere Bogdan Alexe

Aggregating Data

Microsoft Word - matem_aplicate in Economie aa FD Bala.doc

..MINISTERUL EDUCAŢIEI NAȚIONALE ŞI CERCETARII STIINTIFICE UNIVERSITATEA DE VEST DIN TIMIȘOARA.I CENTRUL DE DEZVOLTARE ACADEMICĂ. FIȘA DISCIPLINEI 1.

CURBE BÉZIER În CAGD se utilizează adesea curbele polinomiale, adică acele curbe definite de o parametrizare polinomială: C : [a, b] R 3 C(t) = (x(t),

ALGORITHMICS

Tablouri unidimensionale Problema 1 Să se determine mulţimea cifrelor unui număr natural n > 0, dat. Exemplu: n= Cifre = {1,2,3,7} Se cere să s

D.Rusu, Teoria măsurii şi integrala Lebesgue 6 MĂSURA LEBESGUE Cursul 5 Teorema 6.26 Există submulţimi ale lui R care nu sunt măsurabile Lebesgue. Dem

Limbaje de Programare Curs 5 – Siruri de caractere

Calcul Numeric

Microsoft Word - Curs_08.doc

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

proiectarea bazelor de date

LUCRAREA 8 PROGRAMAREA NELINIARĂ ÎN REZOLVAREA PROBLEMELOR DIN ENERGETICĂ. METODE DE ORDINUL Aspecte generale Programarea neliniară are o foart

DOMENIUL: Matematica

CL2009R0976RO bi_cp 1..1

INDICATORI AI REPARTIŢIEI DE FRECVENŢĂ

Noțiuni de bază ale criptografiei

PowerPoint Presentation

Aproximarea functiilor prin metoda celor mai mici patrate

SECURITATE ȘI CRIPTOGRAFIE

PPSD

Procesarea Imaginilor - Laborator 1: Introducere în utilizarea bibliotecii OpenCV 1 1. Introducere în utilizarea bibliotecii OpenCV 1.1. Introducere S

SUBPROGRAME

Microsoft Word - Curs_10.doc

PowerPoint Presentation

Metode de sortare - pregătire admitere - Conf.dr. Alexandru Popa Lect. dr. Andrei Pătraşcu Universitatea din Bucureşti 1

Microsoft Word - _Curs II_2_Mar17_2016out.doc

Introducere în statistică

1

Limbaje de programare Pointeri. Alocare dinamică (continuare) 26 noiembrie 2012

Microsoft PowerPoint - ImplementareLimbaj [Read-Only] [Compatibility Mode]

Microsoft Word - CarteC.doc

Curs 8: Tehnica divizării (I) Algoritmi si structuri de date - Curs 8 1

Analiza Bayesiana - Fundamente Teoretice si Exemple

Proiect GSN-08 Ghid de securitate nucleară privind repornirea instalaţiilor nucleare după opririle neplanificate CAPITOLUL I Domeniu, scop, definiţii

Microsoft PowerPoint - ESTIMARE-II-2

Microsoft PowerPoint - ARI_R_c9-10_IP_part2 [Compatibility Mode]

Transcriere:

Biostatistică și Bioinformatică. Lab 2: Prelucrări statistice asupra secvențelor de nucleotide/ aminoacizi. Teste statistice. 1. Pachete R pentru bioinformatică Bioconductor (www.bioconductor.org) SeqinR (http://pbil.univ-lyon1.fr/software/seqinr/home.php?lang=eng ) Pachetele Bioconductor si SeqinR conțin funcții care permit efectuarea unor prelucrări standard asupra secvenţelor biologice (citire fișiere în formate specifice, analize statistice, aliniere, analiza datelor referitoare la expresia genică etc). Pentru utilizarea unui pachet R acesta trebuie instalat și încărcat: Instalarea unui pachet R: Packages -> Install Packages (se selectează site-ul de unde se descarcă și ulterior pachetul care trebuie instalat) Incărcarea unui pachet R: Packages -> Load Package (se selectează pachetul) sau direct cu comanda library( nume pachet ) (Ex: library( seqinr ) ) Obs: pachetul SeqinR poate fi incărcat folosind procedura anterioară însă pentru încărcarea setului de pachete Bioconductor este necesară parcurgerea unei proceduri diferite: >source("http://bioconductor.org/bioclite.r") >bioclite() # asigura incarcarea unui subset de pachete de baza Pentru instalarea ulterioară a unui pachet din Bioconductor (de exemplu, Biostrings care conține funcții de prelucrare a secvențelor) se folosește comanda bioclite( nume pachet ). De exemplu prin >bioclite( Biostrings ) se instalează pachetul Biostrings. Utilizarea pachetului necesită și încărcarea prin library( Biostrings ) sau prin Packages->Load package Obs. Există numeroase pachete R pentru bioinformatică dedicate unor prelucrări specifice dar care conțin și funcții cu caracter general. Un astfel de exemplu este pachetul ape (http://apepackage.ird.fr/) proiectat pentru analiza filogenetică însă care conține și funcții simple pentru accesarea secvențelor din GenBank. De exemplu, după încărcarea pachetului ape (library(ape)) prin read.genbank(c(identificator),as.character=true) se returnează secvența sub forma unui vector de caractere. 2. Analiza statistică simplă a unei secvențe de nucleotide In secvențele ADN porțiunile care codifică gene diferă de porțiunile intergenice prin distribuția diferitelor tipuri de nucleotide. Astfel, secvențe cu procent mare de nucleotide A sau T corespund de regulă porțiunilor intergenice (introni) pe când secvențe cu procent mare de nucleotide C sau G indică posibila prezență a genelor. Pentru a determina frecvențele de apariție a diferitelor tipuri

de nucleotide respectiv a diferitelor tipuri de dimeri (perechi de nucleotide diferite) se pot parcurge următoarele etape: Preluarea secvenței dintr-un fișier și stocarea într-un vector de caractere Calculul frecvențelor de apariție a fiecărui tip de nucleotidă Construirea vectorului de dimeri corespunzători secvenței Calculul frecvențelor de apariție a fiecărui tip de dimer Folosind pachetul SeqinR toate aceste prelucrări pot fi realizate foarte simplu: date=read.fasta("s1.fa") # se presupune ca fisierul se afla in folderul MyDocuments (Obs: dacă e în alt folder trebuie specificată calea completă sau se setează directorul de lucru prin File->ChangeDir) secv=date[[1]] # preluarea secventei de nucleotide frecvadn=table(secv) # construirea tabelului de frecvente # (funcția table este cea standard din R) frecvdimeri=count(secv,2) # determinarea frecventelor dimerilor (Obs: functia count este din SeqinR și permite determinarea frecvențelor de apariție ale cuvintelor cu lungimea specificată în al doilea parametru al funcției 3. Conversia unei secvențe de nucleotide într-o secvență de aminoacizi Corespondența dintre un triplet de nucleotide și un aminoacid este descrisă de codul genetic. Pachetul Biostrings din Bioconductor conține o structură numită GENETIC_CODE care asigură maparea corespunzătoare dintre triplete de nucleotide (specificate ca șiruri de 3 caractere) și simboluri corespunzătoare aminoacizilor. Un exemplu de prelucrare care realizează această conversie (folosind pachetul Biostrings dar fără a folosi funcțiile din pachetul SeqinR) este: # conversie secventa nucleotide in secventa de aminoacizi fp=file("s1.fa",open="r") # deschidere în citire a unui fisier text linii=readlines(fp) # citirea linie cu linie a unui fisier text secv=linii[2] # concatenarea liniilor intr-un singur sir for(i in 3:length(linii)-1) secv=paste(secv,linii[i],sep="") # fragmentarea sirului intr-un vector de subsiruri ce contin triplete de nucleotide rez=substring(secv, seq(1, width(secv)-2, 3),seq(3,width(secv),3)) # conversia tripletelor de nucleotide folosind codul genetic si concatenarea secvaa=paste(genetic_code[rez]) 4. Distribuții de probabilitate in R In R sunt implementate principalele tipuri de repartiții utilizate în biostatistică: Binomială. Identificator: binom; Parametri: n (nr repetari), p (probabilitate de success) Normală. Identificator: norm; Parametri: m (media), s (abaterea standard) Chi-pătrat. Identificator: chisq; Parametri: df (număr de grade de libertate)

Fisher. Identificator: f; Parametri: df1 (număr de grade de libertate numărător), df2 (număr de grade de libertate numitor) Student. Identificator: t; Parametri: df (număr de grade de libertate) Pentru fiecare dintre aceste distribuții sunt implementate funcții pentru: Calculul densității de probabilitate: o d<identificator>(x,<lista param>) returnează valoarea probabilității ca variabila aleatoare să aibă valoarea x (P(X=x)) sau valoarea corespunzătoare a funcției de densitate de probabilitate (în cazul variabilelor aleatoare continue) o Exemplu: dbinom(11,30,0.25) sau dnorm(1.6,0,1) Calculul funcției de repartiție: o p<identificator>(x,<lista param>) returnează valoarea probabilității ca variabila aleatoare să aibă cel mult valoarea x (P(X<=x)) sau valoarea corespunzătoare a funcției de reparție o Exemplu: pbinom(11,30,0.25) sau pnorm(1.68,0,1) Calculul cuantilelor (sau valorilor critice): o q<identificator>(alfa,<lista param>) returnează valoarea x care P(X<=x)=alfa o Exemplu: qbinom(0.95,30,0.25) sau qnorm(0.95,0,1) o Obs: aceste funcții pot fi utilizate pentru determinarea valorilor critice Generarea de valori aleatoare în conformitate cu o anumită distribuție: o r<identificator>(nr,<lista param>) returnează nr valori aleatoare generate în concordanță cu distribuția corespunzătoare o Exemple: runif(10,min=0,max=1) generează 10 valori uniform distribuite în intervalul [0,1) rnorm(100,0,1) generează 100 de valori având distribuția normală standard Exercitiul 1. a) Să se descarce din GenBank secvența ADN având identificatorul AF012130 (o secventa care intervine în controlul sintezei de insulină) și să se determine frecvența de apariție a nucleotidelor și a dimerilor. Indicație: După conectarea la http://www.ncbi.nlm.nih.gov se specifică identificatorul și din pagina cu rezultate se selectează Nucleotide: DNA and RNA sequences după care se salvează secvența în format Fasta folosind Send. b) Să se genereze o secvență aleatoare având aceeași dimensiune cu secvența anterioară, să se determine aceleași frecvențe și să se compare cu rezultatele anterioare. Indicatie: pentru generarea unei secvențe aleatoare conținând L nucleotide (șir aleator peste alfabetul {a,c,g,t}) se poate proceda în felul următor: Se generează L valori aleatoare uniform distribuite în mulțimea {1,2,3,4}

Exemplu (pentru L=100): >date=as.integer(runif(100,min=1,max=5)) # runif simulează o variabilă aleatoare cu repartitia uniforma Valorile generate la pasul anterior vor fi folosite ca indici în alfabetul corespunzător nucleotidelor (reprezentat ca un vector cu 4 elemente de tip caracter) >alfabet=c( a, c, g, t ) >randadn=alfabet[date] 5.Analiza varianței (ANOVA Analysis Of Variance) Considerăm următoarea problemă: se cunosc valori ale capacității respiratorii ale unor persoane grupate în următoarele categorii: Categoria (nr categorii=k) Volum Medie Abatere standard eșantion (n) Nefumător 200 3.17 0.74 Fumător pasiv 200 2.72 0.71 Fumător (nr mic de țigări) 200 2.63 0.73 Fumător (nr mediu de țigări) 200 2.29 0.70 Fumător (nr mare de țigări) 200 2.12 0.72 Se poate afirma pe baza acestor date că există diferențe semnificative între capacitățile pulmonare ale celor 5 categorii de persoane? Etapele care trebuie parcurse sunt: a) Se stabilește H 0 : nu există diferențe semnificative între cele 5 categorii b) Se calculează varianța medie, Var(intra), din cadrul fiecărei categorii (media valorilor de pe ultima coloană) c) Se calculează variația între categorii, Var(inter), - varianța corespunzătoare valorilor medii de pe coloana a treia d) Se calculează statistica F=Var(inter)/Var(intra) e) Se determină valoarea critică corespunzătoare repartiției Fisher(k-1,n-k) și nivelului de semnificație dorit (in R se specifică qf(1-alpha,k-1,n-k) f) Dacă valoarea statisticii depășește valoarea critică atunci ipoteza nulă se respinge Exercitiu 2. Să se implementeze in R procedura de mai sus si sa se aplice datelor din tabel. Indicație. Un exemplu de implementare este: anova=function(medii,stdev,n,alpha) {k=length(medii) varintra=mean(stdev^2) medieglobala=mean(medii) varinter=sum((medii-medieglobala)^2) return(list("statistica",varinter/varintra,"valoarecritica",qf(1-alpha,df1=k-1,df2=n-k))) } medii=c(3.17,2.72,2.63,2.29,2.12)

stdev=c(0.74,0.71,0.73,0.70,0.72) rez=anova(medii,stdev,200,0.05) Obs: Dacă se cunoaște tabelul de date atunci se poate utiliza direct funcția aov pentru analiza varianței (vezi exemplul din fișierul migraineanova.r) 6. Verificarea unei ipoteze statistice referitoare la distribuția nucleotidelor într-o secvență ADN. Considerăm următoarea problemă: fiind dată o secvență de nucleotide să se stabilească dacă secvența este generată aleator sau nu (distribuția nucleotidelor este uniformă). Problema este echivalentă cu cea a verificării concordanței dintre distribuția secvenței analizate și distribuția uniformă. Ipoteza nulă este: distribuția secvenței coincide cu distribuția uniformă sau secvența este aleatoare. In acest scop se poate folosi testul de concordanță chi-pătrat. Etapele care trebuie parcurse sunt: a) se determină frecvența de apariție a fiecărei nucleotide (se folosește table sau count din SeqinR) și se construiește vectorul cu frecvențe absolute [f A f C f G f T ] b) se calculează statistica: S=(f A -n*e A ) 2 / (n*e A )+ (f C -n*e C ) 2 / (n*e C )+ (f G -n*e G ) 2 / (n*e G )+ (f T -n*e T ) 2 / (n*e T ) unde n reprezintă lungimea secvenței iar e A =e C =e G =e T =0.25 reprezintă probabilitățile corespunzătoare unei distribuții uniforme. c) se calculează valoarea critică a repartiției chi-pătrat pentru 3 grade de libertate și nivelul de semnificație 0.05 (se poate folosi qchisq(0.95,3)) d) dacă valoarea S este mai mare decăt valoarea critică determinată la pasul c) atunci ipoteza nulă (secvența este generată uniform aleator) se respinge, adică nu se poate considera că secvența este generată aleator. Exercițiul 3: 1. Să se verifice ipoteza de uniformitate pentru o secvență încărcată din GenBank (de exemplu secvența cu identificatorul AF012130.1 ) 2. Să se verifice ipoteza de uniformitate în cazul unei secvențe de aceeași lungime dar generată aleator (folosind varianta de la exercițiul 1). Indicație. Un exemplu simplu de implementare a testului este: testuniform=function(secv, nivelsemnificatie) {f=table(secv) n=length(secv) stat=((f[["a"]]-n/4)^2+(f[["c"]]-n/4)^2+(f[["g"]]-n/4)^2+(f[["t"]]-n/4)^2)/(n/4) if (stat>qchisq(1-nivelsemnificatie,3)) {return("se respinge ipoteza ca repartitia nucleotidelor este uniforma")} else {return("nu se respinge ipoteza ca repartitia nucleotidelor este uniforma")} }

Obs. In R testul chi-pătrat pentru verificarea uniformității poate fi aplicat simplu folosind: chisq.test(secventa,p=c(0.25,0.25,0.25,0.25)). Funcția returnează p-valoarea corespunzătoare testului (dacă p-valoarea este mai mica decât nivelul de semnificație al testului atunci ipoteza nulă este respinsă). Dacă se dorește verificarea ipotezei privind concordanța cu o altă distribuție discrete (nu neapărat uniformă) atunci se poate folosi chisq.test(secventa,p=vector_probabilitati). 7. Verificarea ipotezei de independență a nucleotidelor succesive. Se pune problema să se verifice dacă se poate accepta ipoteza că nucleotidele succesive dintr-o secvență ADN sunt independente. In acest scop se folosește testul chi-pătrat pentru verificarea independenței. Etapele care trebuie parcurse la aplicarea testului sunt: a) se determină tabelul frecvențelor (tabelul de contingență) corespunzătoare perechilor de nucleotide aflate pe poziții consecutive (pozițiile (i,i+1)): Pozitia i Pozitia i+1 A C G T A Y 11 Y 12 Y 13 Y 14 Y 1* C Y 21 Y 22 Y 23 Y 24 Y 2* G Y 31 Y 32 Y 33 Y 34 Y 3* T Y 41 Y 42 Y 43 Y 44 Y 4* Y *1 Y *2 Y *3 Y *4 Y T De exemplu Y 11 reprezintă numărul situațiilor în care sunt două nucleotide de tip A consecutive, Y 24 reprezintă numărul cazurilor în care o nucleotidă de tip C este urmată de o nucleotidă de tip T. Y i* reprezintă suma elementelor de pe linia i iar Y *j reprezintă suma elementelor de pe coloana j. Y este suma tuturor frecvențelor din tabel. Pentru determinarea frecvențelor Y ij se poate folosi count(secv,2). Pe baza valorilor returnate de această funcție se construiește matricea de mai sus. b) se calculează statistica 4 4 = ( Y ij Eij ) E i= 1 j= 1 ij 2 Yi* Y* j Eij = Y c) se determină valoarea critică a repartiției chi-pătrat pentru 9=(4-1)*(4-1) grade de libertate și nivelul de semnificație 0.05 (se folosește qchisq(0.95,9)) d) dacă statistica T este mai mare decât valoarea critică atunci ipoteza nulă (faptul ca nucleotidele succesive sunt independente) este respinsă. Exercitiul 4: Să se implementeze procedura de verificare descrisă mai sus și să se verifice ipoteza de independență atât în cazul unei secvențe încărcate din GenBank (de exemplu secvența AF012130) cât și în cazul unei secvențe generate aleator. Indicație. Vezi exemplul din fisierul testindependenta.r

Tema. Implementați în R o funcție care permite aplicarea testului semnelor (detalii în slide-uri Curs3) pentru a analiza efectul unui tratament pe baza unor măsurători efectuate înainte și după aplicarea tratamentului asupra unui set de pacienți. Date de intrare: doi vectori de aceeași dimensiune conținând valorile măsurătorilor nivelul de semnificație al testului Date de iesire: valoarea statisticii corespunzătoare testului semnelor decizia (se respinge sau nu ipoteza că tratamentul nu are efect) Exemplu date de test: V1=[2 0 0 0 2 3 3 3 0 2 1 1 0 0 3 0 0] V2=[2 0 3 1 5 2 2 10 0 4 1 4 0 0 4 1 4] Cele două seturi de date reprezintă valoarea unui parametru înainte de aplicarea unui tratament (V1) respectiv după aplicarea tratamentului (V2). Scopul urmărit este să se decidă dacă diferențele dintre cele două seturi sunt semnificative sau nu (pentru nivelul de semnificație egal cu 0.05).