Data size sufficiency analyses of haplotype inference algortihms
Cleary, Sean
St. John, Katherine
Centre de Recerca Matemàtica

Publicación: Centre de Recerca Matemàtica 2007
Descripción: 18 p.
Resumen: We present experimental and theoretical analyses of data requirements for haplotype inference algorithms. Our experiments include a broad range of problem sizes under two standard models of tree distribution and were designed to yield statistically robust results despite the size of the sample space. Our results validate Gusfield's conjecture that a population size of n log n is required to give (with high probability) sufficient information to deduce the n haplotypes and their complete evolutionary history. The experimental results inspired our experimental finding with theoretical bounds on the population size. We also analyze the population size required to deduce some fixed fraction of the evolutionary history of a set of n haplotypes and establish linear bounds on the required sample size. These linear bounds are also shown theoretically.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Anglès
Colección: Centre de Recerca Matemàtica. Prepublicacions
Colección: Prepublicacions del Centre de Recerca Matemàtica ; 757
Documento: Article ; Prepublicació ; Versió de l'autor
Materia: Gens ; Mapatge ; Filogènia ; Processament de dades ; Inferència



18 p, 200.4 KB

El registro aparece en las colecciones:
Documentos de investigación > Prepublicacions

 Registro creado el 2009-07-13, última modificación el 2024-05-26



   Favorit i Compartir