En poursuivant votre navigation sur ce site, vous acceptez l'utilisation d'un simple cookie d'identification. Aucune autre exploitation n'est faite de ce cookie. OK
1

Comptage et design multiple d'ARN

Bookmarks Report an error
Multi angle
Authors : Ponty, Yann (Author of the conference)
CIRM (Publisher )

Loading the player...

Abstract : Les Acides RiboNucléiques (ARN) sont des biopolymères linéaires omniprésents dans notre organisme, pouvant être codés comme des séquences sur un alphabet A,C,G,U. Ces molécules se replient sur elles-mêmes, établissant des liaisons hydrogènes d'où découlent l'appariement de certaines des positions, selon des règles de compatibilité des lettres n'autorisant que les paires dans l'ensemble A,U,C,G,G,U. De ce mécanisme d'appariements résulte l'adoption d'une ou plusieurs conformations, appelées structures secondaires, au passage bijectif avec les mots de Motzkin sans-pic. De nombreuses applications, en nanotechnologie, médecine, ou biostatistique, nécessitent de compter, ou encore engendrer aléatoirement, des séquences d'ARN simultanément compatibles avec un ensemble donné de structures secondaires. Un algorithme exponentiel, basé sur une décomposition (ear decomposition) du graphe de dépendance induit par l'union des paires, a ainsi été proposé par Höner zu Siederdissen et al [A]. Cet algorithme utilise la méthode récursive/programmation dynamique pour précalculer les nombres d'affectations compatibles avant/après chacun des choix locaux. Une phase de génération utilise ensuite ces nombres pour garantir l'uniformité de la génération. Cependant, cet algorithme ne permettait pas la prise en compte de critères énergétiques plus complexes, nécessitant l'utilisation d'un formalisme plus expressif que les graphes de dépendance (hypergraphes). De plus, la complexité de l'algorithme, théoriquement exponentielle sur un paramètre non-borné et parfois élevée en pratique, soulevait la question de la complexité du problème de comptage.
Dans un travail récent avec Hammer, Wang et Will [B], nous établissons la #P complétude, et la complexité d'approximation, du problème de comptage des séquences compatibles. Notre preuve repose sur une bijection simple entre les séquences compatibles et les stables du graphes de dépendance. Nous proposons une approche alternative, basée sur la décomposition arborescente, pour contrôler de façon probabiliste [C] l'énergie moyenne des séquences pour les différentes structures, ou la composition en les différentes lettres. Ces résultats fournissent un cadre flexible et expressif pour le design d'ARN, et soulèvent des questions sur l'utilisation de stratégies alternatives (génération de Boltzmann, simulation parfaite) pour la génération aléatoire, ainsi sur le concept d'analyse en moyenne dans un contexte où la donnée en entrée est plus complexe que la taille de l'objet engendré.

Keywords : random generation; Boltzmann sampling; context-free languages; multi-target RNA design; counting complexity

MSC Codes :
05A05 - Permutations, words, matrices
05B45 - Tessellation and tiling problems
60C05 - Combinatorial probability
68Q45 - Formal languages and automata
68R05 - Combinatorics in connection with computer science
90C27 - Combinatorial optimization
92D20 - Protein sequences, DNA sequences
68Q87 - Probability in computer science (algorithm analysis, random structures, phase transitions, etc.)
68W32 - Algorithms on strings

Additional resources :
https://www.cirm-math.fr/ProgWeebly/Renc1776/Ponty.pdf

    Information on the Video

    Film maker : Hennenfent, Guillaume
    Language : French
    Available date : 22/03/2018
    Conference Date : 15/03/2018
    Subseries : Research School
    arXiv category : Quantitative Biology ; Data Structures and Algorithms ; Combinatorics
    Mathematical Area(s) : Computer Science ; Combinatorics ; Probability & Statistics ; Mathematics in Science & Technology
    Format : MP4 (.mp4) - HD
    Video Time : 00:26:05
    Targeted Audience : Researchers ; Graduate Students
    Download : https://videos.cirm-math.fr/2018-03-15_Ponty.mp4

Information on the Event

Event Title : ALEA Days / Journées ALEA
Event Organizers : Busic, Ana ; Genitrini, Antoine ; Mairesse, Jean ; Martin, James
Dates : 12/03/2018 - 16/03/2018
Event Year : 2018
Event URL : https://conferences.cirm-math.fr/1776.html

Citation Data

DOI : 10.24350/CIRM.V.19374103
Cite this video as: Ponty, Yann (2018). Comptage et design multiple d'ARN. CIRM. Audiovisual resource. doi:10.24350/CIRM.V.19374103
URI : http://dx.doi.org/10.24350/CIRM.V.19374103

See Also

Bibliography

  • [A] Höner zu Siederdissen, C., Hammer, S., Abfalter, I., Hofacker, I.L., Flamm, C., & Stadler, P.F. (2013). Computational design of RNAs with complex energy landscapes. Biopolymers, 99(12), 1124-1136 - http://dx.doi.org/10.1002/bip.22337

  • [B] Hammer, S., Ponty, Y., Wang, W., & Will, S. (2018). Fixed-parameter tractable sampling for RNA design with multiple target structures. RECOMB 2018 – 22nd Annual International Conference on Research in Computational Molecular Biology, Apr 2018, Paris, France. - https://hal.inria.fr/hal-01631277

  • [C] Bodini, O., & Ponty, Y. (2010). Multi-dimensional Boltzmann sampling of languages. In
    M. Drmota, & B. Gittenberger (Eds.), Proceeding of the 21st international meeting on probabilistic, combinatorial, and asymptotic methods in the analysis of algorithms (pp.49-64). - https://hal.inria.fr/hal-00450763v4



Bookmarks Report an error